CLI ウィザード
OCR CLI ウィザードを使用すると、テストを実行せずに画像内で見つかるテキストを検証できます。必要なのは以下のとおりです。
- 依存関係として
@wdio/ocr-service
をインストールしていること (はじめに を参照) - 処理したい画像
次に、次のコマンドを実行してウィザードを開始します。
npx ocr-service
npx wdio ocr
これは、画像を選択し、高度なモードで haystack を使用するための手順を案内するウィザードを開始します。以下の質問が表示されます。
ファイルの指定方法を選択してください。
- 以下のオプションを選択できます。
- 「ファイルエクスプローラー」を使用する
ファイルパスを手動で入力する
「ファイルエクスプローラー」を使用する
CLI ウィザードには、システム上のファイルを検索するための「ファイルエクスプローラー」を使用するオプションが用意されています。コマンドを実行したフォルダから開始されます。画像を選択すると (方向キーと Enter キーを使用)、次の質問に進みます。
ファイルパスを手動で入力する
これは、ローカルマシン上のファイルへの直接パスです。
haystack を使用しますか?
- ここでは、処理する必要がある領域を選択するオプションがあります。これは、プロセスを高速化したり、OCR エンジンが見つける可能性のあるテキストの量を削減/絞り込んだりすることができます。以下の質問に基づいて、
x
、y
、width
、height
データを提供する必要があります。 - x 座標を入力してください
- y 座標を入力してください
- 幅を入力してください
高さを入力してください
高度なモードを使用しますか?
- 高度なモードには、次のような追加機能があります。
- コントラストの設定
今後追加予定
デモ