メインコンテンツにスキップ

CLI ウィザード

OCR CLI ウィザードを使用すると、テストを実行せずに画像内で見つかるテキストを検証できます。必要なのは以下のとおりです。

  • 依存関係として @wdio/ocr-service をインストールしていること (はじめに を参照)
  • 処理したい画像

次に、次のコマンドを実行してウィザードを開始します。

npx ocr-service

npx wdio ocr

これは、画像を選択し、高度なモードで haystack を使用するための手順を案内するウィザードを開始します。以下の質問が表示されます。

ファイルの指定方法を選択してください。

  • 以下のオプションを選択できます。
  • 「ファイルエクスプローラー」を使用する

ファイルパスを手動で入力する

「ファイルエクスプローラー」を使用する

CLI ウィザードには、システム上のファイルを検索するための「ファイルエクスプローラー」を使用するオプションが用意されています。コマンドを実行したフォルダから開始されます。画像を選択すると (方向キーと Enter キーを使用)、次の質問に進みます。

ファイルパスを手動で入力する

これは、ローカルマシン上のファイルへの直接パスです。

haystack を使用しますか?

  • ここでは、処理する必要がある領域を選択するオプションがあります。これは、プロセスを高速化したり、OCR エンジンが見つける可能性のあるテキストの量を削減/絞り込んだりすることができます。以下の質問に基づいて、xywidthheight データを提供する必要があります。
  • x 座標を入力してください
  • y 座標を入力してください
  • 幅を入力してください

高さを入力してください

高度なモードを使用しますか?

  • 高度なモードには、次のような追加機能があります。
  • コントラストの設定

今後追加予定

デモ

デモ

WebdriverIO AI Copilot