pythonでOCR(光学式文字認識)をしてみた その1(tesseractのインストール windows10版)
ども副部長です!!
在庫管理は使用する人達があまり関心が無いので、すこしペースを落として勉強中です。
今回は、Pythonでカメラで文字を読み取りしてみました。
まず、インストールですね。
ベースにした参考ページは、
Windows で Tesseract 3.0.5 を使ってみる
です。
なのですが、Program Filesフォルダーにインストールするのは、使用するときにエラーになりやすいらしいのです。下が資料ページです。
なので、以下のページを参考に
新しいフォルダーを作り、インストールしました。
そして、日本語のデーターを入れるのですが、ベース参考ページのようにはせずに、インストール中に出るウィンドウで指定しました。
一番下にあるadditional language dataを開き、
japaneseを選択します。
必要があれば、他の言語も選択してください。
ちなみにjavaneseがとても気になったので、調べました。
ジャワ島の言葉なんですね、データー作成者のミスかと思った・・・。
ちなみに、うちのメインパソコンでは一回Program Filesフォルダーでインストールしていたみたいで、新規フォルダでは使うときにエラーを吐き、Program Filesフォルダのtesseractでもエラーを吐きました。
なので、どちらもアンインストールして再度Program Filesフォルダにインストールしました。
とりあえず、ここまで!!
では!!