副部長の部屋

最近python始めたので、雑記帳代わりにします。 まとまり無くいきますのでよろしくです!! 後日、まとめます(笑)

pythonでOCR(光学式文字認識)をしてみた その1(tesseractのインストール windows10版)

ども副部長です!!

在庫管理は使用する人達があまり関心が無いので、すこしペースを落として勉強中です。
今回は、Pythonでカメラで文字を読み取りしてみました。
まず、インストールですね。
ベースにした参考ページは、

Windows で Tesseract 3.0.5 を使ってみる

です。
なのですが、Program Filesフォルダーにインストールするのは、使用するときにエラーになりやすいらしいのです。下が資料ページです。

qiita.com

なので、以下のページを参考に

qiita.com

新しいフォルダーを作り、インストールしました。
そして、日本語のデーターを入れるのですが、ベース参考ページのようにはせずに、インストール中に出るウィンドウで指定しました。

f:id:mintotab11865:20181024204923p:plain

一番下にあるadditional language dataを開き、

f:id:mintotab11865:20181024204950p:plain

japaneseを選択します。
必要があれば、他の言語も選択してください。
ちなみにjavaneseがとても気になったので、調べました。

f:id:mintotab11865:20181024204930p:plain

ジャワ島の言葉なんですね、データー作成者のミスかと思った・・・。
ちなみに、うちのメインパソコンでは一回Program Filesフォルダーでインストールしていたみたいで、新規フォルダでは使うときにエラーを吐き、Program Filesフォルダのtesseractでもエラーを吐きました。
なので、どちらもアンインストールして再度Program Filesフォルダにインストールしました。
とりあえず、ここまで!!
では!!