OCRについて

OCRとはOptical Character Readerの頭文字を取っています。手書き文字や印刷された文字を読み込んであらかじめ登録してある文字と照合します。

 

その後、文字を特定し、文字データにします。 それほど多くはないですが、ごく稀に原稿が紙しかないので紙の原稿から文字データにしてほしいと依頼があります。Wordなどのデータをプリンタ等で印刷された文字であれば、ある程度のヒット率で文字データ化できますが、手書きや古い原稿のコピーになるとヒット率はかなり悪いです。

 

綺麗な原稿はヒット率がよいと言っても、100%変換ができるわけではないので結局全て確認をしないといけないのはヒット率が悪くても同じです。例えば、紙原稿には「目」とあるのに、OCRをすると「日」になっていたり、「外」が「タト」とカタカナ二文字になっていたりする場合があるのです。

 

OCRをした後に直す箇所が多いか少ないかの違いですね・・・ 私はOCRをする際は「読んde!!ココ」というソフトを使用しています。これは結構使えるのでお勧めです。OCRをすると画面の左側に紙原稿をスキャンした画像、右側に文字データになったテキストが配置されて、右側の文字データを送っていくと左の紙原稿の対象文字に色がつきます。

 

これであれば、確認する際にどの文字がどのように変換されたかが一目でわかるので便利です。 よかったら使ってみてください