本文へ移動

WORKS / 納入事例・現場レポート

OCR(光学文字認識)
(瑞浪市>製造業様)
OCR(光学文字認識)
(瑞浪市>製造業様)
【OCR(光学文字認識)】

、活字の文書の画像(通常イメージスキャナーで取り込まれる)をコンピュータが編集できる形式(文字コードの列)に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。
(鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。
初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えばワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。   -wikipedia-

製造業のクライアント様向けの検証作業を実施しました。
「図面ファイリングソリューション」
溢れる紙図面、現状は電子化されることもなく紙媒体でもファイリングができていない状態です。


ご要望は紙の図面をPDFで電子化。

①DWG.NO(図面番号)
②TITLE(タイトル)
③MATERIAL(マテリアル)
でのファイル検索がPC上で行えること、またPDF化されたファイルにメモ書きができること。
さらに社内で共有ができ、かつクラウドシステムを利用し外出先からもデータにアクセスできる事。

検証の中で最も重要であった「CAD文字」に対するOCRの認識率です。
OCRソフトによりPDFファイルは「テキスト付きPDF」となりファイル内の活字をPCが認識し、全文検索によるファイル検索が可能になります。今回は4メーカーのOCRソフトの検証作業です。

結果はメーカー別に大きな差がありその中でもご要望にお応えのできる「ベスト1」を決定しました。
「Acrobat reader」のファイル検索機能でしっかりと上記で該当のキーワードを検索→ヒットさせます。

ファイル検索が可能となった電子図面は、これまでになかった業務フローからの「活用」が期待されます。

「図面」は「財産」と口にしてみえたクライアント様。
他のご要望に対する検証作業も終え後日デモンストレーションになります。
 
TOPへ戻る