Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポート：Azure Cognitive Servicesの改善

Microsoftの「Azure Cognitive Services」に含まれる「Computer Vision」のOCR機能が、日本語を含む73言語に対応した。複数ページあるドキュメントから選択ページに限ってテキストを抽出できる。

[＠IT] PC用表示関連情報

LINE

Hatena

　Microsoftは2021年2月9日（米国時間）、「Azure Cognitive Services」に含まれる「Computer Vision」の光学式文字認識（OCR）機能が、日本語を含む73言語に対応したと発表した。

　Azure Cognitive ServicesはAIサービスとコグニティブAPIの総合的なファミリー。インテリジェントなアプリケーションの作成を支援する。

　Computer Visionは、画像やビデオなどのコンテンツを分析するAIサービスだ。Read APIを用いると、OCR機能によって、画像や複数ページのPDFドキュメントから、印刷されたテキスト部分（複数の言語）や手書きのテキスト部分（英語のみ）、数字、通貨記号を抽出できる。

　Read APIはテキストの多い画像や、混合言語を含む複数ページのPDFドキュメントからテキストを抽出できるように最適化されている。印刷文書と手書き文章のどちらであってもテキストを検出できる。

OCRの処理内容（出典：Microsoft）

　現行のRead API v3.1は英語とオランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語にしか対応していなかった。

　今回のComputer VisionのRead API v3.2パブリックプレビューは、クラウドサービスやDockerコンテナとして利用できるようになった他、OCRが日本語や中国語（簡体字と繁体字）、韓国語、ラテン語系の言語を含む73言語に対応した。

　この他にも次のような更新が含まれている。

OCR実行時に自然な読みの順序を使用する（出典：Microsoft）

Smart & Social 記事ランキング