検索
ニュース

Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポートAzure Cognitive Servicesの改善

Microsoftの「Azure Cognitive Services」に含まれる「Computer Vision」のOCR機能が、日本語を含む73言語に対応した。複数ページあるドキュメントから選択ページに限ってテキストを抽出できる。

Share
Tweet
LINE
Hatena

 Microsoftは2021年2月9日(米国時間)、「Azure Cognitive Services」に含まれる「Computer Vision」の光学式文字認識(OCR)機能が、日本語を含む73言語に対応したと発表した。

 Azure Cognitive ServicesはAIサービスとコグニティブAPIの総合的なファミリー。インテリジェントなアプリケーションの作成を支援する。

 Computer Visionは、画像やビデオなどのコンテンツを分析するAIサービスだ。Read APIを用いると、OCR機能によって、画像や複数ページのPDFドキュメントから、印刷されたテキスト部分(複数の言語)や手書きのテキスト部分(英語のみ)、数字、通貨記号を抽出できる。

 Read APIはテキストの多い画像や、混合言語を含む複数ページのPDFドキュメントからテキストを抽出できるように最適化されている。印刷文書と手書き文章のどちらであってもテキストを検出できる。


OCRの処理内容(出典:Microsoft

 現行のRead API v3.1は英語とオランダ語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語にしか対応していなかった。

 今回のComputer VisionのRead API v3.2パブリックプレビューは、クラウドサービスやDockerコンテナとして利用できるようになった他、OCRが日本語や中国語(簡体字と繁体字)、韓国語、ラテン語系の言語を含む73言語に対応した。

 この他にも次のような更新が含まれている。

  • テキスト行出力に自然な読みの順序を使用する

OCR実行時に自然な読みの順序を使用する(出典:Microsoft
  • テキスト行に対して、手書きスタイルの分類と信頼度スコア(ラテン語系言語のみ)を付与する
  • 複数ページあるドキュメントでも、選択したページに限定したテキストを抽出可能
  • オンプレミスデプロイ用のディストリビューションレスコンテナとして利用可能

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る