Microsoft、「Computer Vision」のOCR機能で日本語など73言語をサポートAzure Cognitive Servicesの改善

Microsoftの「Azure Cognitive Services」に含まれる「Computer Vision」のOCR機能が、日本語を含む73言語に対応した。複数ページあるドキュメントから選択ページに限ってテキストを抽出できる。

» 2021年02月19日 15時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Microsoftは2021年2月9日(米国時間)、「Azure Cognitive Services」に含まれる「Computer Vision」の光学式文字認識(OCR)機能が、日本語を含む73言語に対応したと発表した。

 Azure Cognitive ServicesはAIサービスとコグニティブAPIの総合的なファミリー。インテリジェントなアプリケーションの作成を支援する。

 Computer Visionは、画像やビデオなどのコンテンツを分析するAIサービスだ。Read APIを用いると、OCR機能によって、画像や複数ページのPDFドキュメントから、印刷されたテキスト部分(複数の言語)や手書きのテキスト部分(英語のみ)、数字、通貨記号を抽出できる。

 Read APIはテキストの多い画像や、混合言語を含む複数ページのPDFドキュメントからテキストを抽出できるように最適化されている。印刷文書と手書き文章のどちらであってもテキストを検出できる。

OCRの処理内容(出典:Microsoft

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。