画像／動画認識のComputer Vision APIをOCRとして使うには？　フォントごとの精度は？：認識系API活用入門（5）（2/4 ページ）

コグニティブサービスのAPIを用いて、「現在のコグニティブサービスでどのようなことができるのか」「どのようにして利用できるのか」「どの程度の精度なのか」を検証していく連載。今回は、Computer Vision APIの概要と使い方を解説し、OCR機能について、日本語／英語、フォントごとの精度の違いを検証する。

[岩本禎史，株式会社クロスキャット] PC用表示関連情報

LINE

Hatena

前のページへ | 次のページへ

プロジェクトの作成

　Visual Studioを起動し、新規プロジェクトとして、C#のWPFアプリケーションを作成します。

新しいプロジェクトの作成

　今回はOCRの結果をJSON形式で受け取るので、JSONを取り扱えるようにするためライブラリを追加します。

　まず、メニューバーの「プロジェクト」から「NuGetパッケージの管理」をクリックします。

NuGetパッケージの管理

　「参照」をクリックし、検索のテキストボックスに「Json」と入力すると、「System.Runtime.Serialization.Json」が検索結果として表示されます。これを選択して、画面右側の「インストール」ボタンをクリックします。

System.Runtime.Serialization.Jsonのインストール

　変更の確認画面が表示されたらOKボタンをクリック。ライセンスへの同意の画面が表示されたら「同意する」をクリックします。

　続いて、先ほどインストールしたSystem.Runtime.Serialization.Jsonをプログラム内から使用できるようにするため、メニューバーの「プロジェクト」から「参照の追加」をクリックします。

参照の追加

　フレームワークの中にある「System.Runtime.Serialization」にチェックを入れ、OKボタンをクリックします。

System.Runtime.Serializationの追加

画面の作成

　MainWindow.xamlのソースについては以下のようになっています（※画面部分のソースコードの解説は本連載の趣旨から外れるので割愛します）。

<Window x:Class="ComputerVisionAPI.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        xmlns:d="http://schemas.microsoft.com/expression/blend/2008"
        xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
        xmlns:local="clr-namespace:ComputerVisionAPI"
        mc:Ignorable="d"
        Title="OCR (Computer Vision API)" Height="620" Width="525">
    <Grid>
        <StackPanel Margin="0,20,0,0">
            <Button Name="btnSelectnews015_File" Content="画像ファイルを選択" Width="120" Height="30" Click="btnSelectnews015_File_Click"/>
            <news015_ Name="imgOCR" Width="300" Height="200"/>
            <ComboBox Name="cmbLanguage" Width=" 200" Margin="0,20,0,0">
                <ComboBoxItem Content="unk" IsSelected="True" />
                <ComboBoxItem Content="ja" />
                <ComboBoxItem Content="en" />
            </ComboBox>
            <Button Name="btnOK" Content="O K" Width="200" Height="50" Margin="0,20,0,0" Click="btnOK_Click"/>
            <TextBox Name="tboxResult" Width="500" Height="200" Margin="0,20,0,0"/>
        </StackPanel>
    </Grid>
</Window>

処理の作成

前のページへ | 次のページへ

ボットにCognitive Servicesを組み込んでみる
マイクロソフトが提供するCognitive Servicesがどんなものかを、Text Analytics APIを使いながら見てみよう。
米IBMがビッグデータ分析基盤サービスを拡充、コグニティブコンピューティングの研究成果も搭載
米IBMは、センサ情報などの大量データを基に人間のように意思決定するコグニティブコンピューティングの研究成果を、実製品やサービスに取り込んでいくと発表した。SoftLayer環境も想定する。
Google Cloud Vision APIのパブリックβ版が公開
米グーグルは2016年2月18日、「Google Cloud Vision API」のパブリックβ版を公開した。APIコールのみで画像の特徴的な要素や一般的なランドマークなどをラベル付けしたり、多様な言語の文字認識（OCR）機能を利用できる。

画像／動画認識のComputer Vision APIをOCRとして使うには？　フォントごとの精度は？：認識系API活用入門（5）（2/4 ページ）

プロジェクトの作成

画面の作成

関連記事

Smart & Social 記事ランキング

画像／動画認識のComputer Vision APIをOCRとして使うには？ フォントごとの精度は？：認識系API活用入門（5）（2/4 ページ）

プロジェクトの作成

画面の作成

関連記事

Smart & Social 記事ランキング

画像／動画認識のComputer Vision APIをOCRとして使うには？　フォントごとの精度は？：認識系API活用入門（5）（2/4 ページ）