＠IT
＠IT Special
あらゆるビジネスで人工知能／Deep Learningが生き...

あらゆるビジネスで人工知能／Deep Learningが生きる未来は、すぐそこに。“実用”のためのインフラ要件とコンピュータスペックとは：専門分野の翻訳、特許、製造、医療、金融、農業……

ディープラーニング技術の登場と発展は、第三次「人工知能」（AI）ブームを引き起こした。既にさまざまな分野での活用が実現しつつあり、具体的なサービスや製品が目の前に登場している。今後、より多くの企業がさまざまな「ディープラーニングビジネス」にチャレンジすることだろう。この波に乗り遅れず、自社のビジネスへ取り込むためには、どのようなITインフラ／コンピュータが必要なのだろうか。

» 2017年02月27日 10時00分公開

[PR／＠IT]

どのような企業もディープラーニングワールドへ

　「ディープラーニング」（Deep Learning:深層学習）技術の発展によって、広義の「AI」は急速に進化を遂げ、また普及へと進み始めている。既に先進的な企業や研究機関での検証・実験のみならず、実際の業務やサービスでディープラーニングを活用する例も登場しつつある。いずれは、企業の業種・大小にかかわらず、一般的に利用されるようになっていくだろう。

　例えば、情報通信研究機構（NICT)は、機械学習技術を組み込んだ多言語音声翻訳エンジン「VoiceTra」を開発し、2013年まで公開していた。その後、この技術はFEATにライセンスされ、無償のアプリ「VoiceTra4U」として公開中である。

　さらにNICTは2017年1月、みらい翻訳、日本特許翻訳、化学情報協会と共同で、高精度な英文特許自動翻訳サービスを開発したことを発表している。ベースとなる翻訳システムは、NICTと特許庁が合同で2014年から研究開発を続けてきたもので、ディープラーニング技術を応用しているという。まずは英日翻訳のサービスが実用化されたが、NICTは多言語・多分野化を目指して研究を進める意向だ。また特許庁は、先行技術調査などの高度化・効率化を図るために、AI技術の実証研究を行うことも発表している。

　翻訳技術に大きな期待を寄せているのは、やはり専門性の高い分野だ。医療・化学といった専門用語の多い業界では、海外のドキュメントを読み解いたり、当該の言語へ翻訳したりする機会が多い。日常的な会話よりも難しい単語が多く、専門知識のある専門家でないと翻訳が困難な場面が多々あった。前述したNICTらの特許自動翻訳サービスも、従来の統計的技術では困難だった専門的な低頻出語や数式・表などを厳密に翻訳できるようになったという。

　コンシューマ向けの分野では、GoogleやMicrosoftなどが翻訳ツール／サービスの展開を開始している。「Microsoft Translator」は、ディープラーニング技術を応用しており、ユーザーが利用すればするほど精度が上がるという。「Google翻訳」も2016年に、従来のフレーズベースの機械翻訳技術（PBMT）から、ディープラーニング技術を応用した新しい翻訳システム「Google Neural Machine Translation（GNMT）」に切り替え、自然な翻訳が可能になったことを強調した。日本語に対応して話題になった画面上のテキストをリアルタイムに翻訳する機能（Word Lens）にもディープラーニング技術が応用されている。

　国内においては、インバウンド需要の増加に向けて、翻訳サービスの発展が期待できるだろう。海外から数多くの観光客を受け入れ、英語だけでなく、中国語や韓国語をはじめ、さまざまな言語で案内や商売ができれば、双方に大きなメリットがあるからだ。

さまざまな分野での応用が進むディープラーニング

　製造業も、ディープラーニング技術の活用が期待されている業界の1つである。

　例えば製造業の生産ラインにおいては、古くから画像認識技術が活用されてきた。高速に流れる製品を1つ1つ画像処理し、不良品を発見・排除する仕組みは、一般的に利用されている。

　ところが従来の技術では、「不良品とはどのようなものか」という定義が難しく、これを数値化してコンピュータに登録する作業に時間とコストが掛かっていた。当然のことながら、高い精度を保つのも困難だった。

　ディープラーニング技術を応用したシステムでは、例えば1000の製品を認識させて不良品を指定すれば、自動的に機械が学習し、不良品の定義を策定してくれる。もし誤認があったとしても、それを指摘すればどんどん精度が高まる。人間とは異なり、極めて高速かつ正確に学習し、ミスもほとんどない。

　もともとそうした作業は、“熟練”と呼ばれる作業者が行っていたものだ。ディープラーニング技術のポイントは、勘や経験といった数値化しにくい人間の知識・ノウハウを、機械に学習・再生させるところにある。人間が数年・数十年かけて鍛えてきたものを、数分・数時間で学習してしまうのだから、その効率性は驚くべきものだ。

　こうした人間の勘・経験の習得は、何も製造業の熟練工に限った話ではない。前出した特許庁の先行技術調査は、既存の特許と似通ったものを探すことから始まる。膨大な情報がある一方で、完全に一致するものは“まれ”である。場合によっては勘や経験が物を言う場面もあったことだろう。

　医療分野では、がん医療でのディープラーニング技術の応用が期待されている。患者の膨大な臨床情報、ゲノム、CT・MRI画像などを統合的に解析し、医療の最適化を図る目的で研究が進められている。

　さらに、CT・MRI、超音波検査やレントゲンなどの画像から病変を見つけるには、専門的な病理医・読影医の存在が欠かせない。彼らは、膨大な量の医用画像を見続ける経験や訓練を経て、異常を発見する勘を養う。そうした技術の特殊性から、専門家の不足も危ぶまれている。「ディープラーニングであれば、膨大な量の画像を短時間で学習することが可能で、精度を急速に高めることが可能」というわけだ。

SlideShare「MII conference177 nvidia」の29ぺージ目から引用

　金融業界でも、ディープラーニング技術の応用は盛んだ。ある米国カード会社では、盗難されたクレジットカードの不正決済などを検出するため、統計的技術によるシステムを利用していた。しかし、誤報が多いという課題があり、ディープラーニング技術を応用したシステムによって精度の向上を図ったという。

　国内では、みずほ証券がディープラーニング技術を用いた株価騰落予測システムを活用しており、2016年11月には「人工知能を搭載した株式売買システム」を機関投資家向けに提供を開始した。

　イスラエルでは、ディープラーニングを応用した“スマート農業システム”が注目されている。IT先進国である同国は農業も盛んで、高い自給率を誇っていることで知られる。降水量が少ない地域で効率良く作物を育てるため、農場に気候センサーやカメラを設置し、害虫や病気、栄養不足、農作業などを監視・分析して、最小限のコストで最大の効果を得られるように最適化を図るのだという。

ディープラーニングのインフラは学習フェーズに注目

　このように、ディープラーニングはさまざまな分野での応用が始まっている技術である。実用化されているのはまだ一部とは言え、決して特殊な技術ではない。さまざまなプレイヤーが参画することによって、ディープラーニングを活用したサービスが急速に広がっていくはずだ。どのような企業でも、ビジネスチャンスがあるといっても過言ではない。

　そこで、ディープラーニングを活用する際の注意点・押さえておきたいポイントについて触れたい。

　ディープラーニング技術をビジネスに活用するためには、大きく分けて「学習」と「推論」という2つのフェーズが必要となる。学習とは、コンピュータが学ぶべき情報をインプットすることで、前述のような膨大な医用画像を読み込んで、ニューラルネットワークを作るステップである。推論とは、ユーザーがスマートフォンのような小型端末からニューラルネットワークにアクセスし、ディープラーニングの結果を利用するステップのことだ。翻訳アプリを利用するシーンを想像すればよいだろう。

　推論フェーズでは、システムに大きな負荷が掛かることは少ない。もちろん多数のユーザーが利用するケースは想定しておく必要があるが、学習フェーズに比べれば大したことはない。

　大きなコンピューティングリソースが必要なのは、学習フェーズである。機械は、人の経験・勘を習得するため、教師役となる膨大なデータを読み込み、人間の神経細胞のようなニューラルネットワークを形成する。それには、強力なプロセッサと巨大なメモリ、高速なディスクが必要だ。

　強力なコンピュータという点では、古くから並列演算処理を得意とするスーパーコンピュータ／HPCが活用されてきた。しかし、ご承知の通りスーパーコンピュータは大規模かつ高額であり、気象予測やシミュレーション天文学などの科学技術計算用途が大半で、一般的な企業がビジネス開拓のために導入するようなものではない。

　科学技術計算にスーパーコンピュータが用いられるのは、極めて高い精度が求められるためだ。気象学や天文学の分野では、わずかな演算の誤差でも大きな結果の違いとして表れてしまう。そこで通常は、「倍精度（double）」と呼ばれる高い精度の計算が可能な64ビットCPUが用いられる。

　ところが、ディープラーニング技術が生きる画像処理や翻訳、音声認識、検索という分野では、科学技術計算ほど高い精度は必要ない。例えば、ネジの製造ラインで製品の亀裂を学習するのに、色数の多い美しい画像は必要ない。人間の会話を学習する音声認識では、演算の誤差より環境音のノイズの方が大きい。リアルタイムに学習して結果を求められるサービスも登場するだろう。

　つまり、ディープラーニングが応用されるビジネス分野では、精度よりも高速性の方が重視される。また、できる限り安価に強力なパワーを得たい。

　そこで最近注目されているのが、画像処理用のGPUを汎用演算に応用した「GPGPU（General-purpose computing on graphics processing units）」である。

　GPUは、CPUのような汎用性は低いが、ディープラーニングに必要とされる行列乗算を極めて高速に行えるプロセッサである。倍精度でもCPUより高速な演算が可能であるが、低い精度だとさらに高速性が際立つことで知られている。

　例えば、NVIDIAの「DGX-1」は、「NVIDIA Tesla P100」を8基搭載しており、2基のインテルXeon E5-2697 v3を用いて150時間かかった学習を、わずか2時間という短時間で完了した。また、Xeon E5-2697 v3マシンが3T FLOPSというパフォーマンスであるのに対し、NVIDIA Tesla P100は170T FLOPSを発揮するという。

　GPGPUを活用したコンピュータは、極めて強力な演算能力を持ちながら、比較的小さく、安価であることが特長だ。そのため、スーパーコンピュータ／HPCよりも導入のハードルが低く、ディープラーニング技術を活用したビジネスのチャンスが広がるものとして期待度も高い。

“実用性”を重視しつつ安価なディープラーニング専用マシン

　また、GDEPソリューションズでは、より多くのユーザー企業が“ディープラーニングビジネス”へ参画できるようになるシステムとして、日立製作所の「SR24000/DL1 ディープラーニングシステム」（以下、DL1）を提供している。このシステムは、スーパーテクニカルサーバ SR24000シリーズをディープラーニング用にカスタマイズしたもので、安価ながら（最小構成で399万円～）高い演算性能を発揮することで注目されている。

SR24000/DL1の構成図

　DL1は、DGX-1と同じNVIDIA Tesla P100を採用しつつ、搭載数を2基あるいは4基にして価格を抑えているが、パフォーマンスは42.4T FLOPS（2基の場合）あるいは84.8T FLOPS（4基の場合）を達成しており、CPUのみのシステムよりも十分に高い演算能力を持つ。CPUには強力な「IBM POWER8 2.86GHz」を採用、Tesla P100とNVlDlA NVLinkで直接接続され、一般的なPCI Expressよりも高いパフォーマンスを実現している。

　メモリにはDDR4 DIMMにより256GBまたは512GBを選択でき、内蔵ストレージには高速かつ大容量の1.92TB SSDを採用する。10GbEやInfiniBandといった高速なネットワークインターフェースを搭載する他、ニューラルネットワークを高速に設計するためのフレームワークやドライバなどの開発環境が整っており、高い実用性を持つのが特長だ。

　この“実用性”というのが、企業ユーザーにとっては非常に重要である。

　価格のみを見れば、DL1よりも安価なディープラーニング向けGPGPUシステムは存在する。しかし、これらは安価なコンシューマ向けのGPUを採用していることが大半だ。

　もちろん、コンシューマ向けのGPUでもハイエンドなGPUでも内部のアーキテクチャは同様なため、ディープラーニング技術を学習したり、試験したりすることは可能である。実際、研究者や技術者が個人でマシンを購入し、システムを構築する例は少なくない。しかし、これらが実用に耐え得るかというと話は別だ。

　NVIDIA Tesla P100のようなエンタープライズ系GPUと、NVIDIA GeForceのようなコンシューマ系GPUとの最大の違いは、耐久性にある。膨大な量の演算を行うと、当然のことながらプロセッサは大量の熱を発する。そもそもコンシューマ系GPUは、そうした演算のために作られたものではないため、すぐにハングアップしてしまうのだ。

　また、コンシューマ向けGPUは新製品の登場が早く、すぐに陳腐化してしまう可能性も高い。企業向けの保証もない。ビジネス用途で利用するためには、長期にわたって安定的に製品と技術が提供されており、故障やトラブルに対する保証やサポートが充実していることが望ましい。

　だからこそ日立製作所は、エンタープライズ向けNVIDIA Tesla P100やIBM POWER8などを採用して、品質が高いディープラーニングサーバへと仕上げたのである。

　ディープラーニング技術は、遠い未来のことではなく、実用的なシステムとして私たちの目の前にある。ユーザーの環境や技術が急速に移り変わりゆく現代では、できるかぎり早くディープラーニングのビジネスへ参画するための、素早い経営判断が求められている。

　SR24000/DL1は、そうした判断を鈍らせないために、価格を抑え、使いやすいシステムとして開発された。ぜひ決断し、早くイノベーションを引き起こしていただきたい。