ニューラルネットワーク、Deep Learning、Convolutional Neural Netの基礎知識と活用例、主なDeep Learningフレームワーク6選:いまさら聞けないDeep Learning超入門(1)(2/2 ページ)
最近注目を浴びることが多くなった「Deep Learning」と、それを用いた画像に関する施策周りの実装・事例について、リクルートグループにおける実際の開発経験を基に解説していく連載。初回は、ニューラルネットワーク、Deep Learning、Convolutional Neural Netの基礎知識と活用例、主なDeep Learningフレームワーク6選を紹介する。
Deep Learningを実装するための主なフレームワーク6選
Deep Learningが私たちのようなエンジニアでも簡単に利用できるようになった背景には主に二つあります。一つ目はオープンソースベースの各種ライブラリやフレームワークが充実してきたこと、二つ目はGPUなどを搭載した高性能サーバーが安価で購入できるようになり、さらにクラウドサービスで利用できるようなったことが挙げられます。
特に前者に関しては、下記に代表的なものの名称と簡単な概略を記載しておきます。これでもほんの一部であり、さまざまな会社・機関がこれまた多様な特徴を持つ製品を開発していることが認識でき、Deep Learningの流行と注目度上昇が手に取るように分かると思います。
Chainer
Preferred Networks社が公開したフレームワークでGPUをサポートしています。Pythonのライブラリとして提供され、さまざまなニューラルネットの構造に対応しています。
Caffe
Berkeley Vision and Learning Centerが中心として開発が進んでいるフレームワークでGPUをサポートしています。本体はC++で実装され、Pythonのバインディングが用意されています。高速で各種学習済みネットワークモデルが用意されていることが特徴です。
Torch7
Luaベースで書かれたライブラリでGPUをサポートしています。フェイスブックがTorchの拡張を公開しオープンソース化したことで有名になりました。
Theano+Pylearn2
Pythonの数値計算ライブラリでGPUをサポートしています。モントリオール大学のBengio教授の下で開発されており、実行時におけるC++コードの生成とコンパイルが行われること、微分計算を解析的に行ってくれることが特徴です。
Deeplearning4J
Skymind社が提供するJava(およびScala)を使ったオープンソースのライブラリです。分散モード、マルチスレッドモードをサポートし、Hadoop、Sparkなどの分散処理と相性が良いです。
H2O
オープンソースの総合的な機械学習ライブラリ。Deep Learningの他、複数の機械学習手法が同梱されています。便利なGUIが付属している他、RやPythonのパッケージが用意されています。HDFSやAmazon S3などのファイルシステムからデータをインポートできることも特徴です。
次回は、Caffeの使い方や構築方法などを紹介
次回はこれらライブラリ・フレームワークの中でもリクルートグループで積極的に活用しているCaffeに関して、その使い方や構築方法などを紹介します。
筆者紹介
石川 信行(いしかわ のぶゆき)
リクルートテクノロジーズ ITソリューション統括部 ビッグデータ部 シニアアーキテクト
兼 アドバンスドテクノロジーラボ
2009年リクルートに新卒入社し、現リクルートテクノロジーズの前身となる組織に配属。Javaを用いたシステム開発に参加し、その後Hadoopの導入検証に従事。主要事業にHadoopを導入した後、ビッグデータ専門部隊に合流し、13年10月より現職。現在は、事業対応リーダー、画像解析など技術開発に従事。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
グーグルの人工知能を利用できるWebインターフェースが登場
オズミックコーポレーションとイントロンワークスは7月7日、グーグルの人工知能アルゴリズム「Deep Dream」を利用できるWebインターフェースを公開した。顔写真3Dモデル化、絶対フォント感、複数画像検索、観光写真無人化、陰影分離、簡単フォント自作、消失点自動作成――デザイナー/クリエイターが茫然自失で拍手喝采な最先端技術動画11連発
アドビ システムズは、2015年10月6日(現地時間)に開催した「Adobe MAX 2015 Sneak Peeks」で、11の新技術を披露。顔写真3Dモデル化、絶対フォント感、複数画像検索、観光写真無人化、陰影分離、簡単フォント自作、消失点自動作成naなど、今回もデザイナー/クリエイターのみならず、日常的にデジカメやスマホで写真を撮る人でも欲しくなるような機能が多数見られた。米AlpacaDBがDeep-Learningを使った金融プラットフォームを開発へ
Deep-Learning技術による画像認識プラットフォームを展開してきたAlpacaDBが、資金調達に成功し、金融系の事業領域に本格進出する。セキュリティ対策に数学の力を――機械学習は先行防御の夢を見るか?
どうしても攻撃者の後手に回りがちなセキュリティ対策。ここに機械学習を活用することで、先手を打った対策を実現できないか――そんな取り組みが始まろうとしている。個人と対話するボットの裏側――大衆化するITの出口とバックエンド
マシンラーニング、ディープラーニングなど、未来を感じさせる数理モデルを使ったコンピューター実装が注目されている。自ら学習し、機械だけでなく人間との対話も可能な技術だ。では、コンピューターはどのように人間との対話を図ればよいのだろうか。コンピューターの技術だけでなく、そこで実装されるべきインターフェースデザインを考えるヒントを、あるコンシューマーアプリ開発のストーリーから見ていく。自動車を制御するロボットの思考と行動の仕組み――Google Carが現実世界を認識する際の3つのアルゴリズムと実用化への課題
本連載では、公開情報を基に主にソフトウエア(AI、アルゴリズム)の観点でGoogle Carの仕組みを解説していきます。今回は、制御AIの思考と行動のサイクル、位置推定の考え方「Markov Localization」における3つのアルゴリズムと、その使い分け、現実世界の認識における課題などについて。バンナム、スクエニ、東ロボ、MS――人工知能や機械学習はゲーム開発者に何をもたらすのか
8月26日に開催されたゲーム開発者向けイベントの中から、バンナム、スクエニ、東ロボ、MSなどによる人工知能や機械学習、データ解析における取り組みについての講演内容をまとめてお伝えする。