リクルートが社内で育てたDeep Learning/機械学習API群「A3RT」を無料で公開した理由画像の人気度、校正支援、チャットボットなど

リクルートテクノロジーズは2017年3月16日、「機械学習」「Deep Learning」にまつわるサービスAPI群「A3RT」の無料公開を開始した。A3RTは、これまでリクルートグループ内で開発や展開が行われてきたAPI群のブランド名である。今回「A3RT」の社外向け無料公開に踏み切った理由と、各APIの活用イメージについて、同社でA3RTの開発に携わる石川信行氏と白井祐典氏に話を聞いた。

» 2017年03月30日 10時00分 公開
[PR/@IT]
PR

 近年、大量のデータからシステムが「学習」を行い、その中に潜むパターンやルールを自動的に見つけ出す「機械学習」の活用に向けた取り組みが盛んだ。機械学習によって自動的に作成されたモデル(データのパターンやルール)を、未知のデータに対して適用することで、ヒトの手を介した分析では不可能な、複雑で大規模なデータの分類や、より精度の高い予測ができ、その成果はあらゆるジャンルのサービスやビジネスへ応用できると期待されている。

 リクルートテクノロジーズは2017年3月16日、これまで同社がグループ内で開発と活用を進めてきた「機械学習」「Deep Learning」にまつわるサービス群「A3RT」(Analytics & Artificial Intelligence API via Recruit Technologies、読みは「アート」)の無料公開を開始した。

 スタート時に利用できるのは、以下の6つのAPIだ。

  • Listing API:レコメンド機能(モデル作成可能)
  • Image Influence API:画像のインフルエンス予測(モデル作成可能)
  • Text Classification API:文章の自動分類とラベル付け(モデル作成可能)
  • Text Suggest API:文章作成中にセンテンスをサジェスト
  • Proofreading API:文章の誤字脱字検出
  • Talk API:日常会話を行うチャットボット

 今回、「A3RT」の無料公開に踏み切った理由と、各APIの活用シーンについて、リクルートテクノロジーズでA3RTの開発に携わるリクルートテクノロジーズ ITソリューション統括部 ビッグデータ部の石川信行氏と白井祐典氏に話を聞いた。

 なお両氏は、@ITで連載「いまさら聞けないDeep Learning超入門」を執筆し、好評を博している。

A3RTの公開で「日本のオープンイノベーションに貢献したい」

 リクルートテクノロジーズは、リクルートホールディングス傘下にある7つの事業会社(キャリア、住まいカンパニー、ライフスタイル、ジョブズ、スタッフィング、マーケティングパートナーズ、スタッフサービス・ホールディングス)に対して、広く情報技術に関する支援やR&Dを行う役割を担っている。

 中でも、石川氏、白井氏が所属する「ビッグデータ部ビッグデータプロダクト開発グループ」は、リクルートグループが保有する大規模データを処理するためのインフラの整備から、その分析、成果の実装までを幅広く手掛けている。

リクルートテクノロジーズ ITソリューション統括部 ビッグデータ部 シニアアーキテクト 石川信行氏

 「大規模データの処理基盤構築については2010年ごろから取り組みを始め、ここ3年ほどは機械学習に対するニーズの高まりを受けて、Deep Learningを応用した画像解析やテキスト分析なども、グループ内でいち早く手掛けてきました。当初は、個別の事業会社と共同で取り組む検証の意味合いが大きかったのですが、少しずつ事業ドメインをまたいで共通化できそうな機械学習のロジックや機能が見えてきました。そこで、ある程度用途を絞り込み、共通化できる部分を整備してグループ内に横展開したのが『A3RT』と呼ばれるAPI群です」(石川氏)

 今回、一般に無料公開されたのは「A3RT」の中でも、先に挙げた6つの機能を持つAPIだ。現時点では、これらの利用について有料化の予定はないとする。無料公開に踏み切った最大の理由として、石川氏は「AI(人工知能)分野のオープンイノベーションに貢献したい」という思いを挙げる。

 「昨今、AI分野が注目を集めるようになり、特に欧米では、知識や人材の交流も活発になっています。その中で、企業も自社が持つ技術を一般に公開し、社外の人々や組織と情報を共有することで新たなイノベーションにつなげていく機運が生まれているように感じます。今回、A3RTをオープンにする最大の目的は、リクルートテクノロジーズが、日本のAI分野でそうしたイノベーションの一端を担っていきたいという思いからです。もちろん、これをきっかけにしてA3RTのプレゼンスが高まれば、それがわれわれにとってのメリットにもなると考えています」(石川氏)

 A3RTを公開することで得られるもう1つのメリットは、外部から得られる多くのフィードバックだという。

 「今回公開するAPI群は、リクルートグループの内部で利用してきて、一定の成果が出ていると考えられているものです。今後は、社外の方々にこれらを利用してもらい、フィードバックを頂くことで、グループ内で利用するロジックやAPIをさらに洗練していける可能性が高まると期待しています」(白井氏)

「画像の人気度」「校正支援」「チャットボット」――リクルートで鍛えられた6つのAPI

 ここからは各APIについて、その概要と想定される利用シーンを見てみよう。

Listing API:レコメンド機能(モデル作成可能)

 「Listing API」は、あるユーザーから得られた「ヒアリングシート」や「閲覧履歴」のようなデータを元に、そのユーザーが関心を持ちそうなアイテムをリストとして提示する「レコメンド」のAPIである。リクルートが独自に開発したリアルタイムレコメンドのロジックと合わせて、自然言語をベクトル処理する「Word2Vec」アルゴリズムを用いたレコメンドも可能な点が特長となっている。

 レコメンド機能は、一般的なコマースサイトなどにも多く実装されているが、リクルートグループでは、主に人材系事業会社のサービスなどで、「ユーザーが探している仕事と似ている仕事をレコメンドする」といった用途での導入検討が進んでいるという。

Image Influence API:画像のインフルエンス予測(モデル作成可能)

 「Image Influence API」は、ある画像がネット上でどの程度の「影響力」を持つかを事前に予測するものだ。一般的なSNSには、ユーザーがアップロードした画像に対し、オーディエンスが「いいね!」や「リツイート」といった形でフィードバックを行える仕組みがある。こうしたフィードバック数が多い画像は、オーディエンスに対する「影響力」が強い画像だと考えられる。

 このAPIでは、「画像」とフィードバックの「数値」をセットで学習させることで、別の画像がどの程度の「影響力」を持つかを事前に予測する。活用シーンとしては、同じ被写体を撮影した複数の画像の中から、実際にサイトに掲載するものを自動的に選別するような用途が考えられそうだ。

 「サイトのランディングページでトップに表示する画像を選ぶ場合、一般的にはABテストなどを行って、よりユーザーの反応が良いものを選択するといったことが行われています。例えば、そこで得られたデータを学習させることで、別の画像への評価を事前に予測するといった使い方もできると思います」(白井氏)

Text Classification API:文章の自動分類とラベル付け(モデル作成可能)

 「Text Classification API」は、データとして「文章」を与えることで、その内容に応じた特定の「ラベル付け」を行うもの。利用法としては、ある事象について言及したネット上のテキストが好意的なものか、批判的なものかを自動的に判定する「ネガポジ判別」などが考えられる。

Text Suggest API:文章作成中にセンテンスをサジェスト

 「Text Suggest API」は、文章の生成をサポートしてくれるAPIだ。バックエンドでは、リクルートグループで蓄積されている、プロが執筆した「文章」が多数学習されている。フロントエンドでセンテンスを書き始めると、それに続くフレーズや単語をAPIがサジェストしてくれる仕組みだ。石川氏は「文章を書き慣れていない新人や、外部のライターに原稿作成を依頼する場合、このAPIを使うことで、執筆時間の短縮や原稿品質の標準化を図れる可能性がある」と話す。

Proofreading API:文章の誤字脱字検出

 「Proofreading API」も、テキスト処理に関する機能を提供する。Text Suggest APIが入力したフレーズに対して続くフレーズをサジェストするものなのに対し、Proofreading APIでは、文章全体を入力してやることで、そこに含まれる「誤字脱字」や「漢字」「送り仮名」の間違いなどの可能性を指摘してくれる。汎用的な文章校正支援機能として、さまざまな応用が考えられそうだ。

Talk API:日常会話を行うチャットボット

 最後の「Talk API」は、ユーザーとインタラクティブな日常会話を行う機能を持ったチャットボットである。例えば、企業のWebサイトには消費者が検索で問い合わせを行える「Q&Aサイト」を設けているところも多い。そこに、この「Talk API」を組み込むことで、単なる「問い合わせ」だけではなく「日常会話」にも対応可能なチャット機能を実現し、ユーザーにより親近感を抱かせるといったことも可能になる。リクルートグループでは、結婚情報サイトに設置されたチャットボットの一部として、この「Talk API」を活用する試みを進めているという。

「動画解析」「屋内位置測定」のAPIも視野に

 リクルートテクノロジーズでは、今回の「A3RT」公開をきっかけとして、AIや機械学習に関心を持つ、より多くのエンジニアからのフィードバックを期待していると話す。グループ内で展開しているA3RTには、今回紹介した6つのAPIの他にも、「動画解析」「屋内位置測定」といった研究開発段階にあるものも含めた複数のシステムが存在している。今後の反応を見ながら、既存APIの機能拡張や新たなAPIの公開なども視野に入れているという。

 「反響によっては、現在開発中の新たなAPIを社内で展開するより先に一般公開するようなケースもあり得ると考えています。また、ハッカソンのような開発者イベントへのAPI提供や、グループ外も巻き込んだAPIベースでの共同開発なども積極的に行っていきたいですね」(石川氏)

リクルートテクノロジーズ ITソリューション統括部 ビッグデータ部 白井祐典氏

 「まず、可能な限り多くの開発者にA3RTを使ってほしい。そして、使ってみた結果や使い勝手がどうだったかといったことを、ブログやSNSにどんどん書いてほしいですね。われわれも、それらを見ながら内部で議論し、提供する機能やフィードバックのプロセスなどを、できる限りスピーディに改善していきたいと考えています。ユーザーさまからはもちろん、他の企業さまからも『こういった使い方はできないか』などの問い合わせを積極的に頂きたい」(白井氏)

 同社では、これまでグループ内では思いつかなかったような「A3RT」の新たな活用方法が登場することにも、強く期待を寄せているようだ。

 このように、「A3RT」は、これまでリクルートグループが行ってきた機械学習/Deep Learningに対する研究開発の成果を、無料で気軽に試せるAPI群である。近年、「AI」「機械学習」「Deep Learning」への関心が高まっているのを受け、自分でも何らかの形で取り組んでみたいと考えているものの、ハードルが高く、なかなか手を出せなかったエンジニアも少なくないだろう。もしそうなら、まずは公開された「A3RT」の中から、自分の関心に最も近い機能を選び、実際に試してみるところから始めてみるというのも、良いきっかけになるのではないだろうか。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:株式会社リクルートテクノロジーズ
アイティメディア営業企画/制作:@IT 編集部/掲載内容有効期限:2017年4月29日

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。