Hadoopとの出会いが転機に～トレジャーデータCTO 太田一樹氏インタビュー：若手起業家の素顔（1/2 ページ）

米トレジャーデータのCTOを務める太田一樹氏にインタビューする機会を得た。プログラミングを始めたきっかけや、Hadoopとの出会い、起業についてなど、28歳の若手起業家の素顔に迫った。

» 2013年07月09日 12時00分公開

　米トレジャーデータは、昨今話題となっている“ビッグデータ”の処理基盤を提供していることに加えて、3人の日本人が立ち上げたシリコンバレー発のベンチャーとして、注目を集めている。2013年5月20日には、日本国内での事業展開を本格化すると発表している（関連記事）。

　同社が提供する「Treasure Data Platform」は、自社開発技術とHadoop、クラウドサービス（AWS）を組み合わせたビッグデータ処理基盤である。ビッグデータの処理基盤をクラウドで提供している点が特徴だ。大量のセンサデータや購買取引データ、Web閲覧・アプリケーションのログデータなどをクラウド上のデータベースにインポートし、そのデータに対してHadoopで並列分散処理を行い、大規模データの集計・解析を実現する。2012年9月に正式版のサービスを開始した。

　今回は、トレジャーデータの創業メンバーの1人で最高技術責任者（CTO）を務める太田一樹氏にインタビューする機会を得た。同氏のバックグラウンドやCTOとしての役割など、28歳の若手起業家の素顔に迫った。

始まりは「iアプリ」のプログラミング体験

――まずは、太田氏の技術的なバックグラウンドを教えてください。

　プログラミングを始めたのは17歳か18歳のころです。当時、NTTドコモの「iアプリ」が動作する携帯電話を手に入れたことをきっかけに、携帯電話用のJavaアプリを作っていました。そのころは全くのプログラミング初心者だったのですが、試しにシューティングゲームを作ってみたら、それが40万件もダウンロードされたのです。ただの高校生がゲームを作り、配信し、インターネットで40万人に利用され、かつ隣の席で自分の作ったゲームをプレーしている女の子がいたり……。このときに「インターネットとテクノロジってすごい！」と感動したのが、いまのキャリアの始まりですね。

　その後、東京大学理学部の情報科学科に入学するとともに、オープンソース活動にも参加するようになりました。具体的には、Linux用の代表的なデスクトップ環境の1つである「K Desktop Environment（KDE）」での日本語入力を可能にしたり、WebブラウザのChromeなどに搭載されるWebKitの原型「KHTML」というコンポーネントで発生する日本語の全角空白問題を修正したり、日本語の禁則処理のルールを細かく直したりしていました。

　私が19歳か20歳ぐらいの時に、大学の先輩がPreferred Infrastructure（分散処理フレームワークの「Jubatus」で知られる）を起業しました。オープンソースつながりの仲間が偶然そこを手伝っていて、面白そうだと感じ、私も関与することになりました。実は当時、あまり大学には行かず、フリーランスでプログラミングの仕事を請け負っていたのです（笑）。

　そこから6年～7年くらい、同社でCTOをやらせていただき、社員もおおよそ30人規模にまで成長させました。その際にベンチャーの辛さや楽しさを体験し、人材育成や売り上げの立て方など、経営的な視点と考え方をひと通り学べたと考えています。

転機は分散処理基盤「Apache Hadoop」との出会い

　大学ではスーパーコンピュータを研究テーマにしていて、米アルゴンヌ国立研究所に納入されているIBMのスーパーコンピュータ「Blue Gene」などでの分散処理を対象としていました。50万個のプロセッサコアを使ってジョブを並列処理し、大量に発生するI/Oリクエストをどうやって効率的にストレージへ流すかというような研究です。

　大学でこのような研究をしていたのとほぼ同じ時期に、Hadoopというテクノロジが登場しました。グーグルの技術から生まれた分散処理フレームワークということで、興味を抱きました。当時は未熟でオモチャのようなオープンソースプロジェクトだったのですが、将来性を感じたため、記事や書籍の執筆のほか、コミュニティ活動などを始めました。一時期はHadoopで検索すると私の記事が最上位に出てくるといった状況もあり、Hadoopコミュニティ内のエンジニアとして、知名度が高まっていきました。

　2009年には「Hadoop Conference Japan」を初めて開催しました。その際にトレジャーデータを一緒に起業することとなる、最高経営責任者（CEO）の芳川裕誠さんに出会ったのです。芳川さんは当時、米国でベンチャーキャピタリストをやっており、オープンソース関連の投資に積極的で、特にHadoopやディストリビュータのクラウデラに強い関心を持っていました。タイミングが良く、クラウデラが日本でのビジネス展開を検討していた時期で、同社の創業者と会った際に一発花火を打ち上げましょうと盛り上がり、300人規模で集まったわけです。なおかつ、その場でHadoopユーザー会の設立も発表しました。それからは、私がクラウデラのトレーニング講師をしたり、芳川さんが文書を翻訳したりする中で、日本のHadoopコミュニティは1000～1500人の規模に成長しました。1000～2000人規模のカンファレンスを開催していると、ここ5、6年くらいかけて一大ムーブメントになったのだと感じます。

　クラウデラの成長を目の当たりにし、実際に当時は社員が5人とか10人の会社が、今では400人規模にまで成長していく様子を見ていると、マーケティングやセールス、エンジニアリングなどの部門で、日本にはないスピード感がシリコンバレーにはあるのかな、と少しずつ興味を抱き始めた時期でもあります。2010年辺りに芳川さんとクラウデラの仕事で米国に行くことがあったのですが、そのときに芳川さんの自宅のベランダで「米国で一緒に会社を興せたらいいね」と言われ、私は「そうですね」と答えたらしいのですが、実はそのことを覚えていないのです。今でも思い出せないのですよ（笑）。

いざ、米国でエンジェル投資家を説得

　しかし、実際はそこから半年ほどは何も進展はなかったのです。ある日突然、芳川さんから「本気でビジネスプランを練って、世界で勝負してみないか」というメールが来て、それは確かに面白そうだと感じ、トレジャーデータのプロダクト構想を持って、実際にシリコンバレーのエンジェル投資家を説得しに行ったわけです。

　Hadoopコミュニティを運営していて分かったことなのですが、コミュニティ内でもHadoopを実際に使っている人、これから使いたい人、全然知らない人などさまざまなわけです。ただ、大きなトレンドとして、データはムーアの法則のように18カ月で倍々に増えていくとなると、それを処理するインフラが必要になります。そのためのHadoopなのですが、人材確保、既存システムとの相互運用性、データ収集という3つの問題があります。

　1つ目の人材の確保では、Hadoopを使うためには特殊なスキルが要求され、特に非IT系の領域では、こうしたスキルを持った人を育成するのが難しいです。

　2つ目の相互運用性については、既存システムとの組み合わせや使い分け、システムとしての運用管理をどうするかという点です。Hadoopを1、2年運用した結果、オープンソースにもかかわらず、運用コストが掛かってしまい、結局は大手ベンダの企業向けデータウェアハウスにごそっと乗り換えるケースがあったりして、「何のためのテクノロジだったのだろう」と思うところもありました。

　3つ目のデータ収集に関しては、Hadoopでのデータの保存方法や処理方法は皆さん注力するのですが、データをどうやって集めるのかについては毎回問題になっていました。

　この3つの問題点を解決できる製品が作れれば、社会基盤になれるのではないか、という考えが、トレジャーデータの製品としての構想です。

　　　　　　 1|2 次のページへ

SpecialPR