次元削減、局所性鋭敏型ハッシュ――コンピュータサイエンスは美しいGo AbekawaのGo Global!〜Tyler McMullen(前)(3/3 ページ)

» 2023年10月03日 05時00分 公開
前のページへ 1|2|3       

コンピュータサイエンスって美しい

阿部川 さあ、16歳で仕事をはじめられたタイラー少年はその後、17歳、18歳とどうなっていきましたか。

タイラーさん まさに「ドットコムバブル」がはじけた時期でした。しばらくは仕事がありましたが、そのうちコントラクター(請負エンジニア)として仕事を始めました。「bbScript」でASPアプリケーションを開発したのがこの時期ですね。その後、ボストンに引っ越してスタートアップで働き始めました。残念ながら今その会社はありませんが。当時「Ruby on Rails」などが登場してたので、その仕事もしました。さらにその後サンフランシスコに来て、Scribdで仕事をしました。

阿部川 Scribdは3年勤められたようですが、どのようなお仕事をされていたか教えていただけますか。

タイラーさん いろいろやりました。まずは機械学習ですね、ある種のレコメンデーション(推薦)システムです。あるドキュメントが、どのドキュメントと関連しているか、といったことを解析するシステムです。最終的に「局所性鋭敏型ハッシュ」(Locality Sensitive Hashing)のアルゴリズムを使った開発を……えーと、どれぐらいまで深く技術的なことを話していいのでしょうか(笑)。

阿部川 どんなことでも結構ですよ(笑)、どんどん話してください。

タイラーさん 了解です(笑)。テキストを例にすると、文章の全ての単語を認識し、分類します。それにベクトル演算を施します。例えば、高い次元の場所では2つのドキュメントのアングルはどのようになるか(と言って、両手で手を擦り合わせて、それを360度回転させるようなしぐさをする)どこまでやれば“相似”といえるのか。仮に「百万次元の場所」があるとして、その中に私が「一千次元」をランダムに作り、そこでドキュメントのアングルを分析したらどうなるのか。

画像 インタビュー中のタイラーさん

 こういった「次元削減」(Dimensionality Reduction)や局所性鋭敏型ハッシュなど多くの技術のことを考えると、コンピュータサイエンスがとても美しく、大変魅力的なものに思えます。

阿部川 現実的にそのような考え方をベースにして開発されたアプリケーションなどはありますか。

タイラーさん 幾つかのドキュメントを比べて、類似するものがどれかを判別するソフトウェアの基になっています。これを使えば、「2つの楽曲は同じ曲と言えるかどうか」といった判断もできます。何の要素を比較するかを取り出して比べることができるのです。

阿部川 どこ曲のどこが盗作か、などもすぐに分かる、といった感じでしょうか。盗作なのか、触発されて作ったものなのかの線引きというか……。

タイラーさん なるほど、盗作と触発の境目ですか。面白いですねえ……ちょっと考えさせてください(笑)。



 ゲームにサッカー、アートに音楽。ジャンルを問わず、興味を抱いたタイラーさん。その才能に気付いた先生からの一言をきっかけに情報技術、ひいてはエンジニアの世界へと飛び込んだ。後編はFastlyを設立したいきさつと、技術者として大切にしていることについて。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

AI for エンジニアリング
「サプライチェーン攻撃」対策
1P情シスのための脆弱性管理/対策の現実解
OSSのサプライチェーン管理、取るべきアクションとは
Microsoft & Windows最前線2024
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。