アダルトサイトどうしのつながりは強い

「周りを見ればそのサイトが分かる」、東大とトレンドマイクロが共同研究

2008/01/28

 東京大学とトレンドマイクロは1月28日、情報セキュリティに関する共同研究「Webリンク構造の解析」の成果を発表した。これによると、アダルトサイトどうしの結び付きは強く、3クリックで危険なサイトにたどり着く可能性も高いことが判明したという。

 この研究は、東京大学の産学連携創出スキーム「Proprius21」の一環として実施されたもの。Webページ間のリンク状況を解析することにより、どこにどのような危険なサイトが存在し、どのようなサイトと結びついているかを把握することを狙っている。目視やデータマイニングでは対応が困難になっている悪意あるWebサイトの検知、危険予測などへの応用を見込んでいる。

 背景には、Webを介した脅威が広がったうえ、複雑化している現状がある。トレンドマイクロの上席執行役員日本代表、大三川彰彦氏によると、全世界で1日に更新されているWebページの数は300億以上。これだけ全体数が増加すると、ページを1つひとつ目で見て確認したり、文章を分析したりする従来のテクノロジだけでは対応が困難であり、新しいテクノロジを融合させていく必要があるという。それが、Webサイトやホスト間のリンク状況の解析という手段だ。

trend01.jpg

 今回の研究は、2007年6月から2008年1月にかけて実施された。トレンドマイクロが保有するWebサイトのデータベースの中からランダムに700件のURLを抜き出し、各ページ内のリンクを3ジャンプ先までたどり、その結果を解析した。最終的に、解析対象は1200万ページに上ったという。

 抽出されたURLは、「アダルトサイト」「違法ドラッグ」「犯罪」「ショッピング」「動画」「検索エンジン」など38のカテゴリに分類され、各サイト間のつながりが解析された。この結果、カテゴリごとにリンク構造の特徴が異なることが明らかになったという。

 例えば、ジャンプ先のURLを解析したところ、「どこから出発するかによって、到達するところはかなり異なる」(東京大学大学院情報理工学系研究科講師の増田直紀氏)という。アダルトサイトはアダルトサイトにリンクすることが多い。一方、不動産サイトはリンク先がきれいに階層化し、分散して枝分かれしていたり、ストリーミングサイトは逆にいくつかのサイトに集中し、相互にリンクしていたりといった具合だ。

trend02.jpg リンク構造の解析結果を可視化した一例。ストリーミングサイトではいくつか固まりができており、相互リンクが多いことを示している。ただし、アダルトサイトの場合とは異なり、「緑色」が多く、危険なサイトへのリンクは少ない

 また、リンクを先にたどればたどるほど、危険なサイトへの到達率は高まることも分かった。「特に、ブログや掲示板など、ユーザーが自由にリンクを張ることができるコンテンツほど、悪性コンテンツのところへ入ってしまう確率が高い」(増田氏)

 「アダルトサイトは、リンクの行き先も、自分のところに来るリンク元も、アダルトサイトであることが多い。こういった特徴をカテゴリの分類に利用できるのではないか。これまでデータベースで分類していたが、何百億ものページがあると、とても追いつかない。Webは常に変わっていくので、新しく登場したサイトの中には『unknown』と表示されることもある。こうした場合でも、そのサイトの周りを見れば、そのサイトが何であるか分かり、クリックした方がいいのかよくないのかをレコメンドできるのではないか」(増田氏)

 トレンドマイクロの近藤賢志氏(事業開発室テクノロジーリサーチ課、テクノロジーリサーチマネジャー)も、「明確にいつ実装するとは言えないが、これまで処理ができなかったWebコンテンツについて、言語やテキスト情報に頼らず類推したり、分類の精度を高めていくことができるのではないか」と期待を寄せ、将来的には、クリックしてからブロックするのではなく、クリックする前に危険度を予測できるような仕組みも考えていきたいと述べた。

(@IT 高橋睦美)

情報をお寄せください:



Security&Trust フォーラム 新着記事

注目のテーマ

Security & Trust 記事ランキング

本日 月間