「ネット検閲の回避方法」を発見/学習するAIツールを開発、メリーランド大:中国、インド、カザフスタンで検閲回避に成功
メリーランド大学に所属するコンピュータ科学者が、独裁政権によるインターネット検閲をかいくぐる方法を自動的に学習する人工知能(AI)ツール「Geneva」を開発した。
メリーランド大学の研究チームは2019年11月14日、ロンドンで開催された「ACM Conference on Computer and Communications Security(CCS)2019」で、独裁政権によるインターネット検閲をかいくぐる方法を自動的に学習する人工知能(AI)ツール「Geneva」(Genetic Evasion)に関する論文を発表した。
Genevaの開発に当たり、中国やインド、カザフスタンで実地テストを実施した。テストでは検閲に使われる仕組みの穴を利用し、バグを探し当てることで、検閲を回避する数十の方法を発見した。研究チームによれば、人間が手動でこれらの方法を発見するのは、事実上不可能だという。
これまでは検閲側が圧倒的に有利だった。検閲を回避する方法を研究者が手動で探さなければならず、そのプロセスにはかなりの時間がかかるからだ。
メリーランド大学でコンピュータ科学の助教授を務めるデイブ・レビン氏はGenevaによってこの状況が変わると語る。
「今後は、検閲者と検閲を回避しようとする者のAIシステム同士が競争するようになる。Genevaは、そうした時代への第一歩を踏み出している。われわれがこの競争に勝利することができれば、何百万もの世界の人々が、言論の自由とオープンなコミュニケーションを取り戻すことになる」
禁じられたキーワードを分割して送信
インターネットで送受信される情報は全て、送信者のコンピュータでデータパケットに分割され、受信者のコンピュータで再構成される。インターネット検閲の一般的な手法は、インターネット検索時に送信されたデータパケットに含まれる指定キーワードを監視することで成立している。例えば中国における「Tiananmen Square」(天安門広場)や、禁止ドメイン名(多くの国家における「Wikipedia」のような)を含むリクエストをブロックするというものだ。
Genevaは、Webリクエストを送信するコンピュータで動作する。データの分割と送信方法に変更を加えることで、検閲システムが禁止コンテンツを認識したり、接続を検閲したりできないように動作する。
Genevaは生物学にヒントを得たAIであり、遺伝的アルゴリズムを用いることで、データパケットを分割、配置、送信するための高度な回避戦略を生み出すことが可能だ。世代を重ねるごとに検閲を回避する際に最も効果的なアルゴリズムを残し、効果的ではなかったアルゴリズムを捨てる。その際に命令をランダムに削除したり、新しい命令を追加したり、成功した命令を組み合わせたりして戦略を再びテストしていく。こうして戦略が変異し、異種交配していく。この進化的プロセスを通してさまざまな回避戦略を非常に迅速に定めていくことができるという。
「検閲問題に取り組む研究者は通常、検閲方法を特定し、これに基づいて回避方法を考案する。だが、われわれはそれとは逆に、Genevaに回避方法を発見させてから、どんな検閲方法が使われているかを理解する」(レビン氏)
ユーザーにとってもメリットがある。特定のWebブラウザを使う必要はなく、一般的なWebブラウザを利用中にGenevaがバックグラウンドで動作するからだ。動作中に検閲の回避方法をGenevaが自ら発見し、進化していく。
検閲をかいくぐるのに何日かかったか
研究チームはまず研究室内でGenevaの遺伝的アルゴリズムを鍛えた。すると独裁政権が利用している検閲アルゴリズムを再現できた。
次に、いまだ見つかっていない検閲戦略に対抗して、現実の世界でもGenevaが機能することを示す必要があった。そこで研究チームは手を加えていない「Google Chrome」をインストールしたPCを中国で動かした。Genevaによって特定された対抗戦略によって、ユーザーはキーワード検閲をかいくぐってWebアクセスが可能になった。さらに特定のURLをブロックしているインドや、一部のソーシャルメディアサイトを盗聴していたカザフスタンでも、検閲を回避することに成功した。
Genevaに数日間学習させると、どの国でも検閲をかいくぐることに成功した。
メリーランド大学の博士課程学生であるケビン・ボック氏によれば、従来の回避手段とGenevaは一線を画しているのだという。
「検閲回避のために新たな手段を開発するためには、膨大な手作業によって測定を重ね、リバースエンジニアリングを進める必要があり、創造性も求められた。だが、テストによってGenevaには検閲を自動的に回避する能力があることが分かった。Genevaは、検閲回避の自動化に向けた重要な第一歩だ」
検閲をくぐり抜けるのは危険な行為か
研究者グループは、インターネットアクセスに制限のある国々でも情報へのオープンアクセスが可能になることを期待して、Genevaのデータとコードを公開する計画だ。
だがこれだけでは不十分だ。検閲が行われている国のユーザーにしてみると、Genevaのようなツールは確かに有益だ。だが、当局が監視していることを考えれば、自分のPCにGenevaを導入したくはないだろう。
そこで研究チームは、ブロックされるようなコンテンツを検索するPC(クライアント)ではなく、ブロックされるコンテンツを提供するサーバにGenevaをデプロイする方法を探っている。これが可能になれば、WikipediaやBBC(英国放送協会)などのWebサイトをブロックしている中国やイランのような国でも、誰もがアクセスできるようになる。
「われわれはこうした素晴らしい可能性を開きたいと考えている」(レビン氏)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- BPFによるパケットトレース――C言語によるBPFプログラムの作り方、使い方
Linuxにおける利用が急速に増えている「Berkeley Packet Filter(BPF)」について、基礎から応用まで幅広く紹介する連載。今回は、最も基本となるC言語によるBPFプログラム作成方法および使用方法について。 - 「パケットフィルタリング」とは
「パケットフィルタリング」とは、通信が正しく行われるように特定のルールに基づいて検査、あるいは通信セッションの前後関係の整合性を検査し、不正だと判断した場合パケットを破棄するフィルタリング手法である。 - 「人とパケットは違う」――セキュリティの一線で活躍するエンジニアが語る「本当の信頼」とは
「ゼロトラスト」のコンセプト発案者であるPalo Alto NetworksのJohn Kindervag(ジョン・キンダーバーグ)氏。農場の仕事に比べたらITの仕事は楽と笑顔で語る同氏がセキュリティに出会い、やがてゼロトラストという考えに至ったきっかけとは何だったのか。