機械学習/AIとセキュリティの組み合わせが秘める可能性と2つの課題:特集:「AI」は企業のセキュリティ対策に必要なのか、どう変革するのか(1)
機械学習や人工知能(AI)がビジネスを変革する昨今、セキュリティの分野でもAIの活用が進んでいる。企業がセキュリティ対策にAIを取り入れるために必要なことは何か。AIでセキュリティ対策の何が変わるのか。セキュリティエンジニアは、AIとどう向き合うべきなのか。
大量のデータを分析して特徴点を見いだし、何らかの識別を行う仕組み(識別器)を作り出す「機械学習」(ML)やそれを生かした人工知能(AI)技術。これらをうまく活用すれば、より良いセキュリティ対策を実現できるのではないか――そんなコンセプトで研究を進め、ML/AIを活用した不正検知システムを提供するスタートアップ企業、ChillStackを立ち上げた伊東道明氏に、企業のセキュリティ対策にAIが求められる背景や、MLとセキュリティの掛け合わせが秘める可能性について尋ねた。
機械学習とセキュリティ、掛け合わせの相性が良い理由
伊東氏は法政大学でML関連の研究室に所属しているが、入学当初からセキュリティに興味を持ち、CTF(Capture The Flag)や「セキュリティ・キャンプ」などの場に参加しながら技術を磨いてきた。「ずっとセキュリティ関連の勉強をやってきたが、3年生になる時、新しいことを学んでセキュリティに生かせないかと考え、MLに行き着いた」そうだ。
その研究成果をセキュリティに掛け合わせ、論文にまとめたところ、「IEEE CSPA 2018」という国際学会で「Best Paper Award」を受賞するに至った。こうした経験を生かし、前述の通りML/AIとセキュリティに関する企業を設立した他、「セキュリティ・ネクストキャンプ」での講師も務めている。
さて、なぜセキュリティという分野とML/AIの相性が良いのだろうか。「セキュリティのシステムは、パターンマッチングに基づくものが多いんですよ。『こういったログは悪いものだ』『こういったものならマルウェアだ』という具合に知っているパターンを全て書き出し、マッチングして『これは悪いものだ』と判断するのですが、これだと、守る側がどうしても後手に回ってしまう現状があります」と伊東氏は説明した。
これに対しMLを活用すれば、過去のデータを基に、シグネチャベースのものよりも汎用(はんよう)的な「しきい値」を作ることができる。つまり「既存のマルウェアにちょっと手を加えただけの亜種や新しい攻撃を防げる可能性が高まるだろうなと思い、研究を進めてきました」
研究に取り組み始めて3カ月ほどたったころには、「これはいける」と手応えをつかめてきたそうだ。「スパムメールフィルターの分野でベイズ統計学が活用されてきたように、実は、MLが流行しだすはるか昔から、MLベースの技術は活用されてきたのも事実です」と伊東氏。
マルウェアの検出に始まり、アクセスログの抽出や分析、さらには悪質なユーザーの検知など、セキュリティにおけるML/AIの応用範囲は幅広く考えられるし、現に不正利用/不正広告対策の分野での研究も盛んだ。「暴言を吐くユーザーを検出しようとして特定の単語の書き込みを禁止しても、相手はそれをかいくぐってきます。そんなふうにパターンマッチングが苦手とする分野こそ、MLが得意とするところです」
逆に、パターンマッチングにはパターンマッチングならではの得意分野があり、むやみにMLを適用してもかえって処理速度が落ちてしまうこともある。「MLだから速くて安全だ、ということは絶対ありません。セキュリティの基本的な考え方は多層防御です。それぞれの技術の得意なところを生かし、組み合わせることで、最大限の力を発揮できると考えています」
あくまでML/AIは「手段」、過度な期待にまつわる誤解
ChillStackでは現在、ゲームの不正防止やチート対策にフォーカスしたサービスを展開している。顧客であるゲーム会社からログ情報を受け取り、MLを用いて分析を加えて不正な行動を見いだしていくサービスだ。
「例えば5日間ずっとぶっ通しでゲームをしているアカウントのように、一つ一つの行動を単体で見ると異常ではないけれど、ある程度の時間継続して見ていくと明らかにおかしい――そんな挙動を見つけるのにMLは有効です。この仕組みは、金融サービスなどゲーム以外の領域にも活用できると考えています」
一方で、サービスを提供するに当たってしばしば直面するのが、ML/AIに対する過剰な期待だ。「正直にいうと、『AIを使ったら、100%自動で検知できるんでしょ』みたいに言われることもあります。確かにすごい技術や研究成果が出てきているのは事実ですが、メディアで持ち上げられている華やかなイメージをそのまま不正検知やセキュリティのAIに持ってきてしまい、過度な期待が生まれてしまっているかもしれません」
そして、クラウドサービスの普及もあって、K-meansやスペクトラルクラスタリング、ディープラーニングといった、AI/MLで使われるさまざまな手法を試すのが容易になりつつあるが、一番大事なのはその「前」の段階だという。
「MLで精度を出す上で一番根幹になるところはデータです。いかにデータの量と質をそろえられるかが大事になります。そして、どのようなデータをそろえるべきか、そこからどういった特徴を抽出してどういうふうに使うかが大事で、これはサービスの性質や目的によって変わってきます」
例えばK-meansで、異常なパケットと正常なパケットの分類(クラスタリング)を行うにしても、伊東氏は「どういった特徴をどんなふうに使うか」の重要性を訴える。「尺度の異なるデータの尺度を、標準化などの前処理で適切に合わせていかないといけません。そこを怠ると意味不明な結果が出てきてしまいます。何をやりたいのかに照らし合わせてどういったデータを使うのかを確認し、ロジックを組み込んでいくことが大切です」
そしてあらためて「AI/MLは、使う前に目的を適切に設定することが大事になってきます。もし同じ課題がパターンマッチングで解決できるなら、その方が処理速度が速いので、MLでやる必要はないでしょう。あくまで手段の一つであり、目的ありきで考えるべきです」と強調した。
セキュリティ運用の現場で続く人手不足の解消に寄与
ただ、人手不足の解消という意味からも、この先ML/AIがセキュリティソリューションに組み込まれる流れは拡大するだろうという。汎用的なWindows OSやシェアの高いCMSを保護する形ならば、個別の環境に合わせたデータ収集、チューニングの手間が省けるため、比較的活用は容易だとみているそうだ。エンドポイント保護の製品に関しては「AI」活用をうたったものが多々登場している。
別の活用領域としては、SOC(Security Operation Center)によるログ監視がある。人がずっとアラートログを眺め、異常なパターンかどうかを照らし合わせていくのは、「そもそも作業量が尋常ではないし、確実にAIでサポートできると思っています」と伊東氏は述べた。
「ずっとログを監視し、アラートを精査するSOCの業務にMLを導入することで、『ログのこの箇所が本当にまずいアラートだ』と判断を下せるような付加価値を加えたり、アラートの精度向上を実現したりと、人手不足の解消や業務効率化に利用するケースが多くなっています」
これに関連して、「なぜ異常と判断したのか」の根拠や理由を可視化したいという要望も高まっており、関連する研究が進んでいるそうだ。
「世の中には、大量のログから怪しい部分をさっと特定できるすごいスキルを備えたセキュリティ専門家もいますが、それと同じスキルを持った人を数十万人単位で育成できるかどうかには疑問が残ります。こうした知見やスキルに汎用性を持たせ、いかに自動化できるかがMLの役割になってくると思います。データ量が増える一方で人手は少なく、このままギャップが拡大していくと、MLや自動化を取り入れないといけないという課題が明確化してくるでしょう」
一方、セキュリティの観点からデータを活用、分析する際には「データに個人情報が含まれることが多いため、利用目的が規約に明記されていないと扱いが非常に難しいところがあるし、データ管理の仕方も課題となるでしょう」と、伊東氏は検討すべき事柄が残っていることを指摘した。
MLとセキュリティを取り巻く、これからの2つの課題
さらに、この先のMLとセキュリティの関わり合いに関して、伊東氏が懸念することは2つあるという。
1つ目は、ML/AIが普及するにつれて、それを狙った攻撃も増加してくる恐れがあることだ。
「データ汚染や入力データにノイズを加えたり、モデル自体を盗んだりするなど、ML/AI自体を攻撃する手法が出てきています。また、ML/AIを利用した攻撃として、ユーザー認証に用いられるCAPTCHAを破るために画像/文字認識技術を活用したり、マルウェア検知をかいくぐるために強化学習を重ねてマルウェアを進化させたりといった手法が報告されています。今や、MLの基礎知識は知っていて当たり前になりつつありますし、利用しやすい環境が整っています。防御側がどんどんML/AIを用いてセキュリティを強化するのにつれて、攻撃側もそれを活用し、自動化してくるでしょう。ML/AIでもまさに“セキュリティのいたちごっこ”は始まりつつあります。この課題への対策が急務です」
2つ目は、こうした動向を理解し、ML/AIとセキュリティの双方の分野にまたがる知見を持つ技術者/研究者が、日本にはまだまだ少ないことだ。
「AIを守るにはAIを知らないと守れません。となると、セキュリティエンジニアもAIに関する基本的な知識を身に付けないといけないと思います」
データ分析やデータサイエンティストの領域からセキュリティに幅を広げていく動きにも期待したいが、問題は、そうした技術を持つ人材の海外流出が盛んなことだ。伊東氏はこれについても一言もの申したいという。
「最近、高い報酬でAI人材を雇おうとする日本企業の動きが話題になりました。けれど、こうした凄腕の人たちが高い給与だけで『日本企業で働きたい』と考えるかというと、ちょっと違うと思います。私の周りにいるすごい人たちを見ていると、彼らはもっともっと腕を磨きたいと思っていますし、自分だけでなく周りにいるすごい人たちと一緒に、楽しく働きたいというモチベーションが大きいと思います。お金を出して、それだけで引き止められるわけはありません」
日本企業が本当に人材を引き止めたいならば、給料アップは最初のスタートライン。その上で、最先端の技術を吸収しながら、さらに成長していける環境を用意できるかどうか、ということになりそうだ。
特集:「AI」は企業のセキュリティ対策に必要なのか、どう変革するのか
機械学習や人工知能(AI)がビジネスを変革する昨今、セキュリティの分野でもAIの活用が進んでいる。複雑化、多様化するサイバー攻撃から資産を守る企業側はもちろん、攻撃側もAIを活用してくる。さらに、企業が開発したAIモデルを狙った攻撃も増えつつある。攻撃側がAIを使うなら、防御側もさらなるAI活用で対抗することも考えなければならない上に、そもそもAIを守るにはAIを知らないと守れない――では、企業がセキュリティ対策にAIを取り入れるために必要なことは何か。AIでセキュリティ対策の何が変わるのか。セキュリティエンジニアは、AIとどう向き合うべきなのか。本特集では、そのヒントをお届けする。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- セキュリティ対策に数学の力を――機械学習は先行防御の夢を見るか?
どうしても攻撃者の後手に回りがちなセキュリティ対策。ここに機械学習を活用することで、先手を打った対策を実現できないか――そんな取り組みが始まろうとしている。 - 「AIアシスタント」「ドローン」「スマート玩具」にもセキュリティ対策を――McAfeeが「最もハッキングされやすいギフト一覧」を発表
McAfeeは、2017年版「最もハッキングされやすいギフト一覧」を発表。「ノートPC」などのIT機器の他、「ドローン」「AIスピーカー」「インターネットに接続可能な玩具」などが上位に挙げられた。 - AIで複雑化するサイバー攻撃、対抗できるのもまたAIか、それとも人か
ランサムウェア「WannaCry」のインパクトが記憶に新しい中、ウクライナやロシアを中心に感染を広げた「NotPetya」が登場した直後の開催となった、2017年6月の@ITセキュリティセミナー。複雑化するサイバー攻撃の現状、AI(人工知能)/機械学習、自動化、データ、人や組織体制に関するセッションを中心にレポートする。