第531号コラム:佐々木 良一 理事 兼 顧問(東京電機大学 研究推進社会連携センター 総合研究所 特命教授 兼 サイバーセキュリティ研究所 所長)
題:「AIとセキュリティ」

1.はじめに
現在、人工知能(Artificial Intelligence:AI)が各分野で注目を浴びている。そして、AIとセキュリティ(安全性)の関係も非常に重要となってきている。AIとセキュリティの関係というとセキュリティ対策にAIを適用することだけを思い浮かべるかもしれないが、安全性を確保するためにはもっと広く検討していく必要があると考えている。

2.AIとセキュリティに関する4つの観点
AIとセキュリティに関しては次の4つの観点があると考えられる。なお、ここではAIには機械学習などの技術も含むものとする。
(a)Attack using AI(AIを利用した攻撃)
(b)Attack by AI(AI自身による攻撃)
(c)Attack to AI(AIへの攻撃)
(d)Measure using AI(AIを利用したセキュリティ対策)
以下それぞれについて説明を加える。

2.1 AIを利用した攻撃
今後、AIを利用した不正者によるサイバー攻撃は増加してくると考えられる。特に、AI機能付きのマルウェアは近い将来、確実に誕生するだろう。今後は小さな種々のAI機能付きマルウェアが侵入し、協力しながら環境に最も適した攻撃をするようになっていくのではないかと考えている。少なくとも研究レベルでは、このような動きを考慮して今後の対策を考えておくことが大切となるだろう。

2.2 AI自身による攻撃
AIが人間に及ぼす悪影響で最も大きな問題は人間を上回る能力を有するAIが誕生し将来的に人間が絶滅させられるではないかということである。

Googleの研究者のレイ・カールワイツは2045年にはAIの能力が、人間を超越するシンギュラリティが生じ、反乱すら起きるかもしれないとしている[1]。また、スティーブン・ホーキングは「人工知能の発明は人類史上最大の出来事だった。だが同時に『最後』の出来事になってしまう可能性もある」といっている[1]。このような問題を回避するためにAI研究に関し今から規制を設けておくべきであるという意見もある。しかし、多くのAI研究者は人間に対する反乱が起きる可能性は低く、過度の規制が逆にいろいろな問題を生じさせると考えている。この辺りをどうすべきかにも関心をもって見ていく必要があるだろう。

AIが人間の仕事を奪ってしまうのではないかと思っている人は多く、AIとロボットが進展することにより次のような職業はなくなっていくと予想している[2]。

「一般・経理事務員、受付係、クリーニング取次店員、建設作業員、自動車組立工、自動車塗装工、スーパー店員、タクシー運転者、宅配便配達員、電車運転士、路線バス運転者、通関士他」
一方、残る職業としては次のようなものがあるとしている。
「アートディレクター、インテリアコーディネーター、フラワーデザイナー、メイクアップアーティスト、映画監督、クラシック演奏家他」
さてどうなるのか。それでもスーパーのスーパー店員などは重宝されるのかもしれない。

2.3 AIへの攻撃
AIのためのシステムへの攻撃による問題を考えておくことも必要である。システムを動かなくするような攻撃は他のシステムに対するものと同じであるが、教師用データを意図的に偏らせ、適切でないような反応をするシステムが生じる可能性も考えておく必要がある。意図的に偏らせる方法としては、システムに不正に侵入し、データを変更する方法だけでなく、極端な意見の学習用データを正規の手順で最初から与え続けるような方法も考えられる。一例として米マイクロソフトのチャットボット「Tay」は、このような攻撃によってナチスを賛美するような回答をするようになったといわれている[3]。適切な学習データをどのように与えるかは、今後も大きな課題になっていくだろう。

2.4 AIを利用したセキュリティ対策
Google Scholarで「Cyber Security AND Artificial Intelligence」をキーワードとして検索すると2007年には1,240件だったものが2017年には8,210件と6.6倍に増加している。なお、トータルで17,700件ヒットし、「上記+Ryoichi Sasaki」で検索すると202件がヒットした。なお、これには引用や特許なども含み、うち10件弱が論文や発表原稿である。

これらの調査やWEB上の製品紹介から、次のようなセキュリティ対策のためにすでにAIが使われていることが分かった。

・「マルウェアの検出」
・「ログの監視・解析」
・「継続的な認証」
・「トラフィックの監視・解析」
・「セキュリティ診断」
・「スパムの検知」
・「情報流出」など、

AIを使ったというセキュリティ対策ツールは各社から発売されており、そのメリットがWEB上で述べられている。しかし、セキュリティ対策のためにAIを実際に利用するにあたっては、以下のような問題を解決することが望ましい[4]。しかし、これらをどのように解決したか言及しているものは少ない。

(1)AIシステムは適切に分類された大規模なデータセットを得ることが望ましいが、この分野でこのようなデータセットを入手するのは一般に困難である。特に、サイバー攻撃は時間とともに特性が変化することが多く、それぞれの期間における大量のデータの入手が必要となるが困難なことが多い。

(2)機械学習システムはいくつかのケースの誤検出を代償にして精度を高めることができる。しかし、ソフトウェアの世界では、善良なアプリケーションをいくつか誤ってブロックするアンチウイルスを許そうとせず、1%よりはるかに低い誤検出率を要求することが多い。したがって、誤検知率が十分小さくならない場合は、誤検知があっても影響を十分小さくできるような仕組みと組み合わせる必要がある。

(3)セキュリティ分野では結果が「説明可能」であることが望ましいが、ニューラルネットワークや深層学習などの高度な機械学習アルゴリズムは、人間が読むことのできる言葉で説明するのが困難な場合が多い。

3.セキュリティ対策のためのAI利用に関する執筆者らの研究
執筆者らは、以下のようなセキュリティ対策にAIを用いる研究を行ってきた。それぞれについて簡単に説明を加える。

3.1 機械学習を利用した標的型攻撃用C&Cサーバの自動判別システム
近年流行している標的型攻撃では、マルウェアに感染した後にC&Cサーバとの間で様々な通信を行う。そのため、出口対策としてC&Cサーバのブラックリストを用い、ブラックリストに載ったサーバとの通信を制限することにより、被害の発生を防止することが出来る。しかし、ブラックリストは常に古いC&C情報しか持たず、新しくC&CにされてしまったC&Cサーバにアクセスしてしまう可能性がある。そこで、C&Cサーバと通常のサーバのDNS情報やWHOIS情報などを調べ、ニューラルネットワークなどのツールを使い判別モデルを作成した。そして、この手法に実データを適用しC&Cサーバの判別を行った結果、約99.3%と高い検知率を得ることができ、有効性の見通しを得ることができた。また、攻撃者に察知されにくい情報だけを用いても98.9%の検知率を上げられることが明らかになった。ここでC&Cサーバに関する情報はVirousTotalを用いて求めた。時間経過が具体的にどのように影響を与えるかについては今後の課題である。詳しくは、文献 [5][6]などを参照願いたい。

3.2 ルールベースシステムやベイジアンネットワークを利用した知的ネットワークフォレンジックシステム
近年、企業や政府機関を対象としたサイバー攻撃の数が増加しているのはご存じのとおりである。このような組織では、標的とされた攻撃に対する対策を準備する必要があるが、支援システムの助けなしに攻撃中にこれらの手段を実行することは非常に困難である。

そこで、執筆者らは、ルールベースシステムやベイジアンネットワークなどの人工知能技術を用いて攻撃事象を推定し、攻撃対策を導くためのLIFT(Live and Intelligent Network Forensic Technologies)システムを開発した。このシステムは、収集されたログを分析し、攻撃の手がかり(兆候)を検出し、次にベイジアンネットワークを使用して、検出された手がかりから各攻撃事象の可能性を推定する。確信度が十分に大きい場合、その攻撃事象が発生していると考える。確信度が小さい場合は、LIFTシステムはログからの追加の手がかりの収集を行ったうえで同様の処理を確信度が十分大きくなるまで繰り返す。さらに、LIFTシステムは、攻撃事象からルールベースシステムにより対策項目を選定し、対策の実施をガイドしたり、自動操作を実行したりする。

著者らは、LIFTシステムのプロトタイプを開発し、このプロトタイプを過去に発生した攻撃シーケンスに適用した。その結果、LIFTは、事象を推定したり対策を正しく指示したりという目的とする機能を実現することが確認できた。ここで、機械学習ではなくルールベースシステムやベイジアンネットワークを利用したのは、異常事象に関するデータが十分得られないからである。このLIFTシステムについて詳しくは、文献[7][8]などを参照願いたい。

なお、AIを応用して事象や応急対策を明確にした後、侵入元や、侵入範囲を推定する必要があるが、ここでは機械学習などのAIを使わず、各機器のプロセスログとパケットログをOnmitsu[9]という執筆者らが開発したツールを用いて求め、それに機器間の接続情報を加えたうえで、検知アルゴリズムに基づき侵入元や、侵入範囲を推定する方法を開発している。詳しくは、文献[10][11]などを参照願いたい。アルゴリズムを用いる方法にしたのはこの方が、アルゴリズムが正しいならば見落としがなく、推定した理由の説明が容易であり、そのあと具体的対策を実施するのに適していると考えたからである。このようにAIを用いる方法と、アルゴリズムを用いる方法を組み合わせて利用するというアプローチも有効であると考えられる。

4.AIとデジタル・フォレンジック
3.2で述べた研究はAIをデジタル・フォレンジックに適用したものであるが、それ以外にも、デジタル・フォレンジックにAIを用いる製品や研究は少なくない。

すでに広く利用されているのがe-DiscoveryへのAIの適用である。e-Discoveryの中心的な作業として、弁護士を中心に行う証拠の選定がある。ローカルのPCやサーバに蓄積された電子メールや各種ビジネス文書といった大量の非構造化データから裁判に関連するデータを閲覧(Review)によって選定する必要がある。この作業は弁護士が行ってきたため数十億円の金がかかることが少なくなかったと言われている。

このReview過程を、AIの一分野である機械学習を用いることにより、費用と時間を短縮しようというものである。この過程で用いられる機械学習は教師あり学習に分類されるものであり、米国ではPredictive Codingと呼ばれることが多い。このReview過程は次の3つのステップで実施される。

1.調査:弁護士などの専門家がサンプルを仕分けする教師データの作成段階。
2.学習:人工知能が教師データから専門家の判断基準を学ぶ入力段階。
3.スコア付け:学んだ判断軸に則り、人工知能が未知のデータに対してスコア付けを行う出力段階。

このような機能を持つ機械学習用ツールを開発した株式会社FRONTEOの適用実験によると、AIを用いることにより1時間当たりの処理ドキュメント数が3倍に、10万ドキュメントあたりの費用が5分の1になったという[12]。

5.今後の展開
以上見てきたようにセキュリティ対策に関しても、データが十分あり、AI技術の1つである機械学習が使えるような対象は現在でも有効であり、今後も適用が増えていくと考えられる。ただし、攻撃方法は動的に変化するので適切な対応が必要となる。また、データが十分ない対象に対しては今後さまざまな試行が必要となると考えられる。いずれにしても、AIとセキュリティに関しては重要なテーマであり上述した4つの観点から検討を続けていくことが大切であると考えられる。
今後は、攻撃側と守備側に分かれてAI同士がお互いに戦い続けるようになっていくのだから。

参考文献
[1] https://ja.wikipedia.org/wiki/ 人工知能(2018年9月3日確認)

[2] https://allabout.co.jp/gm/gc/471185/ (2018年9月3日確認)

[3] https://news.yahoo.co.jp/byline/endohomare/20170806-00074210/ (2018年9月3日確認)

[4] https://blog.avast.com/jp/why-security-is-a-unique-challenge-for-ai-jp (2018年9月3日確認)

[5]MASAHIRO KUYAMA,YOSHIO KAKIZAKI,RYOICHI SASAKI,“Method for detecting a malicious domain by using only well-known information”International Journal of Cyber-Security and Digital Forensics (IJCSDF) 5(4): 166-174

[6]久山真宏、柿崎淑郎、佐々木良一「攻撃者に察知されにくい情報を用いたC&C  サーバの検知手法の提案と評価」情報処理学会論文誌,Vol.58,No.9,pp.1410-1418,2017

[7]佐々木良一、八槙博史「標的型攻撃に対する知的ネットワークフォレンジックシステムLIFTの開発(その3)-今後の研究構想-」情報処理学会 DICOMO2015

[8]Ryoichi Sasaki et al.“Development and Evaluation of Intelligent Network Forensic System LIFT Using Bayesian Network for Targeted Attack Detection and Prevention”International Journal of Cyber-Security and Digital Forensics (IJCSDF) 7(4): pp.344-353,2018(to appear)

[9]三村聡志、佐々木良一「プロセス情報と関連づけた通信情報保全手法の提案」,情報処理学会論文誌,Vol.57,No.9,pp.1944-1953(2016).

[10]佐藤信、 杉本暁彦、林直樹、磯部義明、佐々木良一:マルウェアによるネットワーク内の挙動を利用した標的型攻撃における感染経路検知ツールの開発と評価,情報処理学会論文誌,Vol.58,No.2,pp.366-374(2017).

[11]島川貴裕、佐藤信、佐々木良一、「標準型攻撃に対する知的ネットワークフォレンジクスLIFTの開発と機能拡張(その3)-侵入源と波及範囲の推定-」情報処理学会 CSS2017

[12]武田秀樹「人工知能による専門家の判断サポート ―現状における人工知能のビジネス応用の実際-」情報処,Vol.5,No.11,Nov.2015,pp.1088-1094

【著作権は、佐々木氏に属します】