第204号コラム:上原 哲太郎 氏(総務省 情報通信国際戦略局
通信規格課 標準化推進官、IDF会員)
題:「デジタル画像とフォレンジック」
ご無沙汰いたしております。前回コラムを担当させていただいた際にご挨拶した通り、昨年10月から総務省に移って半年ほどが経ちました。慣れない官僚仕事ではありますが、なんとか元気にやっております。デジタル・フォレンジック研究会の理事からは退きましたが、またコラムを書かせていただく機会をいただき、感謝いたしております。
いきなり私事から始めますが、昨年末に、デジカメを買い換えました。F600EXRが型落ちになりかかっていて、2万円まで下がっていたので衝動買いしてしまいました。さらに勢いで、無線LAN付きSDカードのEye-Fiも買いまして、毎日写真を撮りためています。手軽に質の高い写真が撮れて、カメラのGPS機能により場所と時刻が記録でき、しかもEye-Fiによって自動的にパソコンとクラウドに転送され日付別に整理されているとなるとなかなか快適で、スマホで撮るのも併せるとおびただしい数の日常写真が蓄積されていくようになりました(毎日10枚前後)。こんな状況になっておられる方は多いのではないでしょうか?
このようにライフログデータとして蓄積されたデジタル画像は、人の行動の記録を多く残しているという意味でフォレンジックの対象としての重要性は増してくるでしょう。そこで今回は、デジタル画像をフォレンジックの対象とする際の技術的課題について、思いつくまま五月雨に並べてみます。
(1)画像のメタデータとフォレンジック
デジタル画像ファイルには、ファイルとしてのメタデータ(タイムスタンプ等)以外に、固有のメタデータが格納されています。これは、画像ファイル形式として広く使われているJPEGファイル形式(ISO/IEC10918-1)が拡張性を持つことを利用して、Exifという形式で書かれていますが、この中にさまざまな情報を格納できます。特に、カメラのメーカ名・機種名やGPSなどによる位置情報(いわゆるGeoTag=ジオタグ)は重要ですし、パソコン等で後処理した場合にはそのソフトウェア名などが入ることもあります。
ただ、これらのメタデータについては逆に、ツールなどを用いて簡単に書き換え=詐称できることから、そのことに注意して利用する必要があります。詐称した者が「うかつ」であれば、Exif内の時刻データとファイル自体のタイムスタンプに矛盾が生じていたりするなどのことから、その書き換えに気づくかもしれませんが、ファイル単体から得られる証跡を鵜呑みにするのは一般に難しいかも知れません。
(2)情報ハイディング
ある種のデータ内に別のデータをこっそり隠しておく技術をステガノグラフィー(Steganography)といいます。応用として電子透かし(Digital Fingerprinting)というものもありますが、これはあくまで隠されたデータは元のデータに付随させる情報(データの著作権者など)として不可分に扱いたい場合に使う技術であるのに対し、ステガノグラフィーは隠されたデータの側が本来利用したいデータである場合によく使われる言葉です。最近では、これらを総称して情報ハイディング(Information Hiding)と呼びます。
画像データは、情報ハイディングの対象としてはよく研究され、実用にも供されています。その手法は2種類に分けられます。まず、JPEGをはじめとしたファイルの構造を利用して、ユーザ定義データ部分などに情報を隠しておく手法です。こうすると、一見普通の画像ファイルにしか見えないのに特定のツールを使うと内部に隠されたデータが取り出せるという、特殊なファイルが作成できます。この種の情報ハイディングはよく「偽装ファイル」と呼ばれていてアングラな世界では広く使われており、著作権違反などの違法ファイルの流通サイトでよく見かけます。
一方、画像自体に情報を埋め込む技法もあります。画素の情報や画像の空間周波数成分に工夫をして隠された情報を埋め込むという、電子透かしの分野で広く使われている手法です。これは研究としては盛んに行われているのですが、埋め込むことの出来るデータの量が相対的に少なくなるため、限られた用途にしか使われていないように思います。
これらのいずれも、フォレンジックの観点からすると、「一見普通の画像ファイルに実は隠された情報はないのか」を探すことになります。前者の、ファイルの構造を利用した情報ハイディングでは少なくとも何らかの情報が埋め込まれていることは比較的容易にわかりますが、その内容は暗号化されることも多いため、その中身が取り出せるかどうかは埋め込みに利用したツールの同定が少なくとも必要になります。後者の画像自体への情報ハイディングでは検出がさらに困難ですが、研究対象として興味深いこともあり、時々その手法についての論文をみかけます。いずれにせよ、情報ハイディングに使われるツールは内外に無数にあり、フォレンジックツールがこれら全てのツールに対応するのは困難ですので、継続的な研究開発が待たれる課題であります。
(3)ツールマーク
古典的な鑑識学でいうツールマーク(Toolmark)とは、文字通り工具などが残した物理的な傷などの跡のことで、これから犯罪や不正行為に使われた道具を割り出すことができれば証跡になり得ます。有名なところでは、ライフル銃の銃身に掘られた溝が弾丸に残す傷(線条痕)が、銃の個体の特定に使えることをご存じの方もおられるでしょう。
実はデジタル画像においても、同様のことが可能な場合があります。デジタルカメラでは、CCDやCMOSといった半導体受光素子の入力に対し、複雑な画像処理を何段も重ねた上でデジタル画像ファイルを生成しています。この画像処理は画質に大きく関わりますのでカメラメーカー各社が技術を競っている部分ですが、機種によって処理の方法に「クセ」があり、その差が機種の同定につながることがあります。少なくとも、メタデータから得られた機種情報に信頼が持てないような場合においては大きな役割を果たしてくれそうです。
さらに、この技術を進めていくとカメラの機種だけでなく、個体が特定できることもわかっています。最近のデジタルカメラでは1000万を超える画素に対応した受光素子を使用していることが珍しくありませんが、これらの画素全てに不良が生じないようにするのもまた至難の業ですので、多少の不良を含む受光素子であっても製品には使われています。この場合、画像処理によって不良な画素に対応する素子からの信号はノイズとしてうまく消してしまい、人の眼では判別できなくなりますが、よく調べると画像の特定の画素周辺に常に「ノイズを消した跡」が残ることになり、これが個体の特定につながることがあります。
このようなツールマークを調べる技術は、現在のフォレンジックツールでは広く使われるには至っていないようですが、フォレンジック関係の国際学会ではその種の研究を見かけることが少なくありませんので、そのうち実用化されてくることが期待されます。
(4)画像改ざんの検出
写真の改ざん、いわゆるコラージュは銀塩写真の時代から広く見られますが、デジタル画像ではツールを用いれば驚くほど精巧なコラージュが簡単に作成できるようになっています。たとえば現在写真画像の修整や編集によく使われるアドビ社のPhotoshopでは、「コンテンツに応じた塗り」などの機能により、写真の中から特定の人物や物体を移動させたり消し去ってしまったりするような改ざんが、いとも簡単にできてしまいます。Photoshopではこの機能をPatchMatchと呼ばれる技術に基づいて実装しており、2009年にデモが公表された時には大変な衝撃を与えました。その動画は今でもYouTubeで見られますので、ご存知ない方は是非ご覧下さい。
なおPhotoshopは今年にもバージョンアップが予定されていまして、そのβ版のデモも同様にYouTubeで見られます。
ネット上ではこのようなツールを用いたコラージュ画像が沢山出回ってますので、これらを見てびっくりしたり騙されかけたりした方もおられるのではないでしょうか。
これらのコラージュは冗談で作られているうちはよいですが、法的係争の場に出されてしまうとえん罪の理由にもなりかねず、大変やっかいです。そこで、この種の画像改ざんの痕跡を検出しようという研究も盛んに行われています。まず簡単な手法は、古典的な(銀塩写真時代の)改ざん写真の鑑定と同じ技法を用いるもので、たとえば被写体ごとに当たっている光の方向の矛盾から改ざんを見つけ出したり、画像の焦点が1枚の写真の中で複数の場所に合っていることから矛盾を見つけ出したりしようとします。
これらに加えて、デジタル画像処理そのものの特性から改ざん画像を検出しようという研究も盛んです。基本的な考え方は、改ざんされた部分の輪郭にあたる部分には、周囲と整合性を取るための画像処理が集中的に行われますから、その時に生じる画像の周波数成分等の異常値を検出しようというものです。この技術もまだ広くフォレンジックツールに実装されるには至っていないでしょうが、今後重要になってくる技術であろうと思われます。
このほかにも、大量の画像の中から目的の画像を素早く見つけ出すための技術(特に顔認識の技術)や、デジタルカメラにおいて撮影後、画像の改ざんが行われなかったことを保証する技術(実用化されているものではSD-WORM)など、フォレンジックの観点から見てまだまだ研究するべきものがデジタル画像周辺には沢山転がっているような気がしています。フォレンジック関連技術ではどうしても欧米の後塵を拝している日本ではありますが、デジタルカメラの世界シェアの7割以上を占め、JPEGやExifをはじめとした画像データ標準に対して主導的な役割を担ってきた我が国は、画像データのフォレンジックに関しては逆に世界に向けて打ち出せるものを持つべきだし、研究も進めるべきなのではないかなぁ、などと、ちょっとは官僚らしいこともツラツラと考えてしまう今日この頃なのでした。
【著作権は上原氏に属します】