第54号コラム: 須川 賢洋 理事(新潟大学 法学部 法政コミュニケーション学科 助教)
題:「ところ(分野)変われば定義も変わる」
先日「第1回 研究・教育のためのデータ連携ワークショップ」というイベントに出席しました(http://www.nii.ac.jp/index.php?action=pages_view_main&page_id=653 ※リンク切れ)。国立情報学研究所が主催したこのワークショップの目的はずばり、「専門領域を超えたデータの連携をいかに行うか?」というものです。企画段階からこのワークショップに関する相談を受けていたのですが、当初の予想以上に大きなテーマであり、異なる専門分野間で研究データを共有していくためには様々な課題があることを改めて感じさせられました。
このWSで私に与えられたテーマは「法的な視点から”データ”という概念を整理して欲しい」というものでした。今回のコラムでは、データという言葉がいかに多種多様な使われ方をしているかということをこのWSの内容を紹介しながら記すとともに、「法的にはデータとはどう定義されているのか?」ということを述べてみたいと思います。
私の話した内容、つまりデータの法的な定義は本稿の後段で記すことにして、まずは「様々な分野で”データ”をどのように捉えているのか?」ということを少し紹介してみたいと思います。
単に「データ」と言っても、デジタル化された電子情報を指す場合もあれば、紙に書かれたアンケートの集計情報を指す場合もあり、人によっては文献や図録等の通常は「コンテンツ」呼んでいるものをデータと呼ぶ場合もあります。
ビジネスの現場に身を置かれている人の中には「コンテンツ:利用目的を限定して対価を払って購入し商品として再販するもの。データ:それだけではビジネスにならないが、研究素材として購入し自由に活用できるもの」という分け方をされる人もいらっしゃいました。
またデジタル・フォレンジックの世界ではおなじみのメタデータもデータであり、データの中には制御符号としてのものも存在することになります。そして動画であろうが音楽であろうが導管(ネットワーク上)の中を流れる時は、どんな情報もデータいう言葉に一時的に置き換えられ「データ量」「データの流入」といった使われ方をします。
一方、データの性質という観点から論じても、研究分野が異なる人々の話は、私がデータという言葉に普段感じていたものとはまったく違う感覚をもたらしてくれました。例えば自然科学や社会科学の分野では「データにはブレや変動が殆ど無くピンスポットに一点を指し示すものである」という感覚が一般的ですが、歴史学者の人が言う「データと称しても、非常にブレ幅の大きいものがある」という発言には今更ですが肯いてしまいました。確かに一つの歴史的資料が発見されても、それは「江戸時代前期のもの」という表現しかできないわけです。江戸前期と後期の境目は非常に幅のあるもので本来はっきりと特定できるものではありません。しかし「この江戸”前期”という資料といえども、コンピュータ上にデータベースを作って時系列で整理する際には、どこかの年度をもって江戸時代を前期と後期に分けざるをえず、その区切りを何年に設定するかで後のアウトプットがまったく異なるものになる」との説明でした。
また、「研究分野によっては鞄の隅に入れてこっそりと持ち出したデータを基に研究を行うこともある」という話もありました。確かに、日本では当たり前のように書店に売られている情報でも国によっては自国民にさえ公にすることを禁止している類の情報は多くあります。コンプライアンスが当たり前という前提でいる我々には、アンダーグランドな方法によって入手したデータが研究に使えるものになるということ自体がある種の驚きになります。もちろんそういった情報は、発表の過程で相手方に迷惑を掛けないように言わば”データのロンダリング”が行われているわけでして、こういった手法自体は、デジタル・フォレンジックの分野にも逆説的に応用が可能なのかもしれません。
このように当然と言えば当然なのですが、「データ」と一言で言っても分野ごとに様々な使われた方をしています。では、法律上はデータとはどのようなものなのでしょうか?調べてみたのですが、データという語を条文中に含む法律は現在18件あります。政令や施行細則などまで含めると218件がヒットします。
しかしながら、これらの法律の中にデータという言葉の定義を正面から扱っているものは実はありません。
一方で「コンテンツ」という語の定義ですが、これは法律の中にあります。2004年に制定された「コンテンツの創造、保護及び活用の促進に関する法律」の第2条がまさにそれで、『この法律において「コンテンツ」とは、映画、音楽、演劇、文芸、写真、漫画、アニメーション、コンピュータゲームその他の文字、図形、色彩、音声、動作若しくは映像若しくはこれらを組み合わせたもの又はこれらに係る情報を電子計算機を介して提供するためのプログラム(電子計算機に対する指令であって、一の結果を得ることができるように組み合わせたものをいう。)であって、人間の創造的活動により生み出されるもののうち、教養又は娯楽の範囲に属するものをいう。』となっています。
法律においてデータをもっとも端的に扱っているものが刑法です。刑法ではデータではなく「電磁的記録」という言葉を使い、その7条の2にて『「電磁的記録」とは、電子的方式、磁気的方式その他人の知覚によっては認識することができない方式で作られる記録であって、電子計算機による情報処理の用に供されるものをいう。』と定義しています。この記述によりフロッピーやハードディス上の情報だけでなく、光ディスクなどに書き込まれた情報も電磁的記録として位置づけられることになります。一方で、昔なつかしいパンチカードは人の近くによって認識できるものなので電磁的記録とは見なされないと されています。
では他の法律で登場するデータという語句はどのような意味合いで使われているのかを、身近な法律を二つほど例に見ていくことにします。
まず「データベース」という言葉が法律にしばしば登場します。著作権法にはデータベースとは『論文、数値、図形その他の情報の集合物であって、それらの情報を電子計算機を用いて検索することができるように体系的に構成したものをいう。』と定義されています(2条1項10の3号)。つまり著作権法に言うデータとは前段部分の「論文、数値、図形その他の情報」だということになるでしょう。この場合、データベースを構成する基の情報自体が著作物であるか否かは著作権法は問うてはいません。それは同法が保護するのは各データではなく、あくまでもデータベースとしての『情報の選択又は体系的な構成によって創作性を有する』部分だからです(同法12条の2)。また知財の用語で「ファクトデータ」という言い方をする、単なる気象統計や株価指数などはそもそも著作物ではないので、著作権法上の保護は及びません。結果、ファクトデータを集めて単に全文検索によって情報を得るタイプのデータベースは「創作性を有しないデータベース」となり、著作権法による保護は一切受けられないことになります。
最後におなじみの「個人情報保護法」上で扱われるデータについて紹介しておくと、これは皆さんも聞き馴染んでいるとおり「個人データ」「保有個人データ」という言葉が同法には存在します。『個人情報データベース等を構成する個人情報』が個人データの定義であり(2条4項)、『「保有個人データ」とは、個人情報取扱事業者が、開示、内容の訂正、追加又は削除、利用の停止、消去及び第三者への提供の停止を行うことのできる権限を有する個人データであって、その存否が明らかになることにより公益その他の利益が害されるものとして政令で定めるもの又は一年以内の政令で定める期間以内に消去することとなるもの以外のもの』です(2条5項)。つまりは個人データのうち六ヶ月以上にわたって保持されるものが保有個人データです。個人情報保護法では、個人情報取扱事業者に対して「個人情報」→「個人データ」→「保有個人データ」という範囲毎にそれぞれの規制レベルを設定するために、データという用語を使っているわけです。
ざっと見てきたように、情報用語のもっとも基本的な言葉である「データ」という言葉一つ取っても非常に多種多様な使われ方がされてことが分かります。デジタル・フォレンジックの分野におけるデータとはどう位置づければ良いのか?このこともまた、今後の研究会の中で皆様と一緒に考えていけたらと思っております。
【著作権は須川氏に属します】