第616号コラム:櫻庭 信之 理事(シティユーワ法律事務所 パートナー弁護士)
題:「人工知能TARの最新判例にみる確立した法原則」
新型コロナが世界中で猛威を振るう中、アメリカでは、カリフォルニア州消費者プライバシー法(CCPA)の施行に伴う多数の集団訴訟の提起が話題になっています。
本コラムでは、注目を集めるそうした裁判ではなく、カンザス連邦地裁が、2020年4月、当たり前のように下したTAR(Technology Assisted Review)の決定とこれまでのTARを巡るアメリカ法曹界の動きをご紹介します。
航空機部品メーカー大手のスピリット・エアロシステムズ社(「スピリット社」)が、CEO(「元CEO」)が同社を退職した後競業避止義務に反したことを理由に退職給付を控えるなどしたため、元CEOはスピリット社に金銭の支払い等を求めてカンザス連邦地裁に提訴した。元CEOの取引先のビジネスが、禁じられていたスピリット社のビジネスと同じかどうかが争点となり、元CEOはスピリット社に電子的保存情報(ESI)を開示するよう申し立てた。
当初、元CEOは、数多くのキーワードを提示して手作業の検索を求めたが、関連性のある証拠のヒット率は平均で5%と悪かった。元CEOの要求どおり何度か繰り返してもうまくいかないため、方針を変え、30万件をこえるドキュメントセットに対しTARを使うことに切り替えた。ヒット率の目標は85%である。スピリット社は、CAL(継続的能動学習)を実施し、高いランクからレヴューを行い、85%の再現(リコール)率に達した後関連ドキュメントの提出をやめた。これに対し、元CEOはスピリット社に残りのTARドキュメントの提出を求めた。
再現率とは、全対象データの中に含まれる関連性のあるデータの総数に対し、TARを活用して正しく検出された関連性のあるデータの数の割合のことをいう。再現率は、トレードオフの関係にある適合率(精度:関連性あるとしてTARが検出した総数のうち的中した割合)と並び、機械学習の重要な評価指標であり、裁判上しばしば論争になる。
裁判所は、ダシルバムーア事件(後記)の判例やガイドラインなどを引用してTARの有効性を認め、多くの場合再現率は75-85%が適当とされていること(後述のポケットガイドは、60%でも適当な場合があることを示唆。)、連邦民訴規則も完璧(100%)を求めていないことなどを判示して、残りのTARドキュメントの提出を求める申立てを却下した。
裁判所がTARの使用を最初に承認したのは、2012年のニューヨーク南部地区連邦地裁ペック判事によるダシルバムーア裁判の決定である。この決定は、前年に発表されたグロスマン弁護士とコーマック教授の「eディスカバリのTechnology-Assisted Review は、人の手による網羅的なレヴューよりも効果的で、かつ効率的にできる。」と題する論文を有力な根拠とした。
ウオータールー大学らの実験によると、TARはドキュメント全体のたった1.9%の人間のレヴューのみを要し、手作業による網羅的なレビューの50倍を超える節約となった。この実験結果を踏まえ、グロスマンらは、TARは人の手によるレヴューよりもはるかに少ない労力で、より正確な結果を生み出すことができ、実際にそうである、と結論付けた。論文は最後に、「将来の研究では、TARが人の手によるレヴューを改良できる否か、ではなく、どのTARであれば人の手によるレヴューを最も改良できるか、に取り組むことになるかもしれない」と締めくくる。センセーショナルな論文であったが、末尾の予言は、すぐに現実となる。
ペック判事は、ダシルバムーアの決定で、人の手による網羅的なレヴューの欠点をいくつか指摘する。その1つは、弁護士がするキーワード選定の愚かさである。多くの裁判で、有益な証拠を提出するのに相手方がどんなカードを持っているかも知らないまま弁護士がキーワードを推測するあり様は、まるで子供が遊ぶゴー・フィッシュ(ババ抜きに似たカード遊び)と同じだ、と批判する。
考えてみれば明らかだが、賄賂(わいろ)の証拠を見つけるために、キーワードを「賄賂」にして検索してもヒットするはずはない。アーモンドとかピーナッツくらいの隠語は普通使われているであろう。ただ判事は、TARは魔法ではないとも釘を刺し、TARを義務付けることはしなかった。大切なのは、人とマシーンの相互作用であり、双方弁護士間の協力である。ブラックボックスはあるが、ブラックボックスがもたらす相手方と裁判所の不安を和らげるのは「透明性」である、と。
この決定後全米でTARを承認する決定が相次ぎ、たとえばネブラスカ連邦地裁は、必要に応じTAR(プレディクティブ・コーディング)などの検索コードを作るために、当事者はディスカバリの早い段階でコンピュータ・フォレンジックの専門家に相談すべきだと判示する。ダシルバムーアからわずか3年後、ペック判事は、今度はリオティントの裁判において、提出当事者がTARの使用を望んだときに裁判所がそれを許すことは、今や「ブラックレター法」である、と宣言した。ブラックレターとは書体の1つ(ゴシックともいう)であり、ブラックレター法は文字を印刷して制文法にした法律をさす。転じて、「確立した法原則」になることを意味する。以来、TARの活用はブラックレター法であるとする上記の判示は、ダシルバムーアの決定とともに多くの決定で引用され、冒頭のスピリット社の決定でも引用されている。
2017年になると、セドナ会議は、グロスマンを編集長とし、オブザーバーにペック判事を迎えてTARの入門書を発行した。同じ年、連邦司法センター(日本でいう司法研修所のような組織)から、TARに精通しない裁判官でも議論ができるように裁判官用のポケットガイドが発行された。このポケットガイドは圧巻であり、裁判官が初期段階で簡単に決定を発令できるようにひな型まで付けている。
このひな型を使えば、当事者名・裁判所名等の形式を補充するほかは、4か所ある空欄(日数と人数)に数字を埋めるだけで裁判所の決定書が完成する。ポケットガイドは、TARには平均的な弁護士の能力を超える問題もあり、裁判官は専門家からの教えが必要と思うだろうともいう。
EDRM/デューク大学ロースクールのメンバーらがガイドライン作りのために発起し、15名の連邦判事と75から100名の実務家、専門家ら参加の会議なども経て、2019年、TARガイドラインが発表された。ガイドラインは序文で、世界の著名な法律事務所や司法省、証券取引委員会、IRSを含む複数の大規模政府機関が、大量のドキュメントの処理にTARの有用性と価値を認めている、重要なことに、裁判所がTARの活用を無効と判断したとの報告はない、と述べる。
ダシルバムーアに始まる判例形成のスピードはまさに驚異である。先端技術の進化と変化はあまりに速く、司法の事後審査を待っていたのでは紛争解決が間に合わず、人力のみでは費用と労力の大きな無駄を生む。かつては、たしかに経験豊富なリティゲーター(訴訟専門弁護士)の腕に勝る精度はほかにはなかった。しかし、その後データは膨大になりすぎて、人間がレヴューできる量をはるかに超えるケースが現れ出した。
こうしたことへの危惧を背景に、司法関係者がTARに関連する論点を洗い出し、わかりやすい解説と手順を作り、裁判所が遅れることなく、自信をもって判断を示せるように努力してきた経過がみえる。
ただ、テラバイトの補助記憶装置が誰でも手頃な値段で入手できる今、裁判に有益で的確な証拠を見つけることの難しさとこれを容易にすべき必要性はアメリカだけの話ではない。
コロナの終息がみえず、心配な日はまだしばらく続きますが、皆さまのご健康と安全をお祈りしつつ、TARについてはいったんここで終わりにします。
【著作権は、櫻庭氏に属します】