第786号コラム:守本 正宏 理事(株式会社FRONTEO 代表取締役社長)
題:「汎用AIモデルに関する考察」
ChatGPTは、文章で質問を入力すると、まるで人間が回答しているかのような自然な文書を生成し返答します。テキストだけではなく、表やソフトウェアのプログラムも作成してくれます。このようなAIの出現によって、汎用AIの実現に関する社会的な期待は高まる一方です。大規模モデルやスーパーコンピュータの進化、さらには量子コンピュータの出現により、汎用AIの出現は現実味を帯びてきました。
汎用AIとまではいかなくても、汎用モデルは既に出てきています。つまり、AIに学習させる教師データを用意しなくても、あらかじめ用意されたモデルで運用できるというものです。例として、メール解析などではこうしたソリューションが実装されています。
では、何でも解決できる汎用AIモデルは、現実的に使えるのか、デジタル・フォレンジックの現場で考えてみます。
デジタル・フォレンジックでは、情報漏洩、横領、会計不正、品質不正、カルテル、談合、ハラスメントなどさまざまな事案を扱います。事案ごとの教師データを大量に学習すればするほど、AIの解析精度も上がり、優れたモデルを作成できます。(残念ながら、すべての事案に一つのモデルで対応することはできません。)
しかし、それらのモデルは本当に汎用的に活用できるのでしょうか?
私の経験上、答えはNoです。汎用教師モデルについては、これまでに何度も検討し、トライしましたが、うまくいかないことがほとんどでした。その理由は、教師データ以外の解析対象となるデータ(フィールドデータ)に違いがあるからです。
企業において、文書にはそれぞれの文化や慣習が反映されます。そのため、フィールドデータの特性は微妙に、時には大きく異なります。フィールドデータの特性が異なると、すでに用意している汎用教師モデルは活用できなくなります。これは、AIがフィールドデータと見つけたいデータの特徴差異から、見つけたいデータを抽出するためです。そのため、フィールドデータが変わると、差異も変化し、この特徴を見出せなくなるのです。結果、汎用モデルを用いてもチューニングに時間を要することとなり、メリットがなくなります。大規模モデルであればあるほど、チューニングは難しく、時間もかかります。
また、デジタル・フォレンジックでは最終的には裁判官、弁護士、犯罪捜査官、監査人といった人間の判断が欠かせません。そのため、弁護士・犯罪捜査官・監査人などの専門家が教師データに基づくモデルの作成時から関与し、自ら、モデルを考察・運用し、その結果を十分に理解することが不可欠です。これを踏まえると、汎用教師モデルがなくても、各事案において都度、短時間かつ高精度で学習し、運用に移行できるAI、さらに付け加えると、専門家とAIが共同作業できるような仕組みが重要となります。
つまり、汎用教師モデルの適用は非現実的であり、AIだけですべてを解決できるということはありません。まして、高度な判断を要する専門家の仕事をAIが完全に代替することはあり得ないと考えます。
デジタル・フォレンジックでは、高度なリーガル知識と経験に基づく推論能力が必要です。AIが専門家の知識と経験に基づく思考過程を追随し、支援する技術が求められます。
【著作権は、守本氏に属します】