コラム第909号:「AIにおける方程式」

第909号コラム:守本 正宏 理事(株式会社FRONTEO 代表取締役社長)
題:AIにおける方程式

 12月の初旬にワシントンDCに出張に行きました。弊社のDrug Discovery事業のプロモーションの準備を行うためです。その出張で、弊社のChief Science Officer Dr.豊柴が米国でプレゼンするために用意した資料の中に、初めて“方程式”という単語がでてきました。“方程式”?に食いついた私は、方程式について質問し、その重要性に初めて気づくことができました。このコラムでは私に驚きと感動を与えた“トヨシバ方程式”について記します。

 医師の診断、創薬研究などの専門性の高い分野では、誰も(専門家以外の人)知らない事、気づいていない事を発見する必要があります。さらに新しいだけではダメで、それが専門家が納得できる仮説ができていることも必須です。この条件を満たすためには、仮説的推論を可能にする必要があります。たとえば、子供が新しい言葉に出会ったときに、辞書を使わなくても、大人や友人と会話をしているうちにだんだん覚えていく理論と同じです。

 一般的に、自然言語処理では、言語をベクトル化します。緻密な計算をするためには、次元は数百次元にもなり、膨大な計算能力が必要になります。
 そこでDr.豊柴は、スーパーコンピューターがない環境で、CPUだけで、この仮説推論を実現するために、悩み抜いた結果、トヨシバ方程式を作り上げました。トヨシバ方程式は、数百次元のベクトル計算をCPUで行う事ができ、かつ、単語と単語、文書と文書、文書と単語といった、あらゆる組み合わせでも、文字数制限なしで計算可能です。しかも仮説的推論を実現しました。
 それに対して、生成AIを含めた、トランスフォーマーを基盤とした手法では、ベクトル化であまりにも計算量が大きくなるために、サブワードを活用しました。言い換えると、計算量を少なくするために文字を記号に変えてしまったのです。それによって、仮説推論は不可能になり、さらに、方程式ではなく、最適解を求めようとする方式ために、答えは条件次第で変わってきます。(そのため、生成AIで作られた薬はFDAでは承認が難しくなっています。)そして、最適解を求める方式だとやはり計算量は膨大になります。
 彼らは、方程式がないために、仮説的推論は絶対にできないだけでなく、解答も不安定で、かつ計算量はやはり膨大になります。膨大になるために、計算時の文字数制限もあります。それに対応するためにGPUを使い、パワー不足を補う必要があります。
 しかし、トヨシバ方程式があると、方程式なので計算量は少なく、答えも不変となり、薬の開発にも適しています。
 トヨシバ方程式がないと、仮説推論ができません。それは何を意味しているか?
 そのことにより、人が知っている情報の中から出る事はできません。なぜなら、仮説推論こそが、新しい発見ができる唯一の方法だからです。例えば、病気の原因となる標的分子は2万個あると言われていますが、研究されているのは、1000個しかありません。それは人は確証バイアスと呼ばれる特性により、自分の発見する範囲を自ら限界をつくっています。そして、生成AIは確率で探してくるので、研究が多くされている1000個の範囲を出る事はできません。
 本来、人間の知能を超えるために作られたAIが実は、絶対に1000個の範囲から出る事ができなくなっています。データがいっぱい蓄積されたら、超知能が実現するということもあり得ません。データの蓄積は情報の蓄積にはならないのです。
 それらは全てトヨシバ方程式がないからなのです。

 生成AIは一般的な業務の効率化を実現します。しかし、新しい発見はできません。人類の課題を解決するためには、仮説的推論による新しい発見で、それをサポートするAIにはトヨシバ方程式がないと実現しません。

 2025年は日本人が二人もノーベル賞を授賞しましたが、やがてDr.豊柴がトヨシバ方程式でノーベル賞を受賞する日がやがてくると信じております。

【著作権は、守本氏に属します】