第363号コラム:絹川 博之 理事(東京電機大学未来科学部情報メディア学科 教授、
                                      「日本語処理解析性能評価」分科会 主査)
題:「新任理事として挨拶申しあげます」

今年度から、本研究会の理事に就任いたしました「日本語処理解析性能評価」分科会主査の絹川博之(きぬかわ ひろし)と申します。

私が、本研究会に関わることになりましたのは、本研究会による改訂版デジタル・フォレンジック事典の出版に際して、2013年佐々木会長から「デジタル・フォレンジックのための自然言語処理技術」なる項の執筆依頼を受けたことが最初でした。私自身はコンピュータメーカに就職した1970年から日本語処理、情報検索、文書処理に関する研究開発に従事してまいりましたが、デジタル・フォレンジックは、自然言語処理の新たな適用分野と考え、執筆させていただきました。

次に2014年初頭、以下の理由で、本研究会として「日本語処理解析性能評価」分科会を発足すべく、本研究会の佐々木会長から、検討依頼を受けることとなりました。すなわち、デジタル・フォレンジックやeディスカバリを用途とする検索・解析ツールに関し、海外で開発されたものが多く、日本国内での使用時に、日本語への対応が不明で、下記のような問題が発生しています。
・検索モレがあり、重要証拠ファイルの不検出
・文字化けの発生で、内容の確認不可
・どこまで日本語処理対応しているか不明確
・日本語処理の精度の信頼度に課題
・日本語処理対応の定義が不明確

これらのことへの対処のため、「日本語処理解析性能評価」分科会を、下記の目的で設立することになりました。
・デジタル・フォレンジック や eディスカバリ の対象となる日本語情報に対する処理解析性能を評価するための有効な指標を作成し、客観的な評価の実施を可能とする
・ツール提供企業の技術進歩を促し、デジタル・フォレンジック技術の日本国内でのさらなる発展に寄与する。

野﨑周作氏((株)UBIC)、白井喜勝氏((株)UBIC)、事務局長丸谷俊博氏と私の4名で2014年2月に検討を開始し、同年7月まで、日本語処理評価WGを6回実施し、2014年8月に、「日本語処理解析性能評価」分科会を発足いたしました。野﨑氏、白井氏には、本分科会の幹事に就任していただきました。

「日本語処理解析性能評価」分科会の2014年度は、5回開催し、2つのWGにて、(1)文字コード、(2)アプリケーション、(3)基本検索、(4)アドバンス検索、(5)解析速度、評価用データの作成・収集の基本的な考え方、評価対象について、審議検討し、評価項目を決定いたしました。

検討審議に際しては、本研究会オブザーバーの方々からなるアドバイザグループを構成し、ユーザの立場から、有益なご意見を頂戴いたしました。

評価用データにつきましては、①著作権のクリア、②正解データが作成できること、③評価参加者が納得できる客観性の保持の三点を満たすことが必要と考えております。この観点から、第11期第6回理事会において、著書の承認を前提に、本研究会のメルマガコラムを使用することを承認いただきました。

2015年度は、日本語処理解析性能評価委員会の設置準備として、
・評価の実行を目的
・本委員会の役割の明確化
・委員の募集要項の作成
・委員募集の実施し、本委員会の立上げ
を実施する予定です。

私が、本研究会に入会いたしましたのは、上記の経緯により、2014年です。本分科会の幹事、参加会員の皆様のご支援ご協力により、さらに充実した分科会となるよう、そして、IDFのさらなる発展に寄与できるよう努力してまいりますので、よろしくお願い申し上げます。

【著作権は、絹川氏に属します】