取組み内容

研究室および講義で注力しているのはデータサイエンスおよびAIの説明可能性である。現実社会の活動はデータサイエンス・AIの技術を求めている。ニーズは分けると4個に分かれる。一つ目は画像(非構造:構造をもたない多数の画素)の識別を高い精度で行う。二つ目は画像であっても医用画像のようにユーザー側が医師・医療従事者であり画像についての一定の知識をもつ。三個目は一般的にはデータサイエンスの主力技術であるディープラーニング(深層学習)が効果的でない構造化データ(金融機関など用いられる表形式のデータ)である。この3.は筆者の研究室で研究を鋭意進めている。一般に、非構造化データの急増が注目され全体の70%と言わるが残りの30%に対してディープラーニング技術が適用が遅れておりデータサイエンス・AIの波及効果が限定されている。最後に4個目としてChatGPTに代表される生成AIの社会への応用が今後の日本のデータサイエンス・AIの普及と新たな社会基盤の構築に影響を与える。現状のChatGPTは問題点を抱えるが最も大きい事は得られた答をどの様に導いたかを説明出来ない点にある。4.についても研究室で波及効果の大きい高信頼性生成AIの研究を進めている。

データサイエンスのデファクトスタンダードであるXGBoost(勾配ブースティング決定木)とルール抽出技術の対応