(2018年11月1日公開)

担当:松澤 等 先生
所属:統合脳機能研究センター 脳機能解析学分野

AlphaGoのその後

図1

図1 AlphaGoとLee Sedolの対局

1996-1997年にかけて行われた人工知能対人間のチェス対局で、Deep Blueという人工知能が当時の世界チャンピオンであるGarry Kasparov に勝利し、報道メディアを席巻した。当時は、チェスは持ち駒が無いなどルールが単純だから人工知能が勝つが、将棋や囲碁では、人工知能はまだまだ半世紀は人間に勝てないと言われていた。
ところが、イギリスのAI企業であるDeepMind社のAlphaGoが囲碁のLee Sedolに勝ったのはわずか19年後の2016年であった。AlphaGoはそれまでの人間の棋譜を学習させて人間より強くなったのであるが、更に2017年、Natureに発表された新しいAlphaGo Zero はそのAlphaGoと対戦して100戦全勝した。この人工知能は人間の対局データを「使用せずに」学習、訓練されており、DeepMind社の開発責任者をして、"no longer constrained by the limits of human knowledge"と言わしめた。人間の知識は「むしろ邪魔」だと言うのである。(図1)

畳み込みネットワーク

誤謬を恐れずに言えば、近年の人工知能の躍進の元となったソフトウェア技術、特に画像認識の領域におけるソフトウェア技術においては"畳み込みネットワーク(convolution network)"の実装の効果が大きい。福島邦彦によって1980年にBiological Cybernetics誌に発表された"Neocognitron"は、世界に先駆けて報告された畳み込みニューラルネットワークの原型である(1)。以下に、"畳み込み"の動作を簡単な例をあげて説明する。(図2)

図2

図2 畳み込み処理の一例

Step1. 図の最上段の式、左辺の左に太い青線で囲った3x3の領域に、左辺の右にある3x3の畳み込みカーネルkernelを作用させる。この例の場合、具体的には対応するセル同士をかけてその合計を計算して「11」を得る。これを右辺の左上に書き込む。
Step2. 図の二段目の式、太い青枠を右にずらす。
Step3. Step3と同様に、対応するセル同士をかけてその合計を計算して「14」を得る。これを右辺の右上に書き込む。
Step4. 図の三段目の式以降、同様に青枠を順にずらしながらStep1-3を繰り返す。
多種類のカーネルを用いこの様な大量の演算をする事で、読み込んだ画像の特徴の抽出を行う事ができる。

GPGPUの概念

図3

図3 Mandelbrot集合
上記の式で定義される複素数列Zが n → ∞ の極限で無限大に発散しないという条件を満たす複素数 c 全体が作る集合がMandelbrot集合である。このマンデルブロ集合は複素数平面上でフラクタル図形として表される。Mandelbrot集合を高解像度で描画しようとすると、膨大な計算時間を必要とするようになっていくことから、コンピューターの速度計測用途にしばしば用いられる。

人工知能の近年の躍進の原因として、上述のようなソフトウェア技術の革新も無視できないが、ハードウェアの発展の恩恵も大きい。
GPGPUとはGeneral-purpose computing on graphics processing unitsの略で、本来画像処理用のGPUの能力を画像処理以外の目的に応用する汎用計算技術のことを指す。
本来コンピューターの計算速度を決定するのは中央情報処理装置、CPU(Central Processing Unit)でる。現在も勿論、GPUの演算をCPUが制御していることは大筋では変わりがないが、上述の畳み込み演算のように、膨大な数の画素子について単純な和積算を多数繰り返す様な演算タスクはGPUに制御を渡してしまう方が高速である。
例えば図のようなMandelbrot集合の描画速度を講座所有のPCで計測してみると、CPUだけを使った描画に比べて、GPGPUを用いた描画時間は100分の1以下になる。(図3)

画像認識と深層学習(Deep Learning)

図4

図4

1998年にLeCunが後にLeNetと名付けられるDeep Learningのモデルを提唱し、手書き文字を高精度に認識して見せた(2)。
従来の機械学習Machine Learningでは、入力データから何らかの「特徴量」を人間が設計してやる必要があった(特徴量設計feature extraction)。一方で、LeNetの様に隠れ層(中間層)を多数持つ深層学習Deep Learningアルゴリズムでは、人間が前もって特徴量設計をしなくても、入力データからの学習により"特徴量"に相当する構造が隠れ層に自然に出現する。(図4)

図5

図5

「元画素からの学習により特徴量に相当する構造が隠れ層に"自然に"形成される」などと言うことが本当に有るのであろうか。図5に当センターで実際に学習させたAIの学習前(左)と学習後(右)の隠れ層のフィルタの一部の重みを画像輝度に変換したものを掲げる。確かに学習後のフィルタ重みには何らかの構造化がみられる。(図5)

上述の様なDeep Learning modelを用いて(実際に使用したものは隠れ層がもっと多く複雑)、脳神経外科学分野および病理学分野のご協力をいただき、当センター所有の深層学習用コンピューターにより訓練したAIを用い、MRIのT2強調像による脳出血、神経膠腫、脳梗塞、髄膜腫、転移性脳腫の5種類の画像分類実験において、5-fold cross validationで約96 %の正答率を得、同様に摘出標本の病理HE染色画像による6種類の脳腫瘍の分類実験において同じく5-fold cross validationで約95 %の正答率を得ている。

人工知能の医療分野での展望

しかしながら、上記の様にたとえ数%であれ、臨床医学の現場においてこの誤認識率は無視できない。
"Mission Critical System"という言葉がある。業務の遂行やサービスに必要不可欠であり、障害や誤動作などが許されないシステムのことを表す。このようなシステムの障害発生による中断や、停止が発生した場合には社会的影響が大きい。情報システム工学の領域で用いられることが多く、ゆりかもめなど交通機関のコントロール、金融機関のATM、原子力発電所の管理システム等に対しよく使われる言葉のようだが、医療用画像診断を行うAIシステムが世に席巻したとき、userすなわち患者にとって、このシステムの障害発生、誤診こそが"critical"である。総務省が2017年に表した「mission criticalなAIシステムに関する開発ガイドライン案」に、以下のような表現がある。

・透明性の原則-----開発者は、AIシステムの入出力の検証可能性及び判断結果の説明可能性に留意する
・アカウンタビリティの原則------開発者は、利用者を含む利害関係者に対しアカウンタビリティを果たすよう努める。

Mission Critical な分野において、AIと共存する未来の社会を創ってゆく開発者に対し、慎重な開発を促す重い表現であると思う。医療分野での臨床応用にむけてこのような問題を打破すべく、現在様々な方法論が提唱されているがその詳細は別の機会に譲る。

(参考文献)
1. K. Fukushima: Neocognitron: a self organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biological Cybernetics. 1980;36(4):193-202.
2. Y. LeCun, et al.: Gradient-Based Learning Applied to Document Recognition, Proceedings of the IEEE.1998;86(11):2278-2324.

研究分野

脳研コラム
このページの先頭へ戻る