Hiroshima BioMedical Engineering School

Main Content

STANDARD4:AI・機械学習について


・「人工知能」ブーム

近年,「人工知能」あるいは「AI(Artificial Intelligence)」の技術が大変な話題・ブームとなっており,技術的な内容はもちろん,社会現象として取り扱った内容も含めた多くの本が出版され,書店では専門のコーナーが設けられているところもあります.一般に人工知能は,専門家が行うような高度な判断や制御などを行う機械あるいはその技術を指し,これを実現する様々な理論や方法が含まれます.
現在,最も注目を浴びているのは「ディープラーニング(Deep Learning)」という技術で,これまでの人工知能技術の性能を大きく上回る成果をあげています.しかし,ディープラーニングの基礎となる理論に関しては数十年前から研究されていました(*1).近年に見られる大きな進歩は,人工知能の性能を決定づける大規模データの活用が可能となったことと,近年のコンピュータの処理能力の飛躍的な向上により実用レベルに達したことが重要なポイントであるといえます.

・人工知能の歴史

さかのぼれば,「人工知能」という言葉は1950年代に生まれています.その後も様々な分野で技術開発が進められ,応用されてきました.たとえば,1990年代前半にも一種の人工知能ブームがありました.炊飯器や洗濯機などの家電製品に人工知能(ニューラルネットワークやファジィ制御など)が搭載され,大々的に宣伝されたのですが,現在ほどのブームは起こりませんでした(*2).それは,ご飯が美味しく炊けたり,きれいに洗濯ができたりといった日常生活の中での影響力が小さなものだったためと思われます.一方で,その背後では少しずつ技術の発展は蓄積されていきました.

図1 人工知能(ニューロ・ファジイ)搭載の炊飯器.© Zoujirishi

近年のブームには,その原因となった象徴的な出来事があります.最近では,囲碁においてGoogle DeepMind社開発のAlphaGoが2016年に世界トップ棋士を破ったのは記憶に新しいところです.日本においても2010年に将棋のプロ棋士がAIに敗れ,1997年には当時のチェスの世界チャンピオンをIBM社のスーパーコンピュータが打ち負かしています.2011年には同じくIBM社の開発したシステム「Watson」がクイズ王を破るといった出来事がありました.これらには高度な熟練や豊富な知識を利用した情報処理が必要で,長い間機械での実現は難しいだろうと思われてきたものです.
このように,難しい問題であっても人間の能力とほぼ同等あるいは上回る人工知能の実現が十分可能であることが,専門家でなくともわかりやすい形で証明されました.これが近年のブームの出発点になっていると思われます.その結果,自動車の自動運転や教育・医療への応用など,これまでの私たちの生活を一変させる可能性に期待する一方で,人間の仕事が奪われるのではといった心配もされるようになっています.これらの様々な感情も現在のブームを大きくしていった理由の一つでしょう.

・「パターン認識」と「機械学習」

ディープラーニングを含め,機械が物体を認識するなどの高度な判断を行う技術には,「パターン認識」や「機械学習」といった用語がしばしば登場します.一般に,入力した複数の数値があらかじめ決められた複数のグループ(クラスと呼びます)のどれに属するかを決定することを「パターン認識」と呼びます.図形的な模様を表す意味での「パターン」ではなく,入力される複数の数値の組み合わせをパターンと呼ぶことに注意が必要です.
例えば,図2のように身長と体重といった2つの数値で,大人か子供かを分類する問題を考えます.大人か子供かの2つのグループに分類するので「2クラス分類」問題といいます.また,入力される身長と体重の数値は「特徴量」と呼ばれ,入力に従ってどちらのグループであるかを判断する部分は「識別器」と呼びます.単純には,適当に決めた「身長何cm以上かつ何kg以上は大人」というルールに従った分類も可能ですが,正しく識別ができるかどうかわかりません.一方,コンピュータにあらかじめ大人と子供の身長・体重のデータのサンプルを多数与えておくと,どのような特徴量が入力された場合に大人で,どのような場合は子供といった判断の基準のうち,最も識別の誤りが少ないものが自動的に計算できます.
図2 基本的なパターン認識の問題.

このような計算を「機械学習」と呼び,学習に使用したサンプルの身長や体重といった特徴量,そしてその特徴量が大人のものか子供のものかの情報は「教師信号」と呼びます.図3のようにX軸に身長,Y軸に体重を取ったとき,大人と子供のデータをX−Y平面に表示すると,機械学習の結果として識別の境界が線として得られることがわかります.どのような識別境界が決まるか,また性能は識別器によって異なります.また,機械学習に使用するサンプルデータの数は,多ければ多いほどよいとされています.
図3 特徴量と識別境界.

・医療における「人工知能」の応用と「コンピュータ画像診断支援」

医療の分野でも専門家が行うような高度な判断を実現する情報処理技術を応用する研究が古くから行われています.しかし,一般には「人工知能」という名称はあまり使われてきませんでした.その理由はいくつかありますが,第一には人工知能が医師とは独立して勝手に診断したり治療したりといった状況が実際の医療の現場ではありえない,あるいは許されないといった考え方があります.機械は医師を支援するものであって,決して代替するものではないというものです.したがって,「コンピュータ診断支援」,「コンピュータ支援手術」など,あくまで医師を支援する,補助するといった立場を表す名称が使われてきました.ただし,使用されている技術は現在一般に「人工知能」と呼ばれているものと差異はなく,使い方や呼び方が異なるに過ぎません.
医療の現場における診断には,X線CTなどの医用画像に映し出された病変を見つけたり,その病変が良性か悪性かを鑑別したりする「画像診断」と呼ばれるものがあります.この診断は,放射線科医あるいは画像診断医と呼ばれる医師たちが担っています.しかし,近年の医用イメージング技術の発展により,大量の医用画像をチェックしなければならないようになりました.これを機械学習などに基づくパターン認識で支援する技術は「コンピュータ(画像)診断支援」,英語では「CAD: Computer-Assisted Diagnosis」と呼ばれます.病変と思われる領域を自動的に検出して候補として指し示したり(図4),悪性の度合いを数値で提示したりなど,最終的に医師が行う判断を補助する情報(*3)を提供することがその目的です.CADの技術は,これまでも企業や大学などの研究機関でも長い間,研究開発が進められており,すでに製品として売られているシステムや,病院内の研究室で開発されているもの(*4)もあります.ディープラーニングを始めとする近年の人工知能技術は,その性能を飛躍的に向上させると期待されています.
図4 東大病院放射線科が開発した肺がんの腫瘤の候補を自動的に検出して医師に提示するシステム「CIRCUS」(CT画像中の◯が検出した腫瘤の候補).

・CADはディープラーニングでどう変わるのか

ディープラーニングによるパターン認識の技術の一つに,「ディープ畳み込みニューラルネットワーク(DCNN: Deep Convolutional Neural-Network)」があります.これが画像を対象とした様々な問題で驚くべき性能を示した(*5)ことが注目されました.先に述べたように,パターン認識を行うシステムの性能はどのような特徴量や識別器を使うかによって異なります.CADを含めた画像におけるパターン認識の問題の場合,どのような特徴量を医用画像から抽出するか,といった点が研究の大きな焦点の一つでした.例えば,医師が診断の根拠としているのは領域の丸さや面積,画像上の濃淡といったものですが,これらを数値化して特徴量として識別器に学習させていました.しかし,DCNNでは画像の中の対象となる範囲すべての画素の値を直接ニューラルネットワークに入力します.つまり,特徴量は画素の値そのもの,あるいはニューラルネットワークの中で画素の値から自動的に計算されることになるのです.一方,CNN自体が識別器も含んでいます.よって,実際にはネットワークの層の数や構造などの調整は必要ですが,入力と出力さえ与えてやれば高性能なシステムが実現できることになり,実際に成果を上げつつあるのが現状です.
DCNNの登場で,それまで苦労していた特徴量や識別器の選び方や新規の開発といった問題は一気に解決されてしまった印象があります.しかし,一方で新たな問題も議論されています.例えば,CADの対象である画像診断では,医師は画像以外にも人体の構造を始めとする様々な医学知識を元に総合的に診断を行っています,これに対して画像のみを入力して学習させたDCNNでは,そのような知識は含まれません.また一方,鳩(ハト)に画像診断を行わせようという興味深い研究の報告がありました(*6).エサによる報酬を与えて学習させると,鳩も画像診断に必要な判断をある程度の精度で行うことが可能だと示されました.DCNNも鳩も医学的知識を持たないにも関わらず画像診断が行えるという点で共通しています.このように,医学的知識を持たないながらも特定の問題に限定して高性能である技術をそのまま使用するか,莫大な量の医学知識をもつことでさらに高度な判断ができるような,いわば医師と同等の能力を持つコンピュータにすべきか,あるいはそもそも実現可能かといった疑問はまだ解消されておらず,これからの研究の発展が大きく期待されています.

*1 SankeiBiz【人工知能はいま 専門家に学ぶ】(6)日本を代表する数理工学者,合原一幸氏が見るAIの世界
*2 米国の通販サイトで入手可能な製品もまだあるようです。「Neuro Fuzzy Rice Cooker」という名称で売られています。
*3 「コンピュータによる第2の意見(セカンドオピニオン)」と呼ばれることもあります。
*4 東京大学医学部附属病院では「CIRCUS(サーカス)」というシステムを開発しています。
*5 トロント大学のHinton教授(当時)らのグループの論文(英語)です。
*6 研究論文が掲載された電子論文誌「PLOS ONE」(英語)のページです。

前の内容:生体計測について

次の内容:コンピュータによる分子シミュレーションとは