高い予測精度を実証

 入力特徴量に選んだのは、臨床データ8種類と治療計画データ196種類の計204種類のデータ。臨床データには、年齢や性別、腫瘍の位置、手術の切除範囲などが含まれる。治療計画データは、処方線量や治療日数、照射体積などだ。

 入力特徴量に対し、「生存期間」を出力する回帰モデルには、線形重回帰モデルと人工ニューラルネットワーク(機械学習)の2種類を採用。両者の予測精度を比べた。

 生存期間の予測値と実際の生存期間の相関係数(R)は、線形重回帰モデルでは0.6台。対して、機械学習では0.9台だった。機械学習の予測精度の高さを裏付けた形だ。

 放射線治療の検証に機械学習を使った事例として、馬込氏は海外グループの研究例も紹介。それらによれば、入力特徴量にがんのバイオマーカーやPET-CTの診断結果を加えることで、予測精度が高まるという。すなわち「多分野の特徴量を合わせて使うことで予測精度が向上する」(同氏)。