積み上げると100km

 東京大学 医科学研究所は2011年から、ゲノムシーケンスを日常臨床に取り入れる試みを進めてきた。2015年度には、血液がんを中心に100症例以上のゲノムシーケンスを実施している。ただし、現状のシーケンスは同研究所に限らず、がんとの相関がよく知られている100種類ほどの遺伝子の解析にとどまる。

 同研究所のシーケンス例では、診断にも治療薬の選択にもつながらなかったケースが50%以上を占めた。こうした限界を克服する上では、全ゲノムの解析が必要になる。

 そこで同研究所では、スーパーコンピューターを使った全ゲノム解析環境を構築。直近では1日弱での解析が可能となってきたという。具体的な成果の1つとして、家族性大腸ポリポーシスの症例に対し、APCと呼ばれる遺伝子のプロモータ領域の欠損を全ゲノム解析で明らかにした。

 こうした全ゲノム解析が当たり前になると、扱うべきデータ量も膨大になる。全ゲノムをシーケンスした場合、シーケンスデータの容量は400Gバイト程度。加えて、そのデータを解釈するために膨大な文献データが必要だ。例えば、米国の医学生物学分野の学術文献データベース「PubMed」に2015年に掲載された論文数は、約360万本。紙で積み上げると「800mほどの高さになる。2050年には(累計で)100kmに達し、“成層圏を超える”と予想されている」(宮野氏)。

「手のひらサイズの装置で、1万円以下で実現」。

 こうした大量のデータの扱いは、人工知能が得意とするところ。そこに着目したMD Anderson Cancer CenterやMayo Clinicといった「米国のトップがんセンターは既に人工知能を導入している」(宮野氏)。米国の動きに後れまいと、東京大学 医科学研究所は2015年7月にWatson Genomic Analyticsを導入。Watsonのアーリーアダプタープログラムの採択例として、北米以外の医療研究機関では最初の事例となった。

 Watson Genomic Analyticsは、がんのゲノム情報を解釈し、効果が期待される治療薬を根拠となる文献とともに提示する。例えば、大腸がん細胞の222個の遺伝子変異を入力したケースでは、親玉として機能する4個の遺伝子変異(ドライバー変異)を抽出することに成功。同定した2つの標的遺伝子の情報を基に、大腸がんで承認済みおよび臨床試験中の抗がん剤と、他のがんで承認済みの抗がん剤を、効果が見込める治療薬としてWatsonは提示した。

 「未来が見える望遠鏡」と題するスライドで宮野氏が示したのは、次のような10年後の姿だ。全ゲノムシーケンスは「手のひらサイズの装置で、1万円以下で実現」。データ解析は「タブレット端末とクラウドで、数分~1日で完了」。ゲノム情報の解釈は「人工知能とクラウドが担う」。