診断精度の向上に不可欠な大規模日本人難聴遺伝子変異データベース

 15年ほど前から始まった難聴患者の遺伝子解析は、共同研究先も現在80施設に増えた。約8000例の難聴患者のDNAサンプルが信州大学耳鼻咽喉科学教室に蓄積され、日本人の難聴遺伝子データベースが構築されている。そのうち約2600件は次世代シーケンサーによる解析が終了しており、日々、データ量は増え続けている。そのプラットフォームとして利用されているのが、FileMakerである。

信州大学医学部耳鼻咽喉科学教室の西尾信哉氏
信州大学医学部耳鼻咽喉科学教室の西尾信哉氏

 次世代シーケンサーによって多数の原因遺伝子を網羅的に解析することが可能になったが、実際の解析では非常に多くの遺伝子変異が検出されるため、病気の原因であるかどうかを同定することは容易ではない。このため、「膨大なデータの扱いが容易で、研究者が使いやすいツールが必要でした」(信州大学医学部耳鼻咽喉科学教室の西尾信哉氏)と、当初からFileMakerを利用してデータベースを構築した理由を話す。

 また、FileMakerを採用した背景として、日本にはバイオインフォマティクスを専門とする研究者が少ないことが課題としてあったと西尾氏は指摘する。バイオインフォマティクス研究では様々なプログラム言語を理解していることが必要だが、臨床や実験を重視する、いわゆる「ウェット」の研究者にとって、プログラミング言語を駆使する必要があるデータベースは扱いにくい。「こうした研究者が利用しやすい解析ツールを検討した結果、利用経験者が多く扱いやすいFileMakerの採用を決めました」(西尾氏)。

 構築している日本人難聴遺伝子変異データベースは、次世代シーケンサーで解析した変異情報(バリアントコールデータ)を蓄積したコアデータベースを中核として構成されている。それらの遺伝子変異が難聴の原因遺伝子変異であるかどうか照合・評価分析するためのデータとして、公開データベースから取り込んだサブ・データベースがある。具体的には、日本人のゲノム配列を解析したデータベース「HGVD」(Human Genetic Variation Database)、米国国立生物工学情報センター(NCBI)の「ClinVar」と呼ばれる遺伝子変異データベース、米国アイオワ大学医学部耳鼻咽喉科との共同研究により開発した難聴性遺伝子データベース、国際1000人ゲノム、6500エクソームなどのデータベースから取り込んでいる。

日本人難聴遺伝子変異データベースの概要
日本人難聴遺伝子変異データベースの概要
[画像のクリックで拡大表示]

 また、患者の臨床情報(聴力検査結果など)もデータベース化されており、解析した変異情報とリンクして見ることができる。