11万人分のデータで有効性を検証

 これまで、生活習慣病の発症予測では、疫学研究や医療現場で得られた知見をもとに、疾病ごとの個別モデルを生成する方法が一般的に利用されてきた。これに対し日立健保と日立は今回、複数年分のレセプトと特定健診のデータから、集団における生活習慣病の発症率と、生活習慣病に関連する医療費総額を予測するモデルを開発した。このモデルでは、生活習慣病の疾病間の影響を考慮している。開発した予測モデルの概要は以下の通り。

(1)各種要因の影響を考慮した生活習慣病の発症率と医療費を予測
 生活習慣病に関わる検査値や問診結果、傷病名や診療内容、診療報酬点などの項目について、データの経年変化を分析し、ある状態から将来どのような状態に変化するかを確率的に求める。同時に、機械学習を用いて、異なる項目間(例えばBMIと糖尿病など)の影響度合いを求める。これらの分析結果を用いて、生活習慣病の発症率とそれに関わる医療費総額を予測するモデルを構築した。

(2)実データを用いたモデルの有効性の検証
 構築したモデルの有効性を確認するために、日立健保が保有する2010年と2011年の約11万人分のレセプトと特定健診データを用いて検証実験を行った。実験ではまず、11万人のデータを2グループ(A:約9万人分、B:約2万人分)に分けた。次に、Aグループの2年分のデータを用いて生活習慣病の医療費総額を予測するモデルを構築し、このモデルを使ってBグループの2010年のデータから2011年の医療費総額を予測して、2011年の実データと比較を行った。その結果、予測値と実データの誤差は平均5%以内となり、疾病ごとに構築された個別モデルを使って予測した場合の誤差(約10%)に比べて高い精度で予測できることを確認した。