2021.4.22
, EurekAlert より:
無数の遺伝的要因が、高血圧、心臓病、2型糖尿病などの病気の発症に影響を与える可能性がある。豪州科学技術研究所の研究者らは、患者のゲノムデータの大規模なセットから得られる予測品質を向上させる新しい数学モデルを開発したと報告した。
ヒトのDNAは、我々の生物学的構造と機能をコードする数十億の塩基対で構成されている。研究チームは調査のために数十万の遺伝子マーカー(DNA配列の短い部分)を選択し、統計モデルを使用して、これらのマーカーの構成を、データベース内の患者の高血圧、心臓病、または2型糖尿病の発症(特に発症年齢)に関連付けた。
研究チームは、英国とエストニアの両方で、国が資金提供するバイオバンク(遺伝子データの大規模なコレクション)から匿名化された患者データを使用した。まず英国のデータを使用してモデルを構築し、エストニアのデータを使用してその予測力をテストした。
ビッグデータ研究に一般的に使用されるブラックボックスモデルと、今回の統計モデルの間には重要な違いがあるという。ブラックボックスモデルは予測を生成するが、抽象化の層が多いため、その内部の仕組みを人間が簡単に理解することはできない。対照的に、今回のモデルは、追跡可能な統計計算を提供する。
健康と病気の発症に関する予測を作成するための数学的モデルの内部動作を理解できることは、機密性の高い患者データの大規模なセットを使用するための倫理的アプローチの重要な部分であり、これにより、研究者は予測がどのように生成されたかを説明することができるのである、と研究チームは述べている。
出典は『ネイチャーコミュニケーション』。 (論文要旨)
|