台灣人工智慧實驗室 之 Polygenic Risk Score (PRS)
多基因風險評分 (Polygenic Risk Score) 在這幾年突然變成一個熱門名詞,但其實它的概念並不新穎,簡單來說,就是把一個人的基因型 (genotype) 當成特徵,每一個 SNP 都是一個變數,使用成千上萬的特徵建立一個線性或非線性的分類或迴歸模型,每一個模型分別用來評估一個人在一生中會得某種疾病的風險,或是預測一些可量化的屬性,例如:身高或體重。
在與台大研究團隊的合作中,台灣人工智慧實驗室的基因 AI 團隊,用 低密度脂蛋白(英語:low-density lipoprotein,縮寫為 LDL)為範例說明 PRS 模型的效用。這個模型使用台大研究團隊向臺灣人體生物資料庫申請的兩萬人 SNP 基因晶片資料作為示範,其中 22,749 人當作訓練資料,2,749 人當作測試資料,下圖是三種 PRS 模型在 2,749 筆測試資料的評估結果。由此圖可以看出,不論是哪一個方法 (C+T、Lassosum 或 LDpred2),在將測試資料的兩千人依單一模型預測的分數排序後,模型認為高風險的人 (percentile 90~100%),這群人的 LDL 數值平均的確都比較高。

大家都知道,所謂的基因型,是與生俱來的,在此不禁感嘆,人真的是 "生而不平等" 啊,我沒有富爸爸也就算了,LDL 一出生就被歸類為傾向偏高,該用什麼心情面對呢? 美國 CDC 在網站上 (Polygenic Risk Scores | CDC) 與大眾分享: "Knowing how likely you are to get a disease can help you take steps to prevent it or find it earlier, when it is easier to treat." (翻譯:預知你得到某種疾病的風險程度,將能幫助你採取行動去預防它,或是在疾病相對容易處理的階段就早期發現它)。
基因 AI 團隊近期與台大醫院、三軍總醫院 、臺北榮民總醫院、臺中榮民總醫院等研究團隊合作,建立多種 PRS 模型:僵直性脊椎炎 (Ankylosing spondylitis)、叢發性頭痛 (Cluster headache)、可逆性腦血管收縮症候群 (Reversible cerebral vasoconstriction syndrome)、第二型糖尿病 (Type 2 diabetes)、高血壓 (Hypertension)、高血脂 (Hyperlipidemia)、低密度脂蛋白 (LDL) 等,希望能透過更多資料的累積,增進模型的準確度,早日應用於個人健康管理,幫助高風險族群建立更有利身心的生活模式。
歡迎研究人員試試最新公開的平台 tw23.org,可以線上進行 GWAS 與 PRS 分析。