預測模型的開發(fā)和驗證

來源:黨委研究生工作部、控制與計算機工程學院發(fā)布時間:2018-06-08

講座題目】預測模型的開發(fā)和驗證

講座時間】2018年6月11日(星期一)10:00-12:00

講座地點】北京校部主樓E1009

主 講 人】葉菲 副教授

主講人簡介

葉菲博士,美國范德堡大學醫(yī)學中心生物統(tǒng)計學系生物統(tǒng)計學副教授,聯(lián)合研究中心主任。她是兩個NCI / NHGRI支持的項目的主要研究員,一個是開發(fā)乳腺癌預后預測模型,另一個是PheWAS研究。她最近獲得了一項機構發(fā)展獎,關于開展一項試點研究,開發(fā)專門針對甲基化范圍的關聯(lián)研究的分析流水線和統(tǒng)計方法。葉菲博士在研究設計和臨床流行病學和高維度組學研究的統(tǒng)計/生物信息學分析方面擁有豐富的經驗。她曾擔任多個審查委員會的委員(校外和校內),包括NCI特別重點小組,CTSA聯(lián)盟科學評估委員會,范德堡-英格拉姆癌癥中心科學評估委員會,范德堡臨床和轉化研究資助評估研究所,BioVU Pre審查委員會和范德堡-英格拉姆癌癥中心數(shù)據(jù)和安全監(jiān)測委員會。

內容簡介

講座是關于開發(fā)乳腺癌預測模型。建立預測模型,納入臨床病理、生活方式和遺傳因素,包括年齡,腫瘤分級,腫瘤大小和淋巴結狀態(tài),以預測乳腺癌的生存期。然后考慮可修改的生活方式因素,包括診斷后身體質量指數(shù),體重增加,PA和大豆食物攝入量以及ER,PR和HER2狀態(tài)消費模型。開發(fā)預測模型的策略包括以下步驟:

1、根據(jù)結果變量的性質和審查類型選擇合適的模型;

2、評估缺失數(shù)據(jù)的模式并執(zhí)行多重歸責以最大限度地利用關于某個主題的部分信息; 

3、確定模型的可允許的復雜性(即預測因子的數(shù)量);

4、降低變量中的共線性(如果檢測到)以確保模型僅包括與BC結果獨立相關的因素;

5、檢查線性假設并允許估計非線性項和時變波動的樣條回歸模型中連續(xù)預測因子與BC結果之間的非線性關聯(lián);

6、檢查可加性假設并納入兩個獨立變量之間的預先指定的臨床動機相互作用,并使用似然比檢驗比較有和沒有相互作用項的模型;

7、檢查是否有過分影響的觀察;

8、檢查分布假設;

9、用部分效應圖和諾模圖解釋模型;

10、評估模型擬合。

上述模型構建過程是使用自舉法進行內部驗證的,通過平衡預測誤差中的偏差和方差來評估和修正預測模型的潛在樂觀情緒。

返回