R語言多元Logistic邏輯回歸 應用案例
原文鏈接:http://tecdat.cn/?p=2640??
?
可以使用逐步過程確定多元邏輯回歸。此函數(shù)選擇模型以最小化AIC。
如何進行多元邏輯回歸
可以使用階梯函數(shù)通過逐步過程確定多元邏輯回歸。此函數(shù)選擇模型以最小化AIC。
通常建議不要盲目地遵循逐步程序,而是要使用擬合統(tǒng)計(AIC,AICc,BIC)比較模型,或者根據(jù)生物學或科學上合理的可用變量建立模型。
多元相關是研究潛在自變量之間關系的一種工具。例如,如果兩個獨立變量彼此相關,可能在最終模型中都不需要這兩個變量,但可能有理由選擇一個變量而不是另一個變量。
多元相關
創(chuàng)建數(shù)值變量的數(shù)據(jù)框
?

多元邏輯回歸的例子
在此示例中,數(shù)據(jù)包含缺失值。在R中缺失值用NA表示。SAS通常會無縫地處理缺失值。雖然這使用戶更容易,但可能無法確保用戶了解這些缺失值的作用。在某些情況下,R要求用戶明確如何處理缺失值。處理多元回歸中的缺失值的一種方法是從數(shù)據(jù)集中刪除具有任何缺失值的所有觀察值。這是我們在逐步過程之前要做的事情,創(chuàng)建一個名為Data.omit的數(shù)據(jù)框。但是,當我們創(chuàng)建最終模型時,我們只想排除那些在最終模型中實際包含的變量中具有缺失值的觀察。為了測試最終模型的整體p值,繪制最終模型,或使用glm.compare函數(shù),我們將創(chuàng)建一個名為Data.final的數(shù)據(jù)框,只排除那些觀察結果。
盡管二項式和poission系列中的模型應該沒問題,但是對于使用某些glm擬合的步驟過程存在一些注意事項。
用逐步回歸確定模型
最終模型
?
偽R方
?
模型總體p值
在最終模型中創(chuàng)建包含變量的數(shù)據(jù)框,并省略NA。
偏差表分析
?
似然比檢驗
?
?
標準化殘差圖

簡單的預測值圖
在最終模型中創(chuàng)建包含變量的數(shù)據(jù)框,并在NA中省略

過度離散檢驗
過度離散是glm的deviance殘差相對于自由度較大的情況。這些值顯示在模型的摘要中。一個指導原則是,如果deviance殘差與剩余自由度的比率超過1.5,則模型過度離散。過度離散表明模型不能很好地擬合數(shù)據(jù):解釋變量可能無法很好地描述因變量,或者可能無法為這些數(shù)據(jù)正確指定模型。如果存在過度離散,一種可能的解決方案是 在glm中使用quasibinomial family選項。
?
?
評估模型的替代方法
使用逐步程序的替代或補充是將模型與擬合統(tǒng)計進行比較。我的compare.glm 函數(shù)將為glm模型顯示AIC,AICc,BIC和偽R平方。使用的模型應該都擬合相同的數(shù)據(jù)。也就是說,如果數(shù)據(jù)集中的不同變量包含缺失值,則應該謹慎使用。如果您對使用哪種擬合統(tǒng)計數(shù)據(jù)沒有任何偏好,您希望在最終模型中使用較少的術語,我可能會推薦AICc或BIC。
一系列模型可以與標準的anova 功能進行比較。模型應嵌套在先前模型中或anova函數(shù)列表中的下一個模型中; 和模型應該擬合相同的數(shù)據(jù)。在比較多個回歸模型時,通常放寬p值為0.10或0.15。
在以下示例中,使用通過逐步過程選擇的模型。請注意,雖然模型9最小化了AIC和AICc,但模型8最小化了BIC。anova結果表明模型8不是對模型7的顯著改進。這些結果支持選擇模型7,8或9中的任何一個。??
?
?
?

最受歡迎的見解
1.matlab中的偏最小二乘回歸(PLSR)和主成分回歸(PCR)
2.R語言多元Logistic邏輯回歸 應用案例
3.R語言面板平滑轉移回歸(PSTR)分析案例實現(xiàn)
4.R語言回歸中的HosMer-Lemeshow擬合優(yōu)度檢驗
5.R語言泊松Poisson回歸模型分析案例
6.r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實現(xiàn)
7.R語言如何在生存分析與Cox回歸中計算IDI,NRI指標
8.在R語言中實現(xiàn)Logistic邏輯回歸
9.R語言實現(xiàn)向量自回歸VAR模型
?