醫(yī)學(xué)案例 | 多分類logit回歸分析
一、案例介紹
某研究人員想要理解不同社區(qū)和性別之間成年居民獲取健康知識的途徑是否不同,對2個社區(qū)共314名成人進行調(diào)查,得到數(shù)據(jù)后想要擬合社區(qū)和性別對居民獲取健康知識途徑的回歸模型。
二、問題分析
將得到的數(shù)據(jù)進行擬合社區(qū)和性別對居民獲取健康知識途徑的回歸模型。由于居民獲取健康知識途徑為無序分類變量,所以考慮使用多分類logit回歸分析,其中以居民獲取健康知識途徑為因變量,社區(qū)和性別為自變量建立多分類logit回歸分析。
三、軟件操作及結(jié)果解讀
(一) 數(shù)據(jù)導(dǎo)入
1.數(shù)據(jù)格式
首先將數(shù)據(jù)整理成正確的格式,一般一個X為一列,Y為一例,并且分析的數(shù)據(jù)帶有數(shù)據(jù)標簽的,其中性別中1代表男、2代表女,社區(qū)1代表社區(qū)1,2代表社區(qū)2,居民獲取健康知識途徑中1代表傳統(tǒng)大眾媒介,2代表網(wǎng)絡(luò),2代表社區(qū)宣傳。需要另添加一個表格進行說明,數(shù)據(jù)格式如下:
2.導(dǎo)入數(shù)據(jù)
將整理好的數(shù)據(jù)上傳至SPSSAU系統(tǒng)內(nèi),如下:
上傳的數(shù)據(jù)如下:
(二) 適用條件判斷
多分類logit回歸需要滿足因變量是多分類變量,并且觀測值相對獨立,以及自變量之間無多重共線性。該案例中因變量為有序多分類變量和觀測值相對獨立,所以接下來進行查看模型是否有多重共線性。
1.軟件操作
想要檢驗是否具有多重共線性,查看vif值即可,路徑為點擊【通用方法】→【線性回歸】然后進行分析:
2. 結(jié)果解讀
如果VIF≥10,則表明自變量之間存在多重共線性,VIF值計算如下:
從分析結(jié)果中可以看到VIF值均小于10說明不存在多重共線性的問題。
(三)多分類logit分析
1. 軟件操作
路徑為點擊【進階方法】→【多分類logit】然后進行分析:
2. 結(jié)果解讀
案例滿足分析的前提條件,接下來進行查看模型構(gòu)建的有效性以及影響關(guān)系,首先對于模型構(gòu)建的有效性進行查看:
此處模型檢驗的原定假設(shè)為:是否放入自變量針對模型質(zhì)量均一樣;這里p值小于0.05,因而說明拒絕原定假設(shè),即說明本次構(gòu)建模型時,放入的自變量具有有效性,本次模型構(gòu)建有意義。接下來對影響關(guān)系進行查看:
從表格中可以看出,網(wǎng)絡(luò)相對于傳統(tǒng)大眾媒體來說只有社區(qū)具有顯著性(p值小于0.05),社區(qū)宣傳對于傳統(tǒng)大眾媒介來說自變量女性和社區(qū)均具有顯著性影響(p值小于0.05),針對網(wǎng)絡(luò)相對于傳統(tǒng)大眾媒介來講,社區(qū)1的回歸系數(shù)為1.374,回歸系數(shù)大于0說明社區(qū)1更加偏好在網(wǎng)絡(luò)上獲取健康知識途徑,社區(qū)宣傳對于傳統(tǒng)大眾媒體來講,女性更喜歡社區(qū)宣傳獲取健康知識途徑,社區(qū)1對于社區(qū)宣傳和傳統(tǒng)大眾媒介相比更喜歡從社區(qū)宣傳獲得傳統(tǒng)大眾媒介知識。
四、結(jié)論
多分類logit回歸分析研究社區(qū)和性別對居民獲取健康知識途徑的回歸模型,進行查看模型是否有多重共線性,經(jīng)過vif值查看發(fā)現(xiàn)沒有多重共線性,然后進行多分類logit回歸分析,首先進行模型有效性查看,發(fā)現(xiàn)模型構(gòu)建有效。對于影響關(guān)系的查看,社區(qū)宣傳對于傳統(tǒng)大眾媒介來說自變量女性和社區(qū)均具有顯著性影響(p值小于0.05),針對網(wǎng)絡(luò)相對于傳統(tǒng)大眾媒介來講,社區(qū)1的回歸系數(shù)為1.374,回歸系數(shù)大于0說明社區(qū)1更加偏好在網(wǎng)絡(luò)上獲取健康知識途徑,社區(qū)宣傳對于傳統(tǒng)大眾媒體來講,女性更喜歡社區(qū)宣傳獲取健康知識途徑,社區(qū)1對于社區(qū)宣傳和傳統(tǒng)大眾媒介相比更喜歡從社區(qū)宣傳獲得傳統(tǒng)大眾媒介知識。
五、知識小貼士
1、多分類logit回歸,出現(xiàn)一堆null值,通常是由于‘因變量的類別分布有問題,比如某個類別的樣本量小于10無代表性,也或者有共線性問題需要查看’,此時建議對因變量的各選項進行合并組別(或者先篩選下),然后再次進行分析。當(dāng)然也有可能是由于共線性問題導(dǎo)致無法擬合出結(jié)果,此時可先進行相關(guān)分析,將相關(guān)系數(shù)值過大的項移出模型中再次進行分析即可。
2、針對多分類logit回歸,SPSSAU默認是以第一項作為參照項,而SPSS默認是最后一項作為參考項,研究中以第一項還是最后一項作為參考項并沒有固定的標準,更常用是使用第一項作為參考項。
有序logit回歸或者多分類logit回歸時,spssau默認會設(shè)置第一項作為參照項,因此輸出結(jié)果時會少一項。