回歸分析與相關(guān)分析的區(qū)別和聯(lián)系
原文鏈接:http://tecdat.cn/?p=8508
?
在本節(jié)中,我們將首先討論相關(guān)性分析,它用于量化兩個(gè)連續(xù)變量之間的關(guān)聯(lián)(例如,獨(dú)立變量與因變量之間或兩個(gè)獨(dú)立變量之間)。回歸分析是評(píng)估結(jié)果變量與一個(gè)或多個(gè)風(fēng)險(xiǎn)因素或變量之間關(guān)系的相關(guān)技術(shù)。結(jié)果變量也被稱(chēng)為因變量,風(fēng)險(xiǎn)因素被稱(chēng)為預(yù)測(cè)因子或解釋性或自變量。在回歸分析中,因變量表示為“?y”,自變量表示為“?x””。
?
相關(guān)分析
在相關(guān)分析中,我們估計(jì)了樣本相關(guān)系數(shù),更具體地說(shuō)是Pearson乘積矩相關(guān)系數(shù)。樣本相關(guān)系數(shù),表示為r,
介于-1和+1之間,并量化兩個(gè)變量之間的線性關(guān)聯(lián)的方向和強(qiáng)度。兩個(gè)變量之間的相關(guān)性可能是正的(即一個(gè)變量的較高水平與另一個(gè)變量的較高水平相關(guān))或負(fù)的(即一個(gè)變量的較高水平與另一個(gè)變量的較低水平相關(guān))。
相關(guān)系數(shù)的符號(hào)表示關(guān)聯(lián)的方向。相關(guān)系數(shù)的大小表示關(guān)聯(lián)的強(qiáng)度。
例如,r = 0.9的相關(guān)性表明兩個(gè)變量之間強(qiáng)烈的正相關(guān),而r = -0.2的相關(guān)性表明弱相關(guān)性。接近于零的相關(guān)性表明兩個(gè)連續(xù)變量之間沒(méi)有線性關(guān)聯(lián)。
?
需要注意的是,兩個(gè)連續(xù)變量之間可能存在非線性關(guān)聯(lián),但相關(guān)系數(shù)的計(jì)算不會(huì)檢測(cè)到這一點(diǎn)。因此,在計(jì)算相關(guān)系數(shù)之前仔細(xì)評(píng)估數(shù)據(jù)總是很重要的。圖形顯示對(duì)探索變量之間的關(guān)聯(lián)特別有用。
下圖顯示了四個(gè)假設(shè)情景,其中一個(gè)連續(xù)變量沿著X軸繪制,另一個(gè)沿著Y軸繪制。

?
?
情景1描述了強(qiáng)烈的正相關(guān)(r = 0.9),類(lèi)似于我們可以看到的嬰兒出生體重與出生體重之間的相關(guān)性。
情景2描述了我們可能期望看到的年齡與體重指數(shù)(其隨著年齡增加而增加)之間的較弱關(guān)聯(lián)(r = 0,2)。
情景3可能表明青少年媒體暴露的程度與青少年發(fā)起性行為的年齡之間缺乏聯(lián)系(r大約為0)。
情景4可能描述了每周有氧運(yùn)動(dòng)小時(shí)數(shù)與體脂百分比之間通常觀察到的強(qiáng)烈負(fù)相關(guān)(r = -0.9)。
?
示例 - 妊娠期和出生體重的相關(guān)性
一項(xiàng)小型研究涉及17名嬰兒,以調(diào)查出生時(shí)的胎齡(以周為單位)和出生體重(以克為單位)之間的關(guān)聯(lián)。

我們希望估計(jì)胎齡與嬰兒出生體重之間的關(guān)系。在這個(gè)例子中,出生體重是因變量,孕齡是自變量。因此y =出生體重和x =胎齡。數(shù)據(jù)顯示在下圖中的散點(diǎn)圖中。

每個(gè)點(diǎn)代表一個(gè)(x,y)對(duì)(在這種情況下,孕周,以周為單位,出生體重以克為單位)。請(qǐng)注意,獨(dú)立變量位于水平軸(或X軸)上,因變量位于垂直軸(或Y軸)上。散點(diǎn)圖顯示胎齡與出生體重之間存在正向或直接關(guān)聯(lián)。胎齡越短的嬰兒出生體重越低,胎齡越長(zhǎng)的嬰兒出生體重越高的可能性越大。

x和y的方差測(cè)量其各自樣本均值附近的x分?jǐn)?shù)和y分?jǐn)?shù)的變化性(

正如我們對(duì)孕齡所做的那樣計(jì)算出生體重的方差,如下表所示。



計(jì)算總結(jié)如下。請(qǐng)注意,我們只是簡(jiǎn)單地將平均孕齡和出生體重的偏差從上表中的兩張表中復(fù)制到下表中并進(jìn)行相乘。
?


毫不奇怪,樣本相關(guān)系數(shù)表明強(qiáng)正相關(guān)。
正如我們所指出的,樣本相關(guān)系數(shù)范圍從-1到+1。在實(shí)踐中,對(duì)于正(或負(fù))關(guān)聯(lián)而言,有意義的相關(guān)性(即臨床上或?qū)嶋H上重要的相關(guān)性)可小至0.4(或-0.4)。還有統(tǒng)計(jì)測(cè)試來(lái)確定觀察到的相關(guān)性是否具有統(tǒng)計(jì)顯著性(即統(tǒng)計(jì)顯著性不同于零)。?