互助問(wèn)答第14期:工具變量和多重共線性

問(wèn):工具變量到什么程度才合適?
對(duì)短面板數(shù)據(jù)進(jìn)行GMM回歸的時(shí)候,遇到兩種情況:
①工具變量通過(guò)了弱工具變量檢驗(yàn)、識(shí)別不足和過(guò)度識(shí)別檢驗(yàn),再用DM檢驗(yàn)的時(shí)候還是顯著的;
②工具變量通過(guò)了弱工具變量檢驗(yàn)、識(shí)別不足和過(guò)度識(shí)別檢驗(yàn),但用DM檢驗(yàn)的時(shí)候不是顯著的;
看到連玉君教授的一篇文章,選了兩個(gè)工具變量,匯報(bào)了工具變量通過(guò)了識(shí)別不足和過(guò)度識(shí)別檢驗(yàn),DWH檢驗(yàn)顯著。
由此,認(rèn)為符合第一種情況表明選取的工具變量合適;但也不太確定,想聽聽您的看法。
答:工具變量方法經(jīng)歷了兩個(gè)階段的發(fā)展。傳統(tǒng)的工具變量方法中,在線性模型設(shè)定下,工具變量需要滿足工具變量外生性和工具變量相關(guān)性兩個(gè)假設(shè),這在本科層次的計(jì)量教科書中一般都有涉及。在這種情況下,滿足這兩個(gè)假設(shè)的變量才是合格的工具變量。Imbens and Angrist(1994)一文的發(fā)表則將工具變量方法推向了新的階段,在這一發(fā)展階段,允許異質(zhì)性處理效應(yīng)存在,工具變量方法識(shí)別假設(shè)的提出和估計(jì)量的推導(dǎo)都是在Donald Rubin提出的潛在結(jié)果分析框架下進(jìn)行的,此時(shí)IV估計(jì)的是局部平均處理效應(yīng),IV估計(jì)的有效性要求工具變量滿足四個(gè)條件:(1)工具變量是隨機(jī)產(chǎn)生的;(2)滿足排他性約束;(3)滿足單調(diào)性假設(shè);(4)滿足工具變量相關(guān)性。嚴(yán)格的數(shù)學(xué)表達(dá)請(qǐng)參見Imbens and Angrist(1994)。提問(wèn)中提到的的“工具變量到什么程度才合適?”,準(zhǔn)確的回答應(yīng)該是滿足上述四條假設(shè)才合適。
提問(wèn)中提到的弱工具變量檢驗(yàn)用于檢驗(yàn)假設(shè)(4);識(shí)別不足檢驗(yàn)只需要滿足工具變量的個(gè)數(shù)多余內(nèi)生變量的個(gè)數(shù),這個(gè)通常都是滿足的;過(guò)度識(shí)別檢驗(yàn)是在假設(shè)不存在異質(zhì)性處理效應(yīng)的情況下,檢驗(yàn)工具變量是否外生的一種方法,該檢驗(yàn)只有在存在過(guò)度識(shí)別(工具變量個(gè)數(shù)(用N表示)多于內(nèi)生變量個(gè)數(shù)(用K表示))的情況下才可以做,并且要求至少有K個(gè)工具變量已經(jīng)滿足外生性條件,這樣才能檢驗(yàn)剩下的N-K個(gè)變量是否外生。因此,總結(jié)來(lái)看過(guò)度識(shí)別假設(shè)檢驗(yàn)需要兩個(gè)很強(qiáng)的假設(shè):(1)至少有K個(gè)有效地工具變量;(2)不存在異質(zhì)性處理效應(yīng),因此使用過(guò)度識(shí)別檢驗(yàn)檢驗(yàn)工具變量的外生性并不是一種可靠地方法,其檢驗(yàn)結(jié)果能夠提供的有效性信息并不多。DM檢驗(yàn)(此處指的應(yīng)該是Davidson-MacKinnon檢驗(yàn))則是用于檢驗(yàn)OLS估計(jì)量是否是一致估計(jì),即解釋變量是否存在內(nèi)生性的檢驗(yàn)方法,同更常用的Hausman test類似。有觀點(diǎn)認(rèn)為,只有當(dāng)DW檢驗(yàn)或者Hausman檢驗(yàn)拒絕原假設(shè),即顯示OLS估計(jì)存在內(nèi)生性的時(shí)候,才需要使用IV估計(jì),因?yàn)镮V估計(jì)雖然和OLS估計(jì)一樣是一致估計(jì)量的,但是有效性劣于OLS估計(jì)。但是,上述內(nèi)生性檢驗(yàn)依賴于我們已經(jīng)擁有了有效的工具變量,從而能夠得到一致估計(jì)量,這是很強(qiáng)的假設(shè),很難實(shí)現(xiàn),因?yàn)檎业揭粋€(gè)符合條件的IV實(shí)在太難了,更重要的是,我們無(wú)法保證我們所使用的工具變量是有效的,所以我們也無(wú)法保證DM檢驗(yàn)或者Hausman檢驗(yàn)的結(jié)論一定是有效的。在這種情況下,我本人更傾向于基于變量之間的理論關(guān)系和具體的模型設(shè)定來(lái)判斷OLS估計(jì)是否內(nèi)生,從而決定是否需要采用工具變量方法,而不是依賴于某個(gè)檢驗(yàn)。
參考文獻(xiàn):Imbens and Angrist, 1994,“Identification and Estimation of Local Average Treatment Effects”,?Econometrica, 62(2): 467-475.
問(wèn):如圖,自變量與交乘項(xiàng)多重共線性過(guò)高,怎么辦?


答:解釋變量之間存在高度的共線性本身并不一定影響方程的估計(jì)。首先,當(dāng)前實(shí)證研究的核心目的在于實(shí)現(xiàn)因果推斷,即估計(jì)某一個(gè)特定解釋變量X對(duì)被解釋變量Y的因果關(guān)系,如果高度共線性只是存在于控制變量之間,則既不會(huì)影響X參數(shù)估計(jì)的一致性,也不會(huì)影響有效性,我們完全無(wú)需擔(dān)心;其次,如果我們關(guān)心的變量X同其他控制變量,例如變量Z之間存在高度共線,則共線性本身不影響我們估計(jì)的一致性,但是會(huì)影響估計(jì)的有效性。在第二種情況下,如果Z本身對(duì)Y有影響,遺漏Z會(huì)導(dǎo)致嚴(yán)重的遺漏變量偏誤,因此,根據(jù)一致性優(yōu)先于有效性的原則,我們?nèi)匀恍枰刂谱兞?/span>Z;如果Z本身對(duì)Y沒(méi)有影響,則Z屬于無(wú)關(guān)變量,遺漏Z不會(huì)影響一致性,但能夠改善有效性,我們應(yīng)該從方程中去掉Z。
學(xué)術(shù)指導(dǎo):張曉峒老師?
本期解答人:張川川老師
編輯:粥粥? 小精靈? 一個(gè)聰慧的人
統(tǒng)籌:芋頭
技術(shù):知我者
