考研分?jǐn)?shù)“信度”幾何
再過(guò)幾天,2023年全國(guó)碩士研究生招生考試將迎來(lái)初試。作為國(guó)家選拔人才的重要方式,考研選拔中的“唯分?jǐn)?shù)論”導(dǎo)向一直受到學(xué)術(shù)界質(zhì)疑。追根溯源,這主要是對(duì)研究生招生考試預(yù)測(cè)準(zhǔn)確性的懷疑。
考研分?jǐn)?shù)能否代表學(xué)生日后的學(xué)業(yè)表現(xiàn),又在學(xué)業(yè)表現(xiàn)的哪些方面起到作用?除考分外,是否有更好的預(yù)測(cè)指標(biāo)選拔研究生?這些問(wèn)題亟待解答。
三點(diǎn)原因致研究生“高分低能”
碩士研究生入學(xué)考試作為研究生教育的起點(diǎn),對(duì)研究生培養(yǎng)起著至關(guān)重要的作用。近年來(lái),通過(guò)研究生選拔考試脫穎而出的人才,往往受到“高分低能”的詬病,即只有高分?jǐn)?shù),卻缺乏創(chuàng)新意識(shí)和科研實(shí)踐能力。
比如,有研究者提出,當(dāng)前研究生考試沒(méi)有跳出應(yīng)試教育的窠臼,其命題原則實(shí)際上鼓勵(lì)學(xué)生對(duì)考題死記硬背。這種方式很難挑選出有才能的學(xué)生,往往導(dǎo)致善于考高分的人進(jìn)入寶塔頂尖,真正有潛力的學(xué)生卻被埋沒(méi)。
從已有研究結(jié)果看,考研分?jǐn)?shù)對(duì)研究生學(xué)業(yè)表現(xiàn)的預(yù)測(cè)準(zhǔn)確性確實(shí)不容樂(lè)觀。比如,有學(xué)者曾對(duì)國(guó)內(nèi)某“雙一流”高校546名碩士生的畢業(yè)論文成績(jī)與入學(xué)考試初試成績(jī)進(jìn)行過(guò)研究,發(fā)現(xiàn)二者之間甚至呈現(xiàn)出顯著的負(fù)相關(guān)關(guān)系。
至于原因,學(xué)界一般認(rèn)為有如下幾個(gè)方面。
一是考試命題問(wèn)題。根據(jù)教育部2021年出臺(tái)的《2022年全國(guó)碩士研究生招生工作管理規(guī)定》,研究生入學(xué)考試中,全國(guó)統(tǒng)一考試的全部或部分考試科目由教育部考試中心統(tǒng)一命題,其他考試科目由招生單位根據(jù)大綱自行命題。
由于采取自命題筆試的高校較多,水平參差不齊,導(dǎo)致在試題質(zhì)量與管理規(guī)范性上與統(tǒng)考存在差距。同時(shí),初試筆試科目各不相同,復(fù)試階段卻采取統(tǒng)一劃線,導(dǎo)致初試分?jǐn)?shù)的可比性變差。
二是研究生選拔過(guò)程重筆試、輕復(fù)試,學(xué)生非認(rèn)知能力因素(如考生考研動(dòng)機(jī)、意志品質(zhì))較難得到考查。近年來(lái),勞動(dòng)力市場(chǎng)“學(xué)歷門檻”的上升,導(dǎo)致大量學(xué)生的考研目的只是為拿到碩士文憑、改變工作處境,對(duì)學(xué)術(shù)科研毫無(wú)興趣。雖然復(fù)試環(huán)節(jié)可以考查學(xué)生的動(dòng)機(jī)和興趣,但生源一般的招生單位為滿足擴(kuò)招需要,往往采取等額復(fù)試的方式,或者重初試分?jǐn)?shù),淡化復(fù)試表現(xiàn),導(dǎo)致學(xué)生的考研動(dòng)機(jī)和創(chuàng)新能力難以得到有效甄別。
三是高校對(duì)學(xué)生本科學(xué)業(yè)表現(xiàn)考查不足。國(guó)外大學(xué)對(duì)于申請(qǐng)人認(rèn)知因素的考查方式,主要是本科成績(jī)和標(biāo)準(zhǔn)化入學(xué)考試(如GRE)。雖然國(guó)內(nèi)高校在研究生復(fù)試階段也會(huì)要求學(xué)生提交本科成績(jī)單,但由于復(fù)試周期較短,招生單位往往沒(méi)有充分時(shí)間核實(shí)材料的真實(shí)性,也無(wú)法發(fā)揮本科成績(jī)的評(píng)價(jià)作用。
同時(shí),國(guó)外高校在研究生選拔過(guò)程中,往往采用“本科院校競(jìng)爭(zhēng)性水平”的概念衡量學(xué)校間教學(xué)質(zhì)量水平的差異。有研究者認(rèn)為,如果將這一概念作為學(xué)生平均學(xué)分績(jī)點(diǎn)(GPA)的權(quán)重因素,可進(jìn)一步提升本科GPA的參考價(jià)值。在我國(guó),鑒于現(xiàn)行研究生招考制度難以分辨學(xué)生是否具備科研潛力,部分招生單位在自主招生時(shí),也會(huì)看重申請(qǐng)者的本科院校水平。
然而,對(duì)此也有人提出質(zhì)疑。
北京大學(xué)教授岳昌君曾對(duì)北京市高校碩士研究生創(chuàng)新能力進(jìn)行過(guò)調(diào)查。發(fā)現(xiàn)來(lái)自原“985工程”高校學(xué)生的創(chuàng)新精神得分高于原“211工程”高校的學(xué)生,兩者均高于普通本科高校學(xué)生,但這幾種差異在統(tǒng)計(jì)上并不顯著。
那么,到底是考研分?jǐn)?shù)對(duì)研究生未來(lái)學(xué)業(yè)表現(xiàn)預(yù)測(cè)更準(zhǔn)確,還是本科學(xué)校層次和學(xué)業(yè)成績(jī)對(duì)研究生綜合素質(zhì)反映更全面,抑或有其他因素會(huì)產(chǎn)生影響?對(duì)這些問(wèn)題的回答將有助于我們未來(lái)制定更科學(xué)、有效的研究生人才選拔制度。
生源高校層次與答辯分?jǐn)?shù)關(guān)系不大
為探尋相關(guān)答案,筆者和研究團(tuán)隊(duì)收集了北京某高校某學(xué)院2015年—2020年間所有碩士研究生的數(shù)據(jù),并對(duì)這些學(xué)生入學(xué)前提交的原始本科成績(jī)單、2015年—2020年研究生入學(xué)考試數(shù)據(jù),以及其入學(xué)后學(xué)業(yè)表現(xiàn)數(shù)據(jù)進(jìn)行了分析。
結(jié)果發(fā)現(xiàn),推免生的平均GPA要高于統(tǒng)考生,但在同類型碩士生中,本科學(xué)校的層次不影響其學(xué)業(yè)表現(xiàn)。原“985工程”高校統(tǒng)考學(xué)生在研究生階段的平均GPA為83.62,原“211工程”高校統(tǒng)考學(xué)生的平均GPA為82.24,而“雙非”高校統(tǒng)考學(xué)生平均GPA為82.26。近似的對(duì)比關(guān)系也出現(xiàn)在三種類型高校的推免生中。
可以看出,上述數(shù)值與學(xué)生的本科院校層次的相關(guān)性非常弱。同時(shí),雖然推免生在學(xué)業(yè)表現(xiàn)上要高于統(tǒng)考生,但兩者在科研表現(xiàn)上卻無(wú)顯著差異。其原因可能是由于獲得推免資格的學(xué)生在本科階段學(xué)業(yè)優(yōu)異,因此在研究生階段比統(tǒng)考生更擅長(zhǎng)拿高分。
從平均GPA與畢業(yè)論文答辯分?jǐn)?shù)的關(guān)系上看,來(lái)自不同層次高校的學(xué)生仍無(wú)明顯差異。然而,如果單獨(dú)分析推免生的科研表現(xiàn),會(huì)發(fā)現(xiàn)來(lái)自原“211工程”高校的推免生中,有學(xué)術(shù)論文發(fā)表或競(jìng)賽得獎(jiǎng)經(jīng)歷的學(xué)生比例顯著高于來(lái)自原“985工程”高校的推免生——后者在本科階段有獲獎(jiǎng)經(jīng)歷的學(xué)生占比為80.7%,前者則高達(dá)98.2%。
這與常理似乎并不一致。
究其原因,可能是由于原“985工程”高校對(duì)來(lái)自原“211工程”高校推免生的要求更為嚴(yán)格,學(xué)生需同時(shí)擁有優(yōu)異的學(xué)業(yè)成績(jī)和科研獲獎(jiǎng)經(jīng)歷才能通過(guò)篩選,而這些因素都對(duì)學(xué)生的科研潛力具有顯著影響。反之,原“985工程”高校對(duì)推免生,特別是本校生源的推免生條件較為寬松。
如果將研究生考研分?jǐn)?shù)細(xì)分為各個(gè)單科,會(huì)發(fā)現(xiàn)研究生階段的平均績(jī)點(diǎn)與其入學(xué)前的所有考試因素均無(wú)顯著關(guān)系,但大學(xué)英語(yǔ)四級(jí)分?jǐn)?shù)與研究生復(fù)試的面試分?jǐn)?shù)越高的碩士生,越傾向于在畢業(yè)論文答辯中獲得高分。
這可能由于畢業(yè)論文的答辯涉及多方面因素,除學(xué)生查閱文獻(xiàn)與寫作能力外,也受到學(xué)生臨場(chǎng)發(fā)揮和表達(dá)能力的影響。因此,研究生面試中取得高分可在一定程度上幫助該生在答辯環(huán)節(jié)獲得更好表現(xiàn),而英語(yǔ)能力有助于學(xué)生在論文寫作時(shí)的文獻(xiàn)查閱。
同時(shí),這也能在相當(dāng)程度上說(shuō)明,統(tǒng)考學(xué)生的考研分?jǐn)?shù)并不能保證其在研究生階段取得更好成績(jī)。
此外,碩士研究生在科研方面的表現(xiàn)依然與其入學(xué)考試各單科成績(jī)無(wú)關(guān),只與學(xué)生在本科階段的各項(xiàng)表現(xiàn)有關(guān)。那些在入學(xué)考試中取得高分的統(tǒng)考學(xué)生,雖然會(huì)在研究生階段獲得更高的GPA,但在科研能力或綜合學(xué)術(shù)創(chuàng)新能力上,其表現(xiàn)并不強(qiáng)于入學(xué)成績(jī)較低的學(xué)生。
縮小初試占比,更重本科學(xué)業(yè)考查
通過(guò)上述研究,我們發(fā)現(xiàn)當(dāng)前的研究生選拔機(jī)制重知識(shí)、輕實(shí)踐創(chuàng)新的現(xiàn)象依然很明顯,通過(guò)考試分?jǐn)?shù)篩選出的學(xué)生與當(dāng)前的研究生培養(yǎng)教育宗旨也并不吻合。與此同時(shí),學(xué)生在本科階段的學(xué)業(yè)表現(xiàn)卻對(duì)其研究生階段表現(xiàn)有著至關(guān)重要的影響,尤其是本科獲獎(jiǎng)經(jīng)歷與大學(xué)英語(yǔ)四級(jí)成績(jī)。
此外,正如前文所言,目前本科學(xué)校競(jìng)爭(zhēng)性在推免生群體中還出現(xiàn)了“反向作用”——具備科研潛力的學(xué)生比例在原“211工程”高校群體中更高,這一點(diǎn)也需要引起我們的注意。
基于上述研究結(jié)果,筆者認(rèn)為要提升研究生的學(xué)科表現(xiàn),需從以下方面進(jìn)行政策調(diào)整。
首先,改革研究生入學(xué)考試內(nèi)容,增加綜合能力考查,促進(jìn)初試命題的統(tǒng)一性。當(dāng)前的研究生入學(xué)考試更注重對(duì)基礎(chǔ)知識(shí)和通識(shí)知識(shí)的考查,容易導(dǎo)致高分考生只會(huì)考試,不會(huì)做學(xué)術(shù)研究。因此,在命題時(shí)增加專業(yè)能力和創(chuàng)新能力試題尤為重要。同時(shí),初試中眾多高校采取自命題形式,難以保證筆試環(huán)節(jié)的公平性與科學(xué)性,應(yīng)逐步采取國(guó)家統(tǒng)一初試命題、復(fù)試由各校自行組織的統(tǒng)分結(jié)合形式。
其次,縮小初試分?jǐn)?shù)占比,采取多種形式的考核策略。研究生入學(xué)考試的目的是選拔專業(yè)能力與科研潛力強(qiáng)的學(xué)生,但這些能力在筆試分?jǐn)?shù)中無(wú)法得到全面反映。研究發(fā)現(xiàn),面試表現(xiàn)更好的學(xué)生易獲得更高的論文答辯分,這與學(xué)生的表達(dá)溝通能力相關(guān)。高校應(yīng)在復(fù)試中更多體現(xiàn)出多樣性和自主性選拔,使用多種策略考查學(xué)生專業(yè)能力,比如在復(fù)試中增加學(xué)生外文文獻(xiàn)閱讀、現(xiàn)場(chǎng)實(shí)驗(yàn)操作以及學(xué)術(shù)匯報(bào)等。
最后,加大對(duì)學(xué)生本科學(xué)業(yè)表現(xiàn)的考查。當(dāng)前,各高校一般會(huì)在復(fù)試環(huán)節(jié)要求學(xué)生提交本科成績(jī)單及獲獎(jiǎng)經(jīng)歷,但該制度往往流于表面。反觀國(guó)外,相關(guān)材料往往在申請(qǐng)環(huán)節(jié)就提交給學(xué)校,這種做法值得借鑒。