Hum Brain Mapp:腦電圖中的性別相關(guān)模式及其在機(jī)器學(xué)習(xí)分類器中的相關(guān)性

導(dǎo)讀
深度學(xué)習(xí)越來越多地用于從腦電圖(EEG)數(shù)據(jù)中檢測(cè)神經(jīng)和精神疾病,但該方法容易無意中納入訓(xùn)練數(shù)據(jù)的偏差并利用不合理的模式。最近的研究表明,深度學(xué)習(xí)可以通過EEG檢測(cè)性別,這意味著在基于深度學(xué)習(xí)的疾病檢測(cè)器中可能存在與性別相關(guān)的偏見,因?yàn)樵S多疾病在男性和女性之間的患病率不平等。在這項(xiàng)工作中,研究者介紹了卷積神經(jīng)網(wǎng)絡(luò)使用的男性和女性典型模式,該網(wǎng)絡(luò)可從臨床EEG中檢測(cè)性別(在包含142名患者的單獨(dú)測(cè)試集中,準(zhǔn)確率為81%)。本研究考慮了神經(jīng)源、解剖差異和非神經(jīng)偽影作為EEG波形差異的來源。使用來自1140名患者的腦電圖發(fā)現(xiàn),心電偽影泄露到所謂的基于大腦活動(dòng)的分類器中。盡管如此,在排除了心臟相關(guān)和其他偽跡后,性別仍然可以檢測(cè)到。在清理后的數(shù)據(jù)中,腦電地形圖對(duì)于性別檢測(cè)非常重要,但波形和頻率則不是那么重要。由此可見,傳統(tǒng)的頻段對(duì)于性別檢測(cè)并不特別重要。我們甚至能夠從隨機(jī)時(shí)間點(diǎn)和異常腦電圖中確定性別。研究人員應(yīng)該將神經(jīng)和非神經(jīng)源視為數(shù)據(jù)中性別差異的潛在來源,即使數(shù)據(jù)集很大,也應(yīng)該保持良好的偽跡排除實(shí)踐,并測(cè)試其分類器是否存在性別偏見。
前言
深度學(xué)習(xí)的出現(xiàn)引發(fā)了大量關(guān)于卷積神經(jīng)網(wǎng)絡(luò)(CNNs)的研究,用于從腦電圖(EEG)數(shù)據(jù)中檢測(cè)神經(jīng)和精神疾病。CNNs的有趣之處在于其能夠從EEG中發(fā)現(xiàn)和利用以前未知的模式,因?yàn)檫@些獨(dú)特的模式可以從數(shù)據(jù)中學(xué)習(xí),而無需根據(jù)事先假設(shè)來手動(dòng)執(zhí)行。然而,這些模式僅根據(jù)其與結(jié)果的相關(guān)性來估計(jì),而不是按照生物醫(yī)學(xué)的嚴(yán)格性設(shè)計(jì)。因此,CNNs和許多其他深度學(xué)習(xí)技術(shù)可能傾向于利用與病理本身無直接關(guān)系的不合理標(biāo)準(zhǔn),例如性別。這種性別偏見的模式可能具有神經(jīng)和非神經(jīng)的起源。無論哪種方式,許多機(jī)器學(xué)習(xí)分類器的獨(dú)特特征仍然是隱藏的,因?yàn)榭山忉屝酝ǔ1徽J(rèn)為是不必要的,或者所需的可解釋性方法不適用于所使用的技術(shù)。基于機(jī)器學(xué)習(xí)的研究通常涉及比傳統(tǒng)腦電研究更大的數(shù)據(jù)集。通常情況下,這些大型數(shù)據(jù)集中的單個(gè)記錄未得到充分處理,在分析過程中會(huì)留下偽跡,包括在傳統(tǒng)研究中較少出現(xiàn)的帶有性別偏見的偽跡。
許多使用基于深度學(xué)習(xí)的EEG分析來研究的疾病在男性和女性之間的患病率存在明顯的不平等。例如,重度抑郁癥和阿爾茨海默病在女性中更為普遍,而物質(zhì)使用障礙和帕金森病在男性中更為普遍。長(zhǎng)期以來報(bào)告的EEG中的性別差異和機(jī)器學(xué)習(xí)的自動(dòng)性別檢測(cè)表明,與性別相關(guān)的模式可能會(huì)干擾基于機(jī)器學(xué)習(xí)的EEG評(píng)估。機(jī)器學(xué)習(xí)模型可能在本應(yīng)僅基于病理學(xué)的預(yù)測(cè)中納入患者的性別。EEG數(shù)據(jù)集中的性別相關(guān)偏見可能源自疾病的患病率不平等和實(shí)際的電生理性別差異,也可能來自診斷的不平等或?qū)で笾委煹囊庠覆黄降取?/p>
本文主要解決以下三個(gè)方面的研究問題:
1、從EEG中檢測(cè)性別是否需要特殊的網(wǎng)絡(luò)架構(gòu),或者常用的CNN架構(gòu)是否可以檢測(cè)到性別?
2、EEG信號(hào)中的哪些模式與CNN檢測(cè)性別有關(guān),這些模式是什么樣的?
3、能否分離出EEG中性別差異的神經(jīng)和非神經(jīng)源?
本研究展示了非神經(jīng)源偽跡(尤其是心電偽跡)對(duì)基于深度學(xué)習(xí)的性別檢測(cè)的影響,并提出了減少此類偽跡影響的措施。在經(jīng)過偽跡清理的數(shù)據(jù)上,本研究呈現(xiàn)了地形,波形和頻率的觀察結(jié)果,從而允許對(duì)EEG中性別差異的來源做出新的假設(shè)。最后,本研究討論了性別可檢測(cè)性對(duì)基于機(jī)器學(xué)習(xí)的疾病評(píng)估的影響。
材料和方法
數(shù)據(jù)集準(zhǔn)備和信號(hào)濾波
本研究使用了臨床TUH異常EEG語料庫(kù)(2.0.0)進(jìn)行實(shí)驗(yàn),選取了1505份標(biāo)注為正常的記錄。其中67個(gè)記錄因采樣率與其他記錄不同而被刪除,以避免由于未知差異可能引入的偏差。每例患者只允許有一個(gè)記錄,因此又有107個(gè)記錄被剔除。數(shù)據(jù)集中的記錄被數(shù)據(jù)集的作者分成單獨(dú)的目錄用于訓(xùn)練和評(píng)估,本研究保留了這種劃分以便與其他研究進(jìn)行比較(訓(xùn)練子集:1140名患者,636名(56%)女性,504名(44%)男性;評(píng)估子集:142名其他患者,61名男性(43%),81名女性(57%),年齡范圍18-88歲,年齡均值±SD=45±17歲)。本研究的目標(biāo)是利用盡可能多的可用信息,并通過在網(wǎng)絡(luò)訓(xùn)練過程中使用類權(quán)重來計(jì)算代價(jià)函數(shù),報(bào)告平衡準(zhǔn)確率以及在統(tǒng)計(jì)測(cè)試中從總體均值中得出p0,以糾正語料庫(kù)中的不平衡情況(57%的女性)。每個(gè)記錄(250Hz采樣率,使用10-20放置的21個(gè)EEG通道)使用Autoreject方法選擇50個(gè)非重疊的段(長(zhǎng)度為4s)。每次記錄的前2分鐘被跳過,因?yàn)橥ǔT陂_始時(shí)需要對(duì)電極進(jìn)行重新調(diào)整。在2~8s之間進(jìn)行參數(shù)研究后確定了最佳段長(zhǎng),結(jié)果顯示超過4s沒有明顯益處。由于噪聲和偽跡問題,49個(gè)記錄無法產(chǎn)生足夠數(shù)量的段,因此被排除在外。本研究選擇50段作為閾值,因?yàn)楦蟮臄?shù)值將導(dǎo)致大量病例被排除,而更小的數(shù)值會(huì)導(dǎo)致數(shù)據(jù)段的浪費(fèi)。將信號(hào)進(jìn)行1-40Hz的帶通濾波,以顯示這個(gè)常用頻率范圍內(nèi)的信號(hào)效應(yīng)。
在對(duì)不良通道進(jìn)行插值后,使用獨(dú)立成分分析(ICA)濾除偽跡。采用Corrmap方法,半自動(dòng)地選擇并去除心電圖(ECG)和眼電圖(EOG)偽跡成分。該算法從20個(gè)ICA成分中平均拒絕了兩個(gè)偽跡成分。最后,將這些時(shí)段進(jìn)行共同平均參考,去均值,并歸一化為單位標(biāo)準(zhǔn)差。
用于性別檢測(cè)的簡(jiǎn)單CNN
本研究構(gòu)建了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN),可以從幾秒鐘的EEG片段中檢測(cè)患者的性別。研究者設(shè)計(jì)了一個(gè)小型淺層網(wǎng)絡(luò)架構(gòu),假設(shè)從該架構(gòu)的發(fā)現(xiàn)可以推廣到大多數(shù)用于EEG分析的深度學(xué)習(xí)架構(gòu);無論這個(gè)CNN能檢測(cè)到什么,都應(yīng)該很容易被更深層次的網(wǎng)絡(luò)檢測(cè)到,因?yàn)樗鼈兊臄M合能力更強(qiáng)。表1列出了完整的網(wǎng)絡(luò)架構(gòu)和超參數(shù),圖1說明了網(wǎng)絡(luò)中的數(shù)據(jù)流。該網(wǎng)絡(luò)在TensorFlow 2.7.0中實(shí)現(xiàn),并被稱為最小化時(shí)空網(wǎng)絡(luò)(Mini-SpaTeN)。


本研究設(shè)計(jì)的CNN只有兩個(gè)可訓(xùn)練層,即一個(gè)卷積層和一個(gè)全連接層。網(wǎng)絡(luò)的工作原理如下:卷積層接收EEG數(shù)據(jù)矩陣作為輸入,并計(jì)算EEG數(shù)據(jù)矩陣與濾波矩陣(也稱為卷積核)之間的互相關(guān)。卷積核的數(shù)值是可訓(xùn)練參數(shù),而卷積核的數(shù)量和長(zhǎng)度是不可訓(xùn)練的超參數(shù)。本研究測(cè)試了這些超參數(shù)的影響,并發(fā)現(xiàn)對(duì)于不同數(shù)量和長(zhǎng)度的卷積核,在性別檢測(cè)的準(zhǔn)確性上差異不大。然后,選擇適合于學(xué)習(xí)參數(shù)的可視化和輸出的數(shù)值(16個(gè)卷積核,19個(gè)樣本長(zhǎng)度,相當(dāng)于76ms)。這些卷積核較短、類似于EEG模式。這些時(shí)空卷積核可以反映地形、波形和頻率,以及跨空間、時(shí)間和頻譜的關(guān)系。卷積核與EEG時(shí)段的互相關(guān)導(dǎo)致每個(gè)卷積核產(chǎn)生一個(gè)時(shí)間序列,表示每個(gè)卷積核如何隨時(shí)間的推移與EEG數(shù)據(jù)匹配。接下來,對(duì)這些時(shí)間序列應(yīng)用無偏的ReLU(修正線性單元)激活函數(shù),將所有負(fù)相關(guān)值設(shè)為零,保留正值不變。對(duì)于每個(gè)時(shí)間序列,當(dāng)數(shù)據(jù)包含與某個(gè)卷積核非常相似的段時(shí),網(wǎng)絡(luò)會(huì)計(jì)算出一個(gè)較高的值。本研究不再只使用每個(gè)卷積核的單個(gè)最大相關(guān)值,而是將40個(gè)重疊間隔上(最大池化層和全局平均層)的最大相關(guān)值取平均值,以提高魯棒性。最后,通過sigmoid激活函數(shù)的全連接層對(duì)這16個(gè)平均值進(jìn)行分類,與邏輯回歸相同。在輸出層選擇sigmoid激活函數(shù),將輸出映射到0-1之間,對(duì)應(yīng)于編碼的性別(0=女性,1=男性)。由于第一層的ReLU函數(shù)剔除了負(fù)值,因此邏輯回歸層中權(quán)重的符號(hào)直接告訴我們哪個(gè)卷積核是男性特征,哪個(gè)是女性特征。
本研究訓(xùn)練了CNN來最小化準(zhǔn)確率的二元交叉熵?fù)p失,通過自適應(yīng)動(dòng)量估計(jì)反向傳播(Adam)平衡類別權(quán)重。損失指標(biāo)通常在5個(gè)迭代周期(一個(gè)周期表示對(duì)整個(gè)數(shù)據(jù)集的一次迭代)后收斂。總共進(jìn)行了20個(gè)迭代周期,并在20%的保留部分上選擇性能最佳的模型,這部分?jǐn)?shù)據(jù)既沒有用于訓(xùn)練權(quán)重,也沒有用于后續(xù)的評(píng)估。卷積核和邏輯回歸層的權(quán)重是隨機(jī)初始化的,在訓(xùn)練過程中它們會(huì)迭代地收斂到分類任務(wù)(在本例中為性別檢測(cè))的最佳模式/值。
使用經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)和性能評(píng)估
在將網(wǎng)絡(luò)應(yīng)用于50個(gè)不同的片段后,通過多數(shù)投票來對(duì)每個(gè)受試者進(jìn)行性別預(yù)測(cè)??紤]到男女?dāng)?shù)量不平衡的情況,本研究報(bào)告平衡準(zhǔn)確率?,即真陽性率和真陰性率的算術(shù)平均值。為了更好地與其他研究進(jìn)行比較,本研究還報(bào)告了傳統(tǒng)準(zhǔn)確率,即正確預(yù)測(cè)的百分比。本研究報(bào)告了30個(gè)網(wǎng)絡(luò)的數(shù)值及其均值和標(biāo)準(zhǔn)差,這些網(wǎng)絡(luò)是在相同數(shù)據(jù)上獨(dú)立隨機(jī)初始化并進(jìn)行訓(xùn)練的。為了探索該網(wǎng)絡(luò)架構(gòu)的精度極限,將卷積核的數(shù)量增加到512,通過多數(shù)投票的方式從30個(gè)獨(dú)立隨機(jī)初始化并在相同數(shù)據(jù)上訓(xùn)練的網(wǎng)絡(luò)中進(jìn)行集成預(yù)測(cè)。
使用單側(cè)的二項(xiàng)式檢驗(yàn),對(duì)于n=15個(gè)多重比較進(jìn)行Bonferroni校正,得到了調(diào)整后的顯著性水平α=0.003。p0是根據(jù)總體均值(142個(gè)受試者,57%女性)計(jì)算得出的。
特征可視化和相關(guān)性歸因
淺層網(wǎng)絡(luò)架構(gòu)的優(yōu)勢(shì)在于可以直接從學(xué)習(xí)到的權(quán)重中讀取到獨(dú)特的模式。學(xué)習(xí)到的權(quán)重包括卷積核和密集輸出層的元素。網(wǎng)絡(luò)(直到倒數(shù)第二層)能夠產(chǎn)生每個(gè)卷積核Kk與數(shù)據(jù)的匹配程度。然后,密集輸出層中權(quán)重Wk的符號(hào)表明與每個(gè)卷積核的匹配是使得預(yù)測(cè)偏向男性還是女性。
確定每個(gè)通道和時(shí)間點(diǎn)的EEG信號(hào)與網(wǎng)絡(luò)決定男性和女性之間的相關(guān)性R。網(wǎng)絡(luò)的淺層和簡(jiǎn)單性允許在不涉及復(fù)雜的可解釋性框架的情況下推導(dǎo)出R的值:CNN掃描每個(gè)4s的EEG片段X,在40個(gè)重疊窗口Xi中,每個(gè)窗長(zhǎng)為300ms,重疊時(shí)間為100ms。在這些窗口中,只有數(shù)據(jù)和卷積核之間相關(guān)性最大的部分有助于最終的預(yù)測(cè)。掃描首先生成數(shù)據(jù)矩陣和卷積核之間的互相關(guān)時(shí)間序列Ck。

為了計(jì)算每個(gè)窗口中每個(gè)卷積核在最大相關(guān)性時(shí)間點(diǎn)的相關(guān)矩陣Ri,k,首先定義:

其中,X(arg max(Ci,k))是與卷積核大小相同的子矩陣,符號(hào)⊙表示逐元素的Hadamard乘積。接下來:

然后,將不同片段在其相應(yīng)時(shí)間點(diǎn)的相關(guān)性進(jìn)行求和,得到了與數(shù)據(jù)矩陣具有相同維數(shù)的特定于卷積核的相關(guān)性矩陣。最后,對(duì)所有特定于卷積核的相關(guān)性矩陣進(jìn)行求和,以確定總體相關(guān)性,然后將其以紅色和藍(lán)色的色調(diào)覆蓋在數(shù)據(jù)之上(圖1)。
結(jié)果
從原始、濾波和實(shí)驗(yàn)修改后的數(shù)據(jù)中檢測(cè)患者的性別表2列出了不同實(shí)驗(yàn)的準(zhǔn)確率。在未進(jìn)行任何偽跡處理的腦電數(shù)據(jù)上,本研究中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)以78%±2%的準(zhǔn)確率檢測(cè)出了患者的性別(p<0.001,平衡準(zhǔn)確率)。在去除偽跡后,平衡準(zhǔn)確率降至74%±2%(p<0.001)。使用帶通濾波后的數(shù)據(jù)(δ、θ、α、β、γ;頻率范圍見表2)重復(fù)整個(gè)流程(訓(xùn)練和預(yù)測(cè)),得到了相同或略小的準(zhǔn)確率。所有頻段之間的差異均不顯著,并且任意兩個(gè)頻段之間的最大差異為4%(α和γ之間)。當(dāng)對(duì)時(shí)域進(jìn)行混洗并將時(shí)空卷積核縮小到單個(gè)時(shí)間點(diǎn)時(shí),仍然可以進(jìn)行性別檢測(cè)(68%±3%,p=0.002)。從地形圖中也可以進(jìn)行性別檢測(cè),對(duì)于每個(gè)頻段,使用帶通濾波后的數(shù)據(jù)甚至可以獲得更高的準(zhǔn)確率(最高增加了5%)。同樣,所有頻段之間的差異不顯著。任意兩個(gè)頻段之間的最大差異僅為3%(α和γ之間)。使用時(shí)空卷積核和混洗的地形圖,則不能進(jìn)行性別檢測(cè)(61%,p=0.17)。本研究使用30個(gè)網(wǎng)絡(luò)進(jìn)行集成預(yù)測(cè),估計(jì)該架構(gòu)和數(shù)據(jù)集的平衡準(zhǔn)確率為81%。

本研究搜索了被錯(cuò)誤分類的患者之間的共同點(diǎn),但發(fā)現(xiàn)在各類患者中都存在錯(cuò)誤分類:男性和女性、年輕人和老年人、有無用藥、以及不同病史的患者。ICA濾波數(shù)據(jù)和時(shí)空卷積核實(shí)驗(yàn)的混淆矩陣(表3)無顯著偏差(p=0.20)。

淺層CNN的單通道自適應(yīng)無法從ECG通道預(yù)測(cè)性別(58%,p=0.22)。對(duì)于單個(gè)EEG通道,額葉通道的準(zhǔn)確率最高。當(dāng)允許越來越多的通道,并始終添加最佳的下一個(gè)通道時(shí),選定的傳感器將遍布頭部。六個(gè)通道(F4,F(xiàn)p2,C4,T6,Pz,O1)的準(zhǔn)確率已經(jīng)>70%。圖2顯示了單個(gè)EEG通道的準(zhǔn)確率和估計(jì)的最佳添加順序。

原始數(shù)據(jù)與ICA濾波數(shù)據(jù)的相關(guān)性歸因比較圖3顯示了一個(gè)典型的具有相關(guān)性映射覆蓋的數(shù)據(jù)段。就原始數(shù)據(jù)而言,可視化分析顯示了心電QRS復(fù)合波期間有很強(qiáng)的相關(guān)性積累,但ECG中可見T波的間期或脈沖波間期則沒有?;贗CA的偽跡去除有效地降低了相關(guān)性的積累。如圖4所示,通過對(duì)所有受試者的QRS時(shí)段周圍的相關(guān)性時(shí)間序列進(jìn)行平均,總體上證實(shí)了這種積累和降低。


結(jié)論
本研究從EEG中復(fù)制了基于神經(jīng)網(wǎng)絡(luò)的性別檢測(cè)。本文以淺層神經(jīng)網(wǎng)絡(luò)為例,介紹了一種相關(guān)性歸因方法,并展示了腦電數(shù)據(jù)中的性別相關(guān)模式。研究發(fā)現(xiàn),非神經(jīng)源(特別是心電)會(huì)給EEG帶來性別偏見成分,但即使剔除了這些偽跡,性別仍然高度可檢測(cè)。本研究結(jié)果表明,幾乎任何神經(jīng)網(wǎng)絡(luò)在腦電分析中都能很容易地檢測(cè)到性別。對(duì)于男女患病率不平等的許多神經(jīng)系統(tǒng)和精神疾病而言,性別很可能是一個(gè)潛在的混雜因素。因此,應(yīng)對(duì)疾病分類器進(jìn)行性別偏見分析。
參考文獻(xiàn):Thomas Jochmann,?Marc S. Seibel. et al. Sex-related patterns in the electroencephalogram and their relevance in machine learning classifiers. Hum Brain Mapp. 2023;1-11. DOI: 10.1002/hbm.26417
小伙伴們關(guān)注茗創(chuàng)科技,將第一時(shí)間收到精彩內(nèi)容推送哦~
