百趣代謝組學(xué)文獻(xiàn)分享:OnPLS方法在哮喘領(lǐng)域應(yīng)用研究
百趣代謝組學(xué)文獻(xiàn)分享,本周分享的文獻(xiàn)題目為OnPLS-Based Multi-Block Data Integration: A Multivariate Approach to Interrogating Biological Interactions in Asthma,是由日本前橋群馬大學(xué)創(chuàng)新研究中心Craig E. Wheelock教授課題組在2018年發(fā)表于Analytical chemistry上的一篇文章。
1代謝組學(xué)文獻(xiàn)分享—研究背景
在后基因組時(shí)代,隨著組學(xué)技術(shù)發(fā)展的日益成熟,多個(gè)不同組學(xué)之間的聯(lián)合分析越來越被科研工作者認(rèn)可接受,以期尋求不同組學(xué)間的內(nèi)在關(guān)系和規(guī)律趨勢(shì)。
代謝組學(xué)文獻(xiàn)分享,基于兩個(gè)不同組學(xué)聯(lián)合分析已有類似O2PLS等建模方法,但在兩個(gè)以上不同組學(xué)聯(lián)合分析的方法尚未發(fā)現(xiàn)。代謝組學(xué)文獻(xiàn)分享,鑒于此,本文采用一種全新的多元變量統(tǒng)計(jì)模型方法——OnPLS去探索在哮喘病人中不同轉(zhuǎn)錄、代謝、脂肪酸、脂類和臨床數(shù)據(jù)間表達(dá)變化關(guān)系和引發(fā)骨密度下降的機(jī)理研究。
2代謝組學(xué)文獻(xiàn)分享—研究方法
樣本來源:臨床樣本(n=22)包括健康組和哮喘組兩種。
六類分析數(shù)據(jù)模塊詳情見下圖:
數(shù)據(jù)分析:代謝組學(xué)文獻(xiàn)分享,結(jié)合MATLAB 2018a和SciPy工具進(jìn)行OnPLS方法統(tǒng)計(jì)建模,以期發(fā)現(xiàn)這六類數(shù)據(jù)間的含量表達(dá)相關(guān)性,通過篩選出強(qiáng)相關(guān)信息找出哮喘病人口服類固醇治療前后這些數(shù)據(jù)的含量變化規(guī)律,為后續(xù)進(jìn)一步闡明哮喘病人的發(fā)病機(jī)制提供有力理論數(shù)據(jù)支撐。
3代謝組學(xué)文獻(xiàn)分享—分析流程
通過使用OnPLS方法對(duì)上述六類數(shù)據(jù)分析模塊進(jìn)行統(tǒng)計(jì)建模,結(jié)合得分圖發(fā)現(xiàn)樣本組間區(qū)分差異,然后再利用MB-VIOP指標(biāo)對(duì)關(guān)鍵變量進(jìn)行篩選,代謝組學(xué)文獻(xiàn)分享,最后使用可視化和弦圖對(duì)引起疾病變化的不同模塊關(guān)鍵變量進(jìn)行直觀展示和關(guān)聯(lián)分析。
4代謝組學(xué)文獻(xiàn)分享—結(jié)果與討論
OnPLS的數(shù)據(jù)結(jié)構(gòu)
globally joint structures:全局多元數(shù)據(jù)間關(guān)系;
locally joint structures:局部多元數(shù)據(jù)間關(guān)系;
unique structures:?jiǎn)蝹€(gè)多元數(shù)據(jù)內(nèi)在關(guān)系;
residual noise structures:系統(tǒng)噪音誤差。
OnPLS模型運(yùn)算參數(shù)表
表2. 模型共產(chǎn)生7個(gè)成分,2個(gè)globally joint成分,5個(gè)locally joint成分。其中,脂肪酸、氧化脂類和鞘脂類累計(jì)貢獻(xiàn)率均超過70%以上,相反,代謝、轉(zhuǎn)錄和臨床數(shù)據(jù)表達(dá)貢獻(xiàn)水平一般。
OnPLS模型相關(guān)性圖
圖為OnPLS模型七個(gè)成分的得分值與臨床指標(biāo)數(shù)據(jù)的spearman相關(guān)系數(shù)。代謝組學(xué)文獻(xiàn)分享,紅色表示正相關(guān),藍(lán)色表示負(fù)相關(guān),透明度和圈的大小反應(yīng)相關(guān)程度的強(qiáng)弱,其中,黑色方框標(biāo)記的表示p<0.05,顯著相關(guān)。從圖中可以明顯發(fā)現(xiàn),除性別與第一成分得分呈現(xiàn)顯著負(fù)相關(guān)外,其它臨床指標(biāo)均與第一成分得分表現(xiàn)為顯著正相關(guān)關(guān)系。
OnPLS模型得分和載荷圖
圖A. 在H-PCA(hierarchical PCA)模型得分圖第一主成分上,正常組和哮喘病組有明顯區(qū)分,而在第二主成分上,不同性別間則呈現(xiàn)出較明顯區(qū)分,同時(shí)對(duì)應(yīng)第一主成分箱線圖也直接表明不同男性患病情況波動(dòng)較大。
圖B. 與之前模型相關(guān)性圖和得分圖結(jié)果趨勢(shì)一致,載荷圖中第一主成分和第二主成分上的相關(guān)變量對(duì)樣本分組貢獻(xiàn)也比較大,脂類物質(zhì)的影響尤為顯著。
MB-VIOP關(guān)鍵變量篩選
圖A中,使用MB-VIOP>1對(duì)第一主成分上的六類不同數(shù)據(jù)篩選處理得出一些關(guān)鍵的變量,其中除轉(zhuǎn)錄組數(shù)據(jù)外,紅色標(biāo)記的變量表示通過卡值差異篩選,考慮到轉(zhuǎn)錄組數(shù)據(jù)量大的原因,本文將第一主成分的轉(zhuǎn)錄組數(shù)據(jù)差異篩選設(shè)定為2。
圖B中,使用MB-VIOP>1對(duì)第二主成分上的五類不同數(shù)據(jù)篩選處理得出一些關(guān)鍵的變量,其中除轉(zhuǎn)錄組數(shù)據(jù)外,紅色標(biāo)記的變量表示通過卡值篩選,為了進(jìn)一步減少轉(zhuǎn)錄組數(shù)據(jù)受疾病-性別因素的影響,本文將第二主成分的轉(zhuǎn)錄組數(shù)據(jù)差異篩選提高到了2.5。
注:MB-VIOP:Multi-block Variable Influence on Orthogonal Projections。
第一主成分上關(guān)鍵變量篩選
紅色:臨床差異信息,灰色:轉(zhuǎn)錄組學(xué)差異信息,綠色:代謝組學(xué)差異信息,黃色:差異鞘脂類,藍(lán)色:差異脂肪酸,橙色:差異氧化脂類,數(shù)字:連接度,黃色連線:正相關(guān),紫色連線:負(fù)相關(guān),藍(lán)色節(jié)點(diǎn):含量在哮喘病人中上升,紅色節(jié)點(diǎn):含量哮喘病人中下降。
圖A可以發(fā)現(xiàn),在與影響生理調(diào)節(jié)重要轉(zhuǎn)錄因子NPAS2具有顯著相關(guān)的五個(gè)代謝物中,四個(gè)均屬于神經(jīng)酰胺類,值得注意的是,此前未有這方面的報(bào)道。代謝組學(xué)文獻(xiàn)分享,由此推測(cè),神經(jīng)酰胺類的物質(zhì)變化可能會(huì)對(duì)發(fā)病產(chǎn)生一定的影響。
第二主成分上關(guān)鍵變量篩選
紅色:臨床差異信息,灰色:轉(zhuǎn)錄組學(xué)差異信息,綠色:代謝組學(xué)差異信息,黃色:差異鞘脂類,橙色:差異氧化脂類,數(shù)字:連接度,黃色連線:正相關(guān),紫色連線:負(fù)相關(guān),白色節(jié)點(diǎn):含量在女性組中上升,黑色節(jié)點(diǎn):含量男性組中上升。
圖B可以看出,PCDH10和LOC284219與氧化脂類呈現(xiàn)了非常明顯的強(qiáng)相關(guān)性,進(jìn)而推斷這兩個(gè)轉(zhuǎn)錄因子在患病的情況下,對(duì)氧化脂類的代謝具有較大的影響。
5代謝組學(xué)文獻(xiàn)分享—結(jié)論
通過建立OnPLS方法可以有效將多個(gè)不同組學(xué)的聯(lián)合起來進(jìn)行分析。
代謝組學(xué)文獻(xiàn)分享,結(jié)合可視化分析圖表和MB-VIOP指標(biāo)可以實(shí)現(xiàn)幫助找到與疾病發(fā)生密切相關(guān)的一些關(guān)鍵基因,如ATP6,V1G1等,為進(jìn)一步闡明哮喘病人骨密度下降發(fā)病機(jī)理提供強(qiáng)有力的理論支持。
6個(gè)人觀點(diǎn)
本文針對(duì)多個(gè)不同組學(xué)數(shù)據(jù)聯(lián)合分析,提供了比較完整的數(shù)據(jù)分析過程和清晰的關(guān)鍵變量篩選標(biāo)準(zhǔn)。
為了更深入的研究哮喘發(fā)病相關(guān)機(jī)制,文章可考慮從代謝通路,網(wǎng)絡(luò)互作,分子實(shí)驗(yàn)等方法進(jìn)行后續(xù)分析驗(yàn)證。