快速學(xué)習(xí)如何確定差異分析閾值來篩選差異基因
爾云間? 一個(gè)專門做科研的團(tuán)隊(duì)
各位小伙伴,小果和大家又不期而遇了,最近小果在做差異基因篩選時(shí)就很迷惑,不知道知道差異分析需要用到哪些參數(shù)以及具體的這些參數(shù)的含義是什么?知道了具體參數(shù)的的含義卻又不知道如何篩選?為此小果特地去查詢學(xué)習(xí)了相關(guān)文獻(xiàn),今天呢小果為大家解答下這些問題。

首先小果和大家一起來了解下在進(jìn)行差異基因篩選時(shí)常用的指標(biāo)以及它的含義:
01?差異倍數(shù)(Fold?change),是同一個(gè)基因在兩個(gè)樣品中表達(dá)量的變化,即為倍數(shù)變化,同時(shí)也可以反應(yīng)出差異情況如何,是上調(diào)還是下調(diào)等情況如果我們把樣本分為了對(duì)照組和實(shí)驗(yàn)組,想要判斷這兩組數(shù)據(jù)中基因表達(dá)情況是否顯著,可以通過計(jì)算兩個(gè)分組中表達(dá)值的差異倍數(shù)來判斷??梢酝ㄟ^一個(gè)簡單的例子來說明,假設(shè)對(duì)照組A和對(duì)照組B中均存在基因C,基因C在對(duì)照組A中的表達(dá)值為1,在實(shí)驗(yàn)組B中的表達(dá)值為2,此時(shí)我們就可以說基因C在實(shí)驗(yàn)組B的表達(dá)是對(duì)照組A中的2倍。
02??P值(P-value),它是通過統(tǒng)計(jì)學(xué)的一些檢驗(yàn)方法計(jì)算出來的值,反應(yīng)的是數(shù)據(jù)之間的統(tǒng)計(jì)學(xué)上的顯著性。
03?FDR(False Discovery Rate),錯(cuò)誤發(fā)現(xiàn)率,也稱為Q-value,簡單來說FDR時(shí)矯正后的P值,它是通過錯(cuò)誤控制法對(duì)P值進(jìn)行檢驗(yàn)校正假陽性率。使用FDR的目的是為控制差異分析結(jié)果中假陽性的比例。尤其是在做轉(zhuǎn)錄組分析時(shí),因?yàn)檗D(zhuǎn)錄組分析時(shí)會(huì)遇到一個(gè)樣本中有多個(gè)轉(zhuǎn)錄本的情況,在對(duì)每個(gè)轉(zhuǎn)錄本進(jìn)行檢驗(yàn)時(shí)容易增加假陽性比率。

一般的原則是使用差異倍數(shù)|Fold Change|≥2即|log2FC|>1且FDR<0.05或P<0.05這兩個(gè)指標(biāo)進(jìn)行篩選,其中需要說明的是,F(xiàn)old Change的絕對(duì)值越大,與此同時(shí)差異倍數(shù)也就越大,F(xiàn)DR值或P<0.05越小差異越顯著,這個(gè)篩選標(biāo)準(zhǔn)文章也是比較認(rèn)可的。這里提供一篇文章[1]做參考,鏈接為:
https://doi.org/10.1016/j.psj.2021.101496。當(dāng)然小伙伴們也可以自己去查詢IF高的英文文章。
對(duì)于轉(zhuǎn)錄組差異分析來說,篩選時(shí)的差異倍數(shù)一般要大于等于2,F(xiàn)DR<0.05或P<0.05,兩個(gè)指標(biāo)要同時(shí)滿足??蓞⒖嘉恼耓2]鏈接:
https://doi.org/10.1016/j.gene.2016.07.052。
對(duì)于篩選得到的差異基因較少的情況下,F(xiàn)DR<0.05條件不變,差異倍數(shù)可以在1.2到2倍間適當(dāng)浮動(dòng)調(diào)整,通俗一點(diǎn)來說就是|log2FC|的值可以在0.232到1之間。根據(jù)經(jīng)驗(yàn)來說,建議差異倍數(shù)選擇的優(yōu)先級(jí)為2>1.5>1.2;差異倍數(shù)1.5時(shí),可參考文章[3]鏈接:
https://doi.org/10.1007/s12032-020-01370-0;
差異倍數(shù)1.2時(shí),可參考文章[4]鏈接:
https://doi.org/10.1186/s12967-019-1981-5。
若以上的閾值條件均未篩選出差異基因,可用FDR<0.05或P<0.05來篩選,這里可參考另一篇文章[5]鏈接:
https://doi.org/10.1080/07435800.2019.1674868,如果通過以上說閾值還是未篩選到差異基因,需要去考慮下數(shù)據(jù)本身是否存在問題,或者說去更換數(shù)據(jù)集。

到這里呢,小果今天的分享就結(jié)束了,希望各位小伙伴通過今天的分享都有所收獲。
參考文獻(xiàn):
[1]?Shu J, Liu Y, Shan Y, Ji G, Ju X, Tu Y, Shi S, Sheng Z, Zhang M, Zou J. Deep sequencing microRNA profiles associated with wooden breast in commercial broilers. Poult Sci. 2021 Dec;100(12):101496. doi: 10.1016/j.psj.2021.101496. Epub 2021 Sep 21. PMID: 34695627; PMCID: PMC8555438.
[2]?Chen X, Yang M, Hao W, Han J, Ma J, Wang C, Sun S, Zheng Q. Differentiation-inducing and anti-proliferative activities of isoliquiritigenin and all-trans-retinoic acid on B16F0 melanoma cells: Mechanisms profiling by RNA-seq. Gene. 2016 Oct 30;592(1):86-98. doi: 10.1016/j.gene.2016.07.052. Epub 2016 Jul 25. PMID: 27461947.
[3]?Yin L, Xiao L, Gao Y, Wang G, Gao H, Peng Y, Zhu X, Wei J, Miao Y, Jiang K, Lu Z. Comparative bioinformatical analysis of pancreatic head cancer and pancreatic body/tail cancer. Med Oncol. 2020 Apr 10;37(5):46. doi: 10.1007/s12032-020-01370-0. PMID: 32277286.
[4]?Zhang L, Chen S, Zeng X, Lin D, Li Y, Gui L, Lin MJ. Revealing the pathogenic changes of PAH based on multiomics characteristics. J Transl Med. 2019 Jul 22;17(1):231. doi: 10.1186/s12967-019-1981-5. PMID: 31331330; PMCID: PMC6647123.
[5]?Iqbal J, Tan ZN, Li MX, Chen HB, Ma B, Zhou X, Ma XM. Estradiol Alters Hippocampal Gene Expression during the Estrous Cycle. Endocr Res. 2020 Feb-May;45(2):84-101. doi: 10.1080/07435800.2019.1674868. Epub 2019 Oct 12. PMID:31608702.
shengxinguoer
生信果
生信硬核知識(shí)解答
和小果一起學(xué)生信