五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

小果帶你用homer進行motif富集分析

2023-05-26 09:21 作者:小云愛生信  | 我要投稿

爾云間? 一個專門做科研的團隊
小果? 生信果?

原創(chuàng)不易? 歡迎點贊+轉(zhuǎn)發(fā)+關(guān)注



Homer是干嘛的?


HOMER是一套基于 C++ 和 Perl 語言的用于 motif 查找和二代數(shù)據(jù)分析的工具,一般需要兩個序列作為參數(shù):

● 參考序列:hg19、mm10 等基因組序列、promoter 序列、自定義的 FASTA 序列

● 所要分析的序列:DNA 或 RNA 序列

HOMER 適用于在大規(guī)模數(shù)據(jù)中尋找 DNA 或 RNA 序列的 motif。


?那什么是 motif 呢?

motif:反復(fù)出現(xiàn)的模式,即一種特征序列,比如 sequence motif, structure motif, network motif。它有或者可能有一定的生物學(xué)功能。


具體分析步驟

3.1 linux配置新環(huán)境

conda create -n work puthon=3.8

conda activate work

3.2 homer安裝

conda install -c bioconda homer

##下載configureHomer.pl

wget http://homer.ucsd.edu/homer/configureHomer.pl

##使用configureHomer.pl配置Homer

perl configureHomer.pl -install ?

perl configureHomer.pl -install mm10

3.3 homer分析

3.3.1 Analyzing lists of genes with promoter motif analysis (findMotifs.pl)

############尋找基因列表啟動子上的motif富集

findMotifs.pl 3v3135F15Q001gene.txt mouse /public/home/wjiang/zhan/work/homer/testdata -len 10

3.3.2 Analyzing genomic positions(findMotifsGenome.pl)

####輸入為bed文件,主要是chip-seq數(shù)據(jù)通過macs2 callpeak產(chǎn)生narrowPeak文件,需要首先處理一下。

awk '{print $4"\t"$1"\t"$2"\t"$3"\t+"}' chirp_06ab_peaks.narrowPeak > chirp_06ab_homer.bed

for i in *_homer.bed;do j=${i%_homer.bed}; bsub -J macs2p -e %J.err -o %J.out -R span[hosts=1] -n 1 "findMotifsGenome.pl $i mm10 $j -len 8,10,12";done

3.3.3 Analyzing custom FASTA files (findMotifs.pl, homer2)

homers的說明文檔:recommended that you have both target and background sequences, and in each case you should have several (preferably thousands) of sequences in each set that are roughly the same length。

需要目的和背景基因的序列,所以這個一般用的比較少一些。

3.3.4 Analyzing data for RNA motifs (findMotifs.pl/findMotifsGenome.pl)

####和尋找DNA序列的motif區(qū)別在于:使用 findMotifs.pl和 findMotifsGenome.pl時,要加上 “-rna”參數(shù),從而只尋找RNA+鏈的motif,并且匹配/顯示U而不是T。

#######注意!HOMER尚未包含“RNA motif”列表,所以不支持“已知motif”的分析。如果使用FASTA文件格式,請在輸入文件中使用T(DNA編碼)。

# 獲取目標序列在人類mRNA上聚集的motif

findMotifs.pl genes.txt mouse MotifOutput/ -rna -len 8

# 分析CLIP-Seq for RNA motifs

findMotifsGenome.pl fox2.clip.bed hg17 MotifOutput -rna

3.3.5 Scanning for motif across the entire genome (scanMotifGenomeWide.pl)

scanMotifGenomeWide.pl pu1.motif mm9 -bed > pu1.sites.mm9.bed

########這個的話,其實用MEME數(shù)據(jù)庫中的FIMO效果更好一些

今天的分享就到這里了,如果您對生信有任何問題都可以私信小果哦!



生信人R語言學(xué)習(xí)必備

立刻擁有一個Rstudio賬號

開啟升級模式吧

(56線程,256G內(nèi)存,個人存儲1T)


生信果”,生信入門、R語言、生信圖解讀與繪制、軟件操作、代碼復(fù)現(xiàn)、生信硬核知識技能、服務(wù)器、生物信息學(xué)的教程,以及基于R的分析和可視化等原創(chuàng)內(nèi)容,一起見證小白和大佬的成長。


小果帶你用homer進行motif富集分析的評論 (共 條)

分享到微博請遵守國家法律
开江县| 吉安县| 徐汇区| 武威市| 宕昌县| 兴海县| 洪雅县| 莱西市| 黔江区| 繁昌县| 建阳市| 长乐市| 河南省| 筠连县| 平山县| 扎兰屯市| 八宿县| 内黄县| 建宁县| 盐亭县| 昆山市| 旌德县| 平乐县| 辽阳县| 丰原市| 横峰县| 双辽市| 镇坪县| 德清县| 安泽县| 夏邑县| 新晃| 宿州市| 和平区| 英山县| 游戏| 金乡县| 依安县| 江城| 龙江县| 深州市|