手机版
网站地图
美文美图
最新动态
你好,欢迎访问
好美文阅读网
个性皮肤
搜索
网站首页
美文
文章
散文
日记
诗歌
小说
故事
句子
作文
签名
祝福语
情书
范文
读后感
文学百科
美文摘抄
节日文章
名家散文
网名大全
座右铭
口号大全
面试技巧
说说大全
阅读答案
诗词默写
流言蜚语
节日祝福
好句子
经典台词
谚语大全
亲情故事
友情故事
表白情书
工作报告
活动总结
心得体会
专题汇总
美文网首页
chip-seq
让我看看谁还不会用deeptools可视化(bcpp)
让我看看谁还不会用deeptools可视化(bcpp)
作者:
想要学好生信的小白
| 来源:发表于
2021-03-25 15:40 被阅读0次
一、deeptools安装
见我写的第一篇文章《Conda 安装软件万能链接》:
Conda安装软件万能链接
二、deeptools可视化要用到4个小命令——bamCoverage、computeMatrix、plotProfile 、plotHeatmap,我简称bcpp一整套(方便记忆,哈哈哈,为啥叫一整套就说明了这4个小命令是可以连着用的,紧密性很强。)
deeptools官网:
deeptools官网
bamCoverage官网说明书:
bamCoverage官网说明书
或者直接在节点上直接输:deeptools bamCoverage --help 查看参数和用法,但是官网说明书还有原理更方便理解。
computeMatrix官网说明书:
computeMatrix官网说明书
或者直接在节点上直接输:deeptools computeMatrix --help 查看参数和用法,但是官网说明书还有原理更方便理解。
plotProfile 官网说明书:
plotProfile官网说明书
或者直接在节点上直接输:deeptools plotProfile --help 查看参数和用法,但是官网说明书还有原理更方便理解。
plotHeatmap 官网说明书:
plotHeatmap官网使用说明书
或者直接在节点上直接输:deeptools plotheatmap --help 查看参数和用法,但是官网说明书还有原理更方便理解。
(后面会更新每一个小命令的具体原理和参数说明)
三、实际操作(参数可以根据自己的数据进行调整探索!世界上没有两片完全相同的叶子!!!)
1、bamCoverage:将bam文件转化为bigwig文件,bw文件可以直接导入IGV进行可视化。
bamCoverage -b x.bam -of bigwig -o x.bw -p 20 --ignoreDuplicates --binSize 10 --normalizeUsing RPKM
注:
-b:输入的bam文件 。
-o:输出的文件 。
--ignoreDuplicates:忽略重复,也就是说具有相同方向和起始点的reads只会识别一次不会重复识别。
--binSize(-bs):设置输出的文件的bins大小,默认值是50。
--normalizeUsing :可选值有RPKM、CPM、BPM、RPGC、None。默认值是None。
2、computeMatrix:生成矩阵,有两种方式:一种是scale-regions , 另外一种是reference-point ,具体见官网说明书。
① scale-regions mode:
computeMatrix scale-regions -R X.gene.bed -S x.bw --smartLabels -p 20 --binSize 10 -b 3000 -a 3000 --regionBodyLength 5000 --sortRegions keep -o x.gz --outFileSortedRegions computeMatrix_x.bed --outFileNameMatrix matrix_x.tab
注:
-R:后面跟gene.bed文件,该文件可以从基因注释文件(gff3格式)转化而来。
-S:后面跟上一步产生的bw文件。
-p: 要使用的处理器数量。默认值是1。
--binSize: bin大小。默认值是10。
-b: 所选参考点的上游距离。默认值是500。
-a: 所选参考点的下游距离。默认值是1500。
--regionBodyLength:默认值是5000。
--sortRegions:输出文件是否应该显示排序的区域。默认情况下不对区域进行排序。如果需要输出顺序与输入区域匹配,则指定“keep”。默认值是keep。
-o: 输出文件。
--outFileSortedRegions:跳过0或最小/最大阈值后保存区域的文件名。文件中区域的顺序与所选的排序顺序一致。
--outFileNameMatrix: 如果选择这个选项,则热图的基础值矩阵将使用指定的名称保存。这个矩阵可以很容易地加载到R或其他程序中。
② reference-point mode:
computeMatrix reference-point --referencePoint TSS -b 3000 -a 3000 -R X.gene.bed -S x.bw --skipZeros -o matrix_x_TSS.gz --outFileSortedRegions computeMatrix_x_TSS.bed
注:
-R: 后面跟gene.bed文件,该文件可以从基因注释文件(gff3格式)转化而来。
-S: 后面跟上一步产生的bw文件。
-b: 所选参考点的上游距离。默认值是500。
-a: 所选参考点的下游距离。默认值是1500。
--skipZeros:分数为零的区域是否应该被包括在内。默认是包括它们。
-o: 输出文件。
--outFileSortedRegions: 跳过0或最小/最大阈值后保存区域的文件名。文件中区域的顺序与所选的排序顺序一致。
--outFileNameMatrix: 如果选择这个选项,则热图的基础值矩阵将使用指定的名称保存。这个矩阵可以很容易地加载到R或其他程序中。
如果以转录终止位点为参考位点的话就将TSS换成TES。
3、plotProfile:矩阵文件可视化。
plotProfile -m matrix_x.gz -out Profile_x.pdf --outFileNameData plotProfile_x.tab
注:
-m: 矩阵文件。
-out:保存的文件名。文件的结尾即图像的格式。可用的选项有:" png ", " eps ", " pdf "和" svg "。
--outFileNameData:保存平均配置文件的基础数据。
4、plotHeatmap:创建基因组区域相关的得分热图。
plotHeatmap -m matrix_x.gz -out x_Heatmap.png
注:
-m: 矩阵文件。
-out: 保存的文件名。文件的结尾即图像的格式。可用的选项有:" png ", " eps ", " pdf "和" svg "。
四、结果
1、bamCoverage结果是生成一个bw文件,然后我导入IGV查看结果如下:
还可以将peak.bedgraph和基因注释文件gff3文件一起导入IGV进行查看
2、plotProfile结果:
scale-regions mode
reference-point mode
reference-point mode
3、plotHeatmap结果:
相关文章
网友评论
chip-seq
本文标题:
让我看看谁还不会用deeptools可视化(bcpp)
本文链接:
https://www.haomeiwen.com/subject/twlthltx.html
延伸阅读
那年盛夏诗歌
环境监察队工作总结范文
优秀教师学习心得范文
华胥引的读后感300字
《Its red》教学反思范文
农资购销的合同范本
竞选中队委优秀演讲稿
辞金蹈海的成语解释
《世纪宝鼎》公开课教案设计
因为爱你,所以牵挂
今生今世红尘醉——美到
一个90后的内心独白
致已逝去的高中年华
深度阅读
您也可以注册成为美文阅读网的作者,发表您的原创作品、分享您的心情!
情人节
母亲节
重阳节
清明节
端午节
植树节
元宵节
妇女节
愚人节
圣诞节
父亲节
教师节
儿童节
劳动节
青年节
建军节
万圣节
平安夜
光棍节
中秋节
国庆节
感恩节
腊八节
更多话题
栏目导航
chip-seq
摄影
故事
互联网
读书
旅行
热点阅读
小学五年半,印象深刻的只有劳动课
盈亏同源--不惧过山车
陈学姐,我会以你为戒,告诫自己永远不要有这么狼狈的时候
【18】只出现一次的数字
Go Sort
如何快速画出香蕉?绘画教程,简单易懂
坚持星球—杭州演说生产力课程助教复盘
CocosCreator-碰撞检测系统的常用接口
20210322-Redmine升级至v4.1.1
2021-03-22
chip-seq
主成分分析(PCA)基本原理及分析实例
ChIP-seq基础入门
如何使用deeptools处理BAM数据
第1篇:ATAC-seq的背景介绍以及与ChIP-Seq的异同
第8篇:用网页版工具做功能分析和motif分析
【NGS原理图大全】-DNA-RNA-RNC-tRNA-smRN
一文学会批量下载SRA数据
DNA甲基化分析----------甲基化比对软件专题(Bism
DNA甲基化分析----------甲基化比对软件专题(BSMA
BBQ(生物信息基础问题23): 转录组VS基因组比对
网友评论