定量与标准化

定量与标准化

作者: 嗒嘀嗒嗒嘀嗒嘀嘀 | 来源:发表于2020-07-15 09:16 被阅读0次

基因课FTP地址：ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

需要的R软件包

Rsubread
limma
edgeR

featureCounts

featureCounts只能算出counts, FPKM值或TPM值需要自己根据公式标准化算

张老师的R定量package

run-featurecounts.R

run-featurecounts.R
R脚本解释器(第一行)最好写 #!/usr/bin/env Rscript —— 功能，自动识别环境中的解释器
argparser软件包实现对代码的封装，自动解析要输入的参数及参数传递，并生成-help 界面(python中也有)
运行命令
Rscript script/run-featurecounts.R -b xxx.bam -g xxx.gtf -o xxx # 给个名字就好，不需要后缀，会自己加后缀；
输出一个.count文件和一个.log文件

合并表达量矩阵

新建文件夹，名为3.merge_result, 内含合并脚本
合并readsCount矩阵
输出gene.counts.matrix
要用于差异分析(一般差异分析软件内部会进行标准化过程)
可能有小数
合并标准化后的矩阵
输出genes.TPM.matrix
TPM+TMM标准化矩阵
输出genes.TMM.EXPR.matrix文件
TPM为样本内标准化
TMM为样本间标准化
所以标准化流程为 readsCount → TPM标准化 → TPM+TMM标准化
用于差异分析外的分析：共表达分析、PCA分析、画Heatmap
用小程序搞定
- perl脚本 abundance_estimates_to_matrix.pl
- 用法：
  perl abundance_estimates_to_matrix.pl --est_method featureCounts xxx1.count xxx2.count ...... xxxn,count
  或 perl abundance_estimates_to_matrix.pl --est_method featureCounts *.count
  或将要读取的文件路径放在同一文件genes.quant_files.txt文件下，perl abundance_estimates_to_matrix.pl --est_method featureCounts --quant_files genes.quant_files.txt --out_prefix genes

run_TMM_scale_matrix.pl

接下来

达到表达矩阵之后首先做的不是差异分析，应该先做样本关系分析，如样本聚类分析、样本相关性分析、PCA分析

题外话

基因组与比较基因组注释
Braker
Maker
PASA
bash 换行 “\”后面不能有空格
RSEM软件功能类似于featureCounts，有参无参都能用，通常用在无参转录组

相关文章

网友评论

本文标题：定量与标准化

本文链接：https://www.haomeiwen.com/subject/bvzthktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|定量与标准化|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！