美文网首页linux收入即学习
ChipSeq 与 RNASeq 基因分组分析

ChipSeq 与 RNASeq 基因分组分析

作者: Htt_1996 | 来源:发表于2020-06-01 22:17 被阅读0次

一、如何在NCBI下载SRA文件? - 简书 https://www.jianshu.com/p/15c39eb1c771

二、Chip-Seq 分析过程二 - 简书 https://www.jianshu.com/p/66a6eabd2519

三、RNASeq分析

image.png
  • RNASeq1:对得到的count进行差异基因分析
  • RNASeq2:对得到的count进行fpkm值计算

四、Python- pandas 和 numpy 的下载与安装 - 简书 https://www.jianshu.com/p/8de14da3f7f4

五、Python对按fpkm分组后的基因bed文件匹配

import pandas as pd

#小文件 encoding="gbk" 保证含有中文字符时不乱码
high = pd.read_csv("high.txt",encoding="gbk")
low = pd.read_csv("low.txt",encoding="gbk")
middle = pd.read_csv("middle.txt",encoding="gbk")
unexpressed = pd.read_csv("unexpressed.txt",encoding="gbk")

#大文件
rice = pd.read_csv("rice.bed.csv",encoding="gbk")

#索引
index1 = rice[u'locus'].isin(high[u'locus'])
index2 = rice[u'locus'].isin(low[u'locus'])
index3 = rice[u'locus'].isin(middle[u'locus'])
index4 = rice[u'locus'].isin(unexpressed[u'locus'])

hb = rice[index1]
lb = rice[index2]
mb = rice[index3]
ub = rice[index4]

hb.to_csv('hb.csv', index=False, encoding='gbk')
lb.to_csv('lb.csv', index=False, encoding='gbk')
mb.to_csv('mb.csv', index=False, encoding='gbk')
ub.to_csv('ub.csv', index=False, encoding='gbk') 

六、Shell对分组对不同表达量的多个bed,用Deeptools画对应的peak分布。

awk -F " " '{print$1"\t"$2"\t"$3"\t"$4"\t"}' ub.bed > unexpressed.bed # 注意:bed文件分隔符为Tab (\t)
sed -i "1d" unexpressed.bed

相关文章

网友评论

    本文标题:ChipSeq 与 RNASeq 基因分组分析

    本文链接:https://www.haomeiwen.com/subject/greezhtx.html