将测序基因组对比到参考基因组:
RPKM>1:表达基因
WGCNA:基因聚类后与目的基因做相关性分析 ,找到核心基因。
qPCR实验验证:表达验证差异存在。
功能验证:敲掉基因,进行探寻
分子机制研究:寻找甲基化差异 :甲基化水平高抑制基因表达
转录组分析:
准备数据:测序数据 .fq/参考基因组/数据信息表
conda install sra-tools#下载
prefetch 序列号#下载文件
awk '{print "prefetch "$1"" } >run.prefetch.sh#在序列号前加入prefetch
cat run.prefrtch.sh#串行下载
awk '{print "prefetch "$1" &" } >run.prefetch.sh#转为并行下载"&"加载之后台
#下载文件是.sra文件
转换文件格式:
fastq-dump --split-3 序列名#转为fq文件
#数据信息表
.gff文件转换:gffread -T -o gene.gtf A.gene.gff
mapping:测序数据的比对:
软件:hiseq
1、构建参考基因组
hisat2-build ../ref/genome.fasta ../ref/genome 1>hisat2-build.log 2>&1
2、比对:
hisat2 --new-summary -p 10 -x ../ref/genome -1 wenjian -2 wenjian -S shuchuwenjianlujing.sam --rna-strandness R >BLO_S1_L01.log 2>&1
#双末端测序 单末端测序-RF
3、压缩和排序
samtools sort -o 文件.bam A.sam
4、bam index :
bam index .bam
网友评论