1. 生物信息学入门
高通量测序技术类型与数据分析• 生物背景: 细胞生物学,分子生物学,生物信息学等
• 编程技巧: Linux, Python, R
• 测序知识:从一代到三代的测序技术原理;Illumina测序技术细节
▷ 高通量测序技术入门的3项基本技能:
① RNA-Seq的分析流程
② ChIP-Seq的分析流程
③ Call SNP的分析流程
2. 癌症相关生物学背景
本次操作实战选用的是Nature Letter文章,标题为:Reconstructing lineage hierarchies of the distal lung epithelum using single-cell RNA-seq, doi:10.1038/nature13178
本篇文章先对肺部发育过程中涉及的几类细胞(Clara, Bronchiolar, AT1, Alveolar, BP, AT2, Ciliated)进行了一个单细胞RNA-seq,对测序结果进行PCA分析,发现来自不同种类细胞的转录本确实存在差异;接下来他们再进行了一个heatmap绘制,尝试鉴定出不同细胞的基因Marker;
Heatmap绘制展示举例PS:FPKM,可以简单等同于基因表达量,数值越高表示基因表达量越高。
3. 传统的RNA-Seq建库方法
• PolyA positive:
▷成熟的mRNA含有polyA尾巴;
▷对polyA进行富集
polyA positive建库流程• rRNA minus:
▷去除建库中最大的干扰因素rRNA
rRNA minus建库流程1)RNA质量评估
① 毛细管电泳/Bioanalyser Agilent 2100
琼脂糖凝胶电泳检测RNA完整性②RIN (RNA Integrity Number):非常好的的RNA具有一个5s, 18s, 28s以及一个5.8s的4个峰值,要求RIN至少8以上的RNA样本才可以进行后续RNA-Seq的建库。
RIN法进行RNA完整性质控 1 RIN法进行RNA完整性质控 24. 单细胞测序技术简介
5. 几种主要的单细胞RNA-Seq建库方法
6. 单细胞RNA-Seq的分析流程
7. 如何下载文章的原始数据
8. SRA格式文件的解压缩与简单处理
SRA格式文件的解压缩与简单处理 ——数据的fastq格式展示 SRA格式文件的解压缩与简单处理 ——fastqc进行数据质控 SRA格式文件的解压缩与简单处理命令解析:mkdir: 创建一个文件夹; -p : 如果这个文件夹存在的话忽略此命令,如果这个文件夹不存在即创建;fastqc -t :调用两个核; -o : 输出文件; -q: 沉默模式,使命令在后台运行; ./raw.fastq/*.gz 指的是把这个文件夹里的文件解压缩出来然后进行前面fastqc这个命令进行质控
SRA格式文件的解压缩与简单处理 ——循环去接头shell脚本命令解析: "for case_name in SRRxxxxxx": case_name进行循环; "do"为循环结构,结合最后的"done';
"nohup cutadapt --times 1 -e 0.1 -0 3 --quality-cutoff 6 -m 75 -a AGATCGGAAGAGC -A AGATCGGAAGAGC -o $out_fastq_1 -p $out_fastq_2 $fastq_1 $fastq_2 ﹥ $log_file 2﹥&1 &":
nohup cutadapt: 该行命令遇到程序有问题的时候不会被中断,有点类似于把任务放到后台执行。
--times:trim的一个基本参数
-m 75: 当序列中有一条低于75时,这一对reads都去除
9. 主成分分析(PCA)的原理
10. 其他常用的聚类方法
11. boxplot与violin plot
12. heatmap及其绘制细节
网友评论