时间线目录
视频一:讲解
0:00|开场白,打算讲啥?
-
在跑代码的过程中讲代码的细节是干什么的
-
跑自己的数据需要准备什么文件
3. 怎么解读SCENIC的output结果
-
SCENIC算法
-
SEEK的用途
-
SCENIC的局限性
SCENIC是做什么的
1:45|SCENIC的算法
环境配置
9:30|建议把重要的常用pipeline分开安装到不同的虚拟环境
代码讲解、结果解读及扩展思路
14:05|对原文做pooling的看法
1. 逼不得已。当时用R版本的SCENIC,太慢;
2. 优点:可以尽量降低dropout的问题;
3. 前提:做pooling对结果的稳定性没有影响。
19:00|从读入输入文件开始讲解代码做了啥,为什么这样做。
44:30|获得gmt文件,无缝对接富集分析,挖掘公共数据
【扩展思路】把前面获得的regulon变成gmt文件,接下来就可以结合TCGA等公共数据,用regulon的high/low给样本分组,作为诊断指标,在更大的队列里验证单细胞的发现。
另外,我们展示富集分析结果的那些酷炫的FigureYa就可以用来展示单细胞regulon结果了。
47:40|把regulon activity score连续值变为binary matrix
49:30|降维
52:10|Figure 1,秀数据
【扩展思路】哪些细胞更容易受微环境的影响
58:52|Figure 2,代码讲解
计算cell type specific regulon
1:04:00|Figure 2,结果解读
cutoff怎么选,选择的前提
1:06:40|regulon的验证
1. 实验验证。
2. SEEK,怎样用这个网页工具看regulon结果是否靠谱。
【扩展思路】WGCNA找到的module,也可以用SEEK来验证。
1:27:15|Figure 3,锦上添花
聚类,cell type correlation,regulon correlation
1:31:00|热图中的层次聚类及其与module的对应关系
怎样选cutoff,怎样决定聚几类
1:39:15|high correlated regulon是不是跟某些细胞相关
regulon对应的motif
评价
1:46:30|SCENIC算法本身的局限性
1:52:15|评价作者证明结论的策略
视频二:讨论
下面是小伙伴提问,Jarning分享自己的看法。
这里只列问题,先自己独立思考一下,再听视频找答案,效果更佳。
0:00|怎样挑选有代表性的转录因子来展示?
1:30|control和treat两组单细胞数据,可以利用每群细胞的差异基因的UMI作为输入,计算每群细胞差异基因的TF吗?
3:50|seurat integration的多样本数据,建议用原始的counts还是整合后的数据呢?
5:00|TFs、feather、tbl文件是固定的吗?在运行cellranger的时候使用hg19、GRCH38是否有不同的对应版本?另外feather好像有很多个,要怎么选呢?
8:05|能不能顺便简单介绍一下cisTarget数据库里feather文件的内容?
8:16|如果已经有差异基因了,有工具可以直接富集转录因子吗?
8:30|本次的结果,跟scATACseq的整合,有什么建议么?
9:05|pySCENIC前两步用raw count,最后一步算RAS的时候是不是用整合后的更好?
11:15|数据整合的时候有时候需要去batch,老师刚才说用raw count的话,这里不知道batch怎么考虑?
12:15|如果ATAC-seq + motif可以用ChIP-seq或ChIP-qPCR验证。那么单细胞转录组SCENIC怎样验证呢?
15:50|如果只是看单细胞的不同分组间的特异的TF,是不是SCENIC官方给的教程就可以?
17:00|怎么比较同一亚群细胞不同来源(control和treat)TF的差异?
21:20|怎样在AUC计算时加入control和treat信息?
23:30|后面差异的处理步骤,能否再加一个脚本教程?
【扩展思路】
24:25|我对SCENIC的理解就是定义gene set,这个gene set有调控关系,无缝嫁接到GSVA分析。
28:40|例文中的tSNE的图完全可以像免疫浸润那样,用box plot来展示,更重要的是你想要show什么样的信息,来选择合适的展示方式。
30:40|感觉是做单细胞的共表达?
共表达只是相关性,step 1就解决了。
SCENIC的价值在于找到调控关系,有调控就有机制。
【扩展思路】可以看regulon在物种间的保守程度、比较disease在mouse model跟disease的相似性。
33:55|我尝试过用SCENIC的结果和原始表达矩阵分别做聚类,得到的分群很相似的
34:25|这么多代码从头复现,怎么做到的啊哈哈,可以分享下经验吗?
37:30|分享一个我特别喜欢的算法cNMF
处理单细胞数据时给你很多意想不到的结果,寻找基因表达网络signature,有非常好的效果。
不依赖聚类结果,去除batch effect。
网友评论