问题
最近在做单细胞转录组亚群细分的时候,遇到了一个很意外的问题,那就是我之前做的结果,没有保存RDS文件,之前是分的6个亚群,结果现在发现有7个亚群,这下完全懵逼了,怎么能这样,如果结果不能重复,那如何跟客户交代?
第一次亚群细分的结果
关键是用的同一个数据(从上图可以看出输入的数据都8400个细胞),同一个R,同样参数,所有的脚本都一样,这怎么可能不一样?
···
rds为seurat的对象,下面是输入的亚群,
subset(subset(rds,idents=c(1,2,3,4,5), subset = percent.mt < 10))
···
发现问题
介于平时做单细胞分析比较多,如果出现这样的情况不弄清楚,这样的话就很麻烦,因此我查找二者分析过程中究竟有哪些不同,结果发现在下面的不同:
第一次找anchors结果
从上那图结果可以发现,两次分析找到的anchors数目不一样,这个可能是造成后面分群结果不一样的关键因素,不过有意思的是,如果使用同一计算节点的话,每次跑出来的结果是完全一样,因此为了保证结果完全的一致,最好是保存rds文件,或者尽量使用同一计算节点来进行分析。
后记
虽然发现了问题,但对算法了解不够深,没有找到解决问题的办法,因此后面有时间了在仔细看看算法,是否有不同计算节点的硬件问题造成的,这里就是记录一下这个问题,以后再去找问题。
2020年10月23日
网友评论