从cellranger处理后的结果文件matrix.mtx.gz,features.tsv.gz,barcodes.tsv.gz读取成矩阵的形式:
library(Seurat)
GCMat <- Read10X("/xxx/Melanoma/GSE139829/P1")
1. 将矩阵转成稀疏矩阵
GCMat <- as(b1,"dgCMatrix")
2. 基因有重复值的处理
基因名字有重复的话,就不能对行进行命名了。有重复基因的原因是有些基因有可变剪切的形式。
duplicated()函数可以查看哪些是有可变剪切的
3. 将字符型矩阵转换成稀疏矩阵
我们从下载的文本文件读取的基因表达数据GCMat,很可能是字符型的,要转换成稀疏矩阵。
GCMat2 <- apply(GCMat,2,as.numeric)
rownames(GCMat2) <- rownames(GCMat)
GCMat2 <- as(GCMat2,"dgCMatrix")
探序基因,生物信息解决方案
网友评论