美文网首页单细胞测序
单细胞基础知识补充3-fread() 函数快速读取大表格以及取子

单细胞基础知识补充3-fread() 函数快速读取大表格以及取子

作者: oceanandshore | 来源:发表于2022-08-03 11:01 被阅读0次

平时读取一个表格文件通常使用read.table函数,但当遇到上百M或上G的文件时,就读的非常慢了。
有个函数fread(),来自data.table包,可以更快地读取表格文件,速度可以快近十倍。而且对于很大的表格,fread()还会提供读取进度条,非常滴友好~

先说明一下TOP菌代码的意思,然后再扩展说明下取子集

mat=fread("GSE144735_processed_KUL3_CRC_10X_raw_UMI_count_matrix.txt")
mat=as.data.frame(mat)
rownames(mat)=mat$Index
mat$Index=NULL

其中 as.data.frame(mat) 这一步是把 要用的数据格式 转换为 数据框 格式,转换成数据框格式这样方便进行操作?

colnames()和rownames() 用来修改矩阵的变量名(行名和列名),也能修改数据框的行名和列名。

取子集

R语言基础之第二部分 操纵数据/取子集
哈佛R语言课程--5.数据框、矩阵、列表取子集
【R语言】从不同数据结构中取子集(一)


这里涉及到的取子集不是针对单细胞的,就是简单的R操作基础
构建子集
[ ]:提取一个or多个类型相同的元素
[[ ]]:从列表或数据框中提取元素
$ :按名字从列表or数据框中提取元素

相关文章

网友评论

    本文标题:单细胞基础知识补充3-fread() 函数快速读取大表格以及取子

    本文链接:https://www.haomeiwen.com/subject/wrdjwrtx.html