单细胞基础知识补充3-fread() 函数快速读取大表格以及取子

作者: oceanandshore | 来源:发表于2022-08-03 11:01 被阅读0次

平时读取一个表格文件通常使用read.table函数，但当遇到上百M或上G的文件时，就读的非常慢了。
有个函数fread()，来自data.table包，可以更快地读取表格文件，速度可以快近十倍。而且对于很大的表格，fread()还会提供读取进度条，非常滴友好~

mat=fread("GSE144735_processed_KUL3_CRC_10X_raw_UMI_count_matrix.txt")
mat=as.data.frame(mat)
rownames(mat)=mat$Index
mat$Index=NULL

其中 as.data.frame(mat) 这一步是把要用的数据格式转换为数据框格式，转换成数据框格式这样方便进行操作？

colnames()和rownames() 用来修改矩阵的变量名（行名和列名），也能修改数据框的行名和列名。

这里涉及到的取子集不是针对单细胞的，就是简单的R操作基础
构建子集
[ ]：提取一个or多个类型相同的元素
[[ ]]：从列表或数据框中提取元素
$ ：按名字从列表or数据框中提取元素

网友评论

本文标题：单细胞基础知识补充3-fread() 函数快速读取大表格以及取子

本文链接：https://www.haomeiwen.com/subject/wrdjwrtx.html

单细胞基础知识补充3-fread() 函数快速读取大表格以及取子