单细胞学习3.从头创建索引文件

作者: wo_monic | 来源:发表于2024-03-12 11:31 被阅读0次

私有库采坑
pod远程私有仓库创建
LZO 创建索引
lucene
day06
Oracle 索引
elasticsearch python 简单实践
iOS 组件化初识
mongodb基本操作
Pod私有库

除了人类和鼠的数据在cellranger上有索引文件外，我们更多的时候研究的是非模式生物。现在就从头创建一个基因组的索引文件，这里以玉米为例子。
使用的cellranger版本是V7.2.0

1. 创建基因注释文件

cellranger mkgtf ~/maize/genome/Zea_mays.B73_RefGen_v4.42.gtf Zm442.gtf --attribute=gene_biotype:protein_coding

可以通过指定参数--attribute=gene_biotype:protein_coding来只提取编码基因。

2. 创建基因组索引文件

cellranger mkref --genome ref_Zm442 --fasta ~/maize/genome/Zea_mays.B73_RefGen_v4.42.fa --genes Zm442.gtf --nthreads 24 --memgb 64

参数：
--genes 该文件第一步的输出的结果
--genome 是指定输出文件夹名称
--nthreads 指定使用的cpu数量
--memgb 指定使用的内存数量，单位是G.
生成索引文件夹名称是ref_Zm442,文件内容结构如下

 [4.0K]  ref_Zm442
│   ├── [4.0K]  fasta
│   │   ├── [2.0G]  genome.fa
│   │   └── [9.2K]  genome.fa.fai
│   ├── [4.0K]  genes
│   │   └── [ 31M]  genes.gtf.gz
│   ├── [ 467]  reference.json
│   └── [4.0K]  star
│       ├── [1.6K]  chrLength.txt
│       ├── [4.8K]  chrNameLength.txt
│       ├── [3.2K]  chrName.txt
│       ├── [2.9K]  chrStart.txt
│       ├── [ 40M]  exonGeTrInfo.tab
│       ├── [ 16M]  exonInfo.tab
│       ├── [1.9M]  geneInfo.tab
│       ├── [2.1G]  Genome
│       ├── [1.3K]  genomeParameters.txt
│       ├── [ 17G]  SA
│       ├── [1.5G]  SAindex
│       ├── [6.8M]  sjdbInfo.txt
│       ├── [6.7M]  sjdbList.fromGTF.out.tab
│       ├── [5.4M]  sjdbList.out.tab
│       └── [9.1M]  transcriptInfo.tab

3.cellranger进行定量分析

cellranger count \
--id=sample345 \
--transcriptome=database_path \
--fastqs=fastq_path \
--sample=mysample \

网友评论

本文标题：单细胞学习3.从头创建索引文件

本文链接：https://www.haomeiwen.com/subject/gzgszdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

单细胞学习3.从头创建索引文件

1. 创建基因注释文件

2. 创建基因组索引文件

3.cellranger进行定量分析

相关文章

私有库采坑

pod远程私有仓库创建

LZO 创建索引

lucene

day06

Oracle 索引

elasticsearch python 简单实践

iOS 组件化初识

mongodb基本操作

Pod私有库

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读