美文网首页
2021.10.13-10.21 MIXCR学习笔记

2021.10.13-10.21 MIXCR学习笔记

作者: 千容安 | 来源:发表于2021-10-21 20:40 被阅读0次

>>准备工作

安装

下载mixcr
命令行输入:java -jar D:\mixcr-3.0.13\mixcr.jar align input.fastq.gz output.vdjca
切换工作路劲:cd C:\mixcr-3.0.13
输入:java -jar mixcr.jar

>>背景知识

典型的MiXCR工作流程主要由三个部分构成:

  • align:将测序结果比对到T细胞或B细胞受体的V、D、J、C基因参考序列上
  • assemble:利用前一步骤获得的比对结果拼接clonotypes(为了提取特定的基因区域信息,比如CDR3)
  • export:输出比对结果(exportAlignments模块)或者clones信息(exportClones模块),生成可读文件

MiXCR的assemble模块有几种不同的拼接方法可以选择:

  • assembleContigs:拼接完整的TCR或者IG受体clonotype序列
  • 对于RNA-Seq or non-targeted DNA data, 工作流程可能包括以下两部分:
    • assemblePartial:将有重叠区域的序列片段拼接成相对较长的包含CDR3区域的contigs
    • extend: 估算测序和比对质量较好但长度较短的TCR比对序列的germline序列

为了简化输入命令,MiXCR提供了analyze命令模块,打包了整个分析流程
MiXCR支持一下若干种数据类型:fasta,fastq,fastq.gz,paired-end fastq和fastq.gz。作为每一步骤的输出结果,MiXCR生成包含各种信息的二进制压缩文件(比对生成alignments,拼接生成clones)。利用exportAlignments和exportClones命令模块,每一个二进制文件都可以转化成tab分割的可读文本文件。
analyze模式,可以一站式完成(align、assemblePartial、extend、assemble、assembleContigs、export) 这些分析
使用的数据来源:

第一次输入:有错误
java -jar ./mixcr.jar analyze amplicon --species hs --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type IGH A1_1.clean.fq A1_2.clean.fq analysis

  • 不关命令行,ctrl+c即可停止正在进行的命令
    hs改为mmu,是小鼠的数据,IGH改成TCR,老师没有做过BCR的数据
    改成输入:
    java -jar ./mixcr.jar analyze amplicon --species mmu --starting-material dna --5-end v-primers --3-end j-primers --adapters adapters-present --receptor-type TCR A1_1.clean.fq A1_2.clean.fq analysis
    得到文件如下:

    其中TRA如下:
    analysis.clonotypes.TRA
    用了老师给的十几个数据的前两个样品,这个文件将V、D、J基因数据都囊括。
    目标是得到老师要求的table,模板之一如下:
    TRA.V
    是将所有样品中TRA.V的基因都整合。
    老师说进一步用vdjtools的Convert过滤数据
    由帮助信息可知,convert在util里面,在官网上找到命令行
    用法、帮助信息
    option为加-S MiXcr,表示输入数据为mixcr结果
    命令:java -jar ./vdjtools-1.2.1.jar Convert -S MiXcr analysis.clonotypes.TRA.txt output_prefix
    得到结果如下:
    output_prefix.analysis.clonotypes.TRA
    对table的一些解读:

    这部分,标记的应该是CDR3片段上面,VDJ基因的分界点

    freq就是频数。毕竟T细胞需要大量克隆,才能应对特定的病变细胞。count就是TCR重复的数目。这个数目以核酸序列为准来计算的。

    若最后4列是-1,则它们就不必考虑,这里的-1,表示没有有效数据,当作NA处理

还是V、D、J基因数据都整合的内容,老师认为改用immunarch里的geneusage:


geneusage

于是用immunarch里的geneusage,滑铁卢了,出现情况如下:



老师分析认为,immunarch安装不成功是R版本太高(4.1.1),建议用3.6.3的版本。
接下来考虑R多版本共存能不能行。

安装3.6.3后绑定rstudio,仍不能用:



选择一下CRAN镜像试试,找个中国区的:
chooseCRANmirror()
再次install.packages("immunarch")

下载包及其依赖的包安装:shiny、bslib
安装不了bslib:

要升级htmltools包,Rstudio右下方有packages框,在那边能找到升级按钮



更换了绑定的r版本就解决了。

相关文章

网友评论

      本文标题:2021.10.13-10.21 MIXCR学习笔记

      本文链接:https://www.haomeiwen.com/subject/xmheoltx.html