>>准备工作
- 先下载java,配置java,下载VDJtools
- 在命令提示符中输入java -jar C:\Users\Administrator.DESKTOP-4UQ3Q0K\Downloads\vdjtools-1.2.1\vdjtools-1.2.1\vdjtools.jar 运行VDJtools
- 安装R包
install.packages(c("circlize", "grid", "gridExtra", "VennDiagram"))
java -jar vdjtools.jar Rinstall
install.packages(c("reshape2", "FField", "reshape", "gplots",
"gridExtra", "circlize", "ggplot2", "grid",
"VennDiagram", "ape", "MASS", "plotrix",
"RColorBrewer", "scales"))
-
切换工作路径在命令提示符中输入
cd C:\Users\Administrator.DESKTOP-4UQ3Q0K\Downloads\vdjtools-1.2.1\vdjtools-1.2.1
, 切换工作路径到vdjtools-1.2.1这个文件夹,再输入java -jar vdjtools-1.2.1.jar VDJtools V1.2.1
>>传入数据
- 此文基于windows系统的尝试
- 把输入数据拷贝到现在的工作路径中,或者,输入文本前添加文件路径
- 命令行写入 java -jar ./vdjtools-1.2.1.jar OverlapPair 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt output_prefix
错误示范:不能用$VDJTOOLS,是Linux的写法,也删掉[option],
>>开始分析
一、Basic analysis
(1)CalcBasicStats
会有TCR的注释
-
java -jar ./vdjtools-1.2.1.jar CalcBasicStats 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt output_prefix
output_prefix.basicstats
(2)CalcSegmentUsage
-
java -jar ./vdjtools-1.2.1.jar CalcSegmentUsage -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt output_prefix
output_prefix.segments.wt.V
output_prefix.segments.wt.J
(3)CalcSpectratype
-
java -jar ./vdjtools-1.2.1.jar CalcSpectratype 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt output_prefix
产生文本
其中第二个
(4)PlotFancySpectratype
-
java -jar ./vdjtools-1.2.1.jar PlotFancySpectratype 5.clonotypes.TRA.txt output_prefix
output_prefix.fancyspectra
(5)PlotFancyVJUsage
java -jar ./vdjtools-1.2.1.jar PlotFancyVJUsage 4.clonotypes.TRA.txt output_prefix
-
出现未解决的问题:
(5)PlotSpectratypeV
-
java -jar ./vdjtools-1.2.1.jar PlotSpectratypeV 4.clonotypes.TRA.txt output_prefix
output_prefix.spectraV.wt
二、Diversity estimation
(1)Diversity estimation
-
java -jar ./vdjtools-1.2.1.jar PlotQuantileStats 3.clonotypes.TRA.txt output_prefix
output_prefix.qstat
(2)RarefactionPlot
-
java -jar ./vdjtools-1.2.1.jar RarefactionPlot 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt output_prefix
output_prefix.rarefaction.strict
(3)CalcDiversityStats
Command line usage
java -Xmx4G -jar vdjtools.jar CalcDiversityStats \ [options] [sample1.txt sample2.txt ... if -m is not specified] output_prefix
三、Repertoire overlap analysis
(1)OverlapPair
①表格输出
输出表java -jar ./vdjtools-1.2.1.jar OverlapPair 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt output_prefix
- 数据一定要在vdjtools的文件夹下
工作路径下产生3个txt
同时产生如下提示,忽略
②图形输出
-
java -jar ./vdjtools-1.2.1.jar OverlapPair -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt output_prefix
-
注意,查看OverlapPair帮助提示的命令:
OverlapPair帮助指示
java -jar ./vdjtools-1.2.1.jar OverlapPair
在中间添加“-p”表示画图
java -jar ./vdjtools-1.2.1.jar OverlapPair -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt output_prefix
-
如下报错代表Rscript没有安装成功,若已有R,说明没有配置环境变量
报错
R环境变量配置方法
配置完后重启电脑,在命令提示符中输入R,测试是否成功。
成功
配置完后重启电脑,在命令提示符中输入R,测试是否成功。
再次回到之前的工作路径中,输入产生图形的命令:
会产生的两个PDF文件
output_prefix.paired.strict.table.collapsed
output_prefix.strict.paired.scatter
(2)CalcPairwiseDistances
这样不算报错- 一定要传入两个以上的数据
java -jar ./vdjtools-1.2.1.jar CalcPairwiseDistances -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt 6.clonotypes.TRA.txt 7.clonotypes.TRA.txt 8.clonotypes.TRA.txt 3B.clonotypes.TRB.txt 4B.clonotypes.TRB.txt 5B.clonotypes.TRB.txt 6B.clonotypes.TRB.txt 7B.clonotypes.TRB.txt 8B.clonotypes.TRB.txt output_prefix
会产生 “output_prefix.intersect.batch.aa.txt” 和 “output_prefix.intersect.batch.aa.pdf”
CalcPairwiseDistances.pdf
-
在命令行直接输入R,会切换到R命令行
R命令行
(3)ClusterSamples
java -jar ./vdjtools-1.2.1.jar ClusterSamples -p output_prefix input_prefix
输入文件前缀 设置为与CalcPairwise 差异的输出前缀相同的值
产生表:会产生一个“input_prefix.mds.aa.F”文本文件、一个“file_out_clust”(newick)文件
产生图形(PDF):input_prefix.hc.aa.F 和 input_prefix.mds.aa.F
input_prefix.mds.aa.F
此处有存疑,待未来尝试解决:
一、
官方作出的图如下:
hc
命令行里也没有报错
没有报错
用notepad++打开vdjtools文件夹下的cluster_samples.r,是刚才运行R脚本,是vdjtools自动生成的,在命令行里打开R,把加箭头的两行粘贴到R命令行里
如下反馈,并不是不缺少作图包
反馈
二、
input_prefix.mds.aa.F的图里没有加颜色,有可能是vdjtools没有让它画颜色。
ClusterSamples时输入的命令
老师给的解释摘记如下,待以后用其他数据再尝试。
应该有个color_by_factor,受到某个输入参数的影响。但为何vdjtools给这个参数安排为0,恐怕后面有机会再去深究。
1、可能是这组数据没有去分组。
2、这组数据里,TCR之间真的没有交集,以至于vdjtools算不出相似度。
3、部分数据没有overlap的clone。
(4)TestClusters
Command line usage:
$VDJTOOLS TestClusters
[options] input_prefix [output_prefix]
java -jar ./vdjtools-1.2.1.jar TestClusters input_prefix input_prefix
- 后一个“input_prefix”是上一个文件产生的文件名,留言报错内容,无需“-p”,没有表输出。
-
产生pdf:input_prefix.perms.aa.F
TestClusters
(5)TrackClonotypes
java -jar ./vdjtools-1.2.1.jar TrackClonotypes -p 3.clonotypes.TRA.txt 4.clonotypes.TRA.txt 5.clonotypes.TRA.txt output_prefix
output_prefix.tracking.strict.summary
output_prefix.tracking.strict.stackplot
output_prefix.tracking.strict.heatplot
网友评论