AnnotSV地址:https://lbgi.fr/AnnotSV/
版本:3.0.5
AnnotSV输出结果部分列名解释
1、AnnotSV_ID:AnnotSV ID
2、SV_chrom:染色体名称
3、SV_start:SV在染色体中的起始位置
4、SV_end:SV在染色体中的终止位置
5、SV_length:SV的长度(bp)(缺失为负值)
6、SV_type:SV类型(缺失DEL、重复DUP等)
7、Samples_ID:调用SV的样本ID列表(根据SV输入文件)
8、ID:突变位点ID(仅从VCF输入文件中提取)
9、REF:参考基因组中的核苷酸序列(仅从VCF输入文件中提取)
10、ALT:突变后核苷酸序列(仅从VCF输入文件中提取)
11、QUAL:突变质量值(仅从VCF输入文件中提取)
12、FILTER:过滤结果(仅从VCF输入文件中提取)
13、INFO:位点信息(仅从VCF输入文件中提取)
14、FORMAT:vcf文件的FORMAT列信息
15、“SAMPLE_NAME”:vcf文件中的样本名, 对应信息该样本的基因型
16、Annotation_mode:表示生成的注释行类型: 1. 对SV全长的注释(“full”),2. 每个被SV重叠的基因的注释(“split”)
17、Gene_name:基因Symbol
18、Gene_count:与SV重叠的基因数
19、Tx:转录本Symbol
20、Tx_start:转录本起始位点
21、Tx_end:转录本终止位点
22、Overlapped_tx_length:转录本与SV重叠的长度(bp)
23、Overlapped_CDS_length:编码序列与SV重叠的长度(CDS) (bp)
24、Overlapped_CDS_percent:编码序列(CDS)与SV重叠的百分比(bp)
25、Frameshift:表示CDS长度是否能被3整除(yes或no)
26、Exon_count:转录本中外显子数
27、Location:SV在基因中的定位,取值txStart, txEnd, exon’i’, intron’i
28、Location2:SV在基因编码区的定位,取值UTR(基因中无CDS)、5'UTR (CDS开始前)、3'UTR (CDS结束后)、CDS (CDS开始到CDS结束之间,可以是外显子,也可以是内含子)。
29、Dist_nearest_SS:考虑外显子和内含子SV断点后,到最近剪接位点的绝对距离
30、Nearest_SS_type:最近的剪接位点类型:5'(供体)或3'(受体)
31、Intersect_start:SV和转录本之间交集的起始位置
32、Intersect_end:SV和转录本之间的交叉点的结束位置
33、RE_gene:受调节元件调节的基因名称与SV重叠以进行注释。如果可以,相关单倍不全(HI),三倍敏感性(TS), Exomiser (EX)评分,OMIM和候选基因的详细调控基因名称。(关于过滤输出,请参见-REselect1和-REselect2选项)
34、P_gain_phen:完全重叠于SV的致病gain基因组区域的坐标来注释
35、P_gain_hpo:描述致病增益基因组区域的HPO术语与SV完全重叠来注释
36、P_gain_source:致病增益基因组区域的起源与SV完全重叠以注释:dbVarNR (dbVar), ClinVar (CLN), ClinGen (TS3)
37、P_gain_coord:致病增益基因组区域的坐标与SV完全重叠以注释
38、P_loss_phen:致病损失基因组的表型区域与SV完全重叠注释
39、P_loss_hpo:描述致病损失基因组区域的HPO术语与SV完全重叠来注释
40、P_loss_source:致病损失基因组区域的起源与SV完全重叠注释:dbVarNR (dbVar), ClinVar (CLN), ClinGen (HI3), morbid(病变部位)
41、P_loss_coord:致病性缺失基因组区域的坐标与SV完全重叠以注释
42、P_ins_phen:致病基因插入基因组区域的表型与SV完全重叠来注释
43、P_ins_hpo:描述致病插入基因组区域的HPO术语与SV完全重叠来注释
44、P_ins_source:致病插入基因组区域的起源与SV完全重叠以注释:dbVarNR (dbVar), ClinVar (CLN)
45、P_ins_coord:致病性插入基因组区域的坐标与SV完全重叠以注释
46、P_snvindel_nb:公共数据库中致病snv/indel的数量与SV完全重叠以进行注释
47、P_snvindel_phen:公共数据库中致病snv/indel的表型与SV完全重叠来注释
48、B_gain_source:良性gain基因组区起源完全重叠SV注释: gnomAD, ClinVar (CLN), ClinGen (TS40), DGV (DGV, nsv或esv), DDD, 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
49、B_gain_coord:完全重叠于SV的良性gain基因组区域的坐标来注释
50、B_loss_source:良性loss基因组区域的起源完全重叠SV注释: gnomAD, ClinVar (CLN), ClinGen (HI40), DGV (DGV, nsv或esv), DDD, 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
51、B_loss_coord:完全重叠于SV的良性loss基因组区域的坐标来注释
52、B_ins_source:良性insert基因组区域的起源完全重叠SV注释:gnomAD, ClinVar (CLN), 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
53、B_ins_coord:完全重叠于SV的良性insert基因组区域的坐标来注释
54、B_inv_source:良性inversion基因组区域的起源完全重叠SV注释:gnomAD, ClinVar (CLN), 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
55、B_inv_coord:完全重叠于SV的良性inversion基因组区域的坐标来注释
56、TAD_coordinate:边界与标注的SV重叠的TAD坐标(坐标中包含的边界)
57、ENCODE_experiment:ENCODE实验用来定义TAD
58、GC_content_left:左侧SV断点附近GC含量(+/- 100bp)
59、GC_content_right:右侧SV断点附近GC含量(+/- 100bp)
60、Repeat_coord_left:重复左SV断点周围的坐标(+/- 100bp)
61、Repeat_type_left:在左SV断点附近重复输入(+/- 100bp),例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
62、Repeat_coord_right:重复右SV断点周围的坐标(+/- 100bp)
63、Repeat_type_right:在右SV断点(+/- 100bp)周围重复键入,例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
64、Gap_left:左SV断点周围间隙区域坐标(+/- 100bp)
65、Gap_right:右SV断点周围间隙区域坐标(+/- 100bp)
66、SegDup_left:分段复制区域坐标围绕左SV断点(+/- 100bp)
67、SegDup_right:分段复制区域坐标围绕右SV断点(+/- 100bp)
68、ENCODE_blacklist_left:编码黑名单区域坐标围绕左SV断点(+/- 100bp)
69、ENCODE_blacklist_characteristics_left:左SV断点附近ENCODE黑名单区域特征(+/- 100bp)
70、ENCODE_blacklist_right:编码黑名单区域坐标围绕右SV断点(+/- 100bp)
71、ENCODE_blacklist_characteristics_right:右SV断点附近ENCODE黑名单区域特征(+/- 100bp)
72、ACMG:ACMG基因
73、HI:ClinGen单倍体不全(Haploinsufficiency)得分
注:Haploinsufficiency得分。当评估单倍不全(HI)时,先证者必须具备以下任一条件: 1. 被评估基因中预测或证实为无效,2. 功能缺失(LoF)变异。
74、TS:ClinGen Triplosensitivity得分
75、DDD_HI_percent:DDD排序的单倍体不足
76、DDD_status:DDD状态:如已确认,可能
77、DDD_mode:DDD等位基因要求:例如双等位基因,半合子…
78、DDD_consequence:DDD等位基因要求:例如双等位基因,半合子…
79、DDD_disease:DDD疾病名称:例如。“OCULOAURICULAR综合症”
80、DDD_pmid:DDD Pubmed ID
81、ExAC_delZ:ExAC阳性的delZ_ExAC (Z score)表明该基因不耐受缺失
82、ExAC_dupZ:dupZ_ExAC (Z score)阳性来自ExAC,表明该基因不耐受复制
83、ExAC_cnvZ:ExAC阳性的cnvZ_ExAC (Z score)表明该基因对CNV不耐受
84、ExAC_synZ:synZ_ExAC (Z score)从ExAC阳性表明该基因不耐受同义变异
85、ExAC_misZ:从ExAC阳性的misZ_ExAC (Z score)表明该基因不耐受错义变异
86、OMIM_ID:OMIM唯一的六位标识符
87、OMIM_phenotype:例如疾病腓骨肌萎缩
88、OMIM_inheritance:例如AD(=“常染色体显性遗传”)
89、OMIM_morbid:如果SV与OMIM的致病基因重叠,则设置为“yes”
90、OMIM_morbid_candidate:如果SV与OMIM候选疾病基因重叠,则设置为“yes”
91、LOEUF_bin:给定基因转录本的最小“LOEUF的十分位数箱”(值越低表示约束越强),值= integer [0-9]
92、GnomAD_pLI:由gnomAD计算的得分,表明基因不耐受功能变异的概率(无意义,SNV/indel导致的剪接受体/供体变异)。
93、ExAC_pLI:ExAC计算的得分,表明基因不耐受功能变异的概率(无意义,SNV/indel导致的剪接受体/供体变异)。ExAC认为pLI>=0.9是一个极LoF不耐基因
94、AnnotSV_ranking_score:根据ACMG和克林根2019年的联合共识推荐,SV排名得分。评分:致病性≥0.99,可能致病性[0.90;0.98],差异不确定[0.89;-0.89],可能良性[-0.90;-0.98],良性≤-0.99。
95、AnnotSV_ranking_criteria:解释AnnotSV排名得分的决定标准
96、ACMG_class:SV等级为5级中的1级:1级(良性),2级(可能良性),3级(变异的意义未知),4级(可能致病),5级(致病)
参考:https://lbgi.fr/AnnotSV/Documentation/README.AnnotSV_latest.pdf
AnnotSV结果
AnnotSV output
AnnotSV解释
end
网友评论