美文网首页基因组分析
AnnotSV输出结果列名

AnnotSV输出结果列名

作者: 亦是旅人呐 | 来源:发表于2022-04-01 20:38 被阅读0次

    AnnotSV地址:https://lbgi.fr/AnnotSV/
    版本:3.0.5


    AnnotSV输出结果部分列名解释

    1、AnnotSV_ID:AnnotSV ID
    2、SV_chrom:染色体名称
    3、SV_start:SV在染色体中的起始位置
    4、SV_end:SV在染色体中的终止位置
    5、SV_length:SV的长度(bp)(缺失为负值)
    6、SV_type:SV类型(缺失DEL、重复DUP等)
    7、Samples_ID:调用SV的样本ID列表(根据SV输入文件)
    8、ID:突变位点ID(仅从VCF输入文件中提取)
    9、REF:参考基因组中的核苷酸序列(仅从VCF输入文件中提取)
    10、ALT:突变后核苷酸序列(仅从VCF输入文件中提取)
    11、QUAL:突变质量值(仅从VCF输入文件中提取)
    12、FILTER:过滤结果(仅从VCF输入文件中提取)
    13、INFO:位点信息(仅从VCF输入文件中提取)
    14、FORMAT:vcf文件的FORMAT列信息
    15、“SAMPLE_NAME”:vcf文件中的样本名, 对应信息该样本的基因型
    16、Annotation_mode:表示生成的注释行类型: 1. 对SV全长的注释(“full”),2. 每个被SV重叠的基因的注释(“split”)
    17、Gene_name:基因Symbol
    18、Gene_count:与SV重叠的基因数
    19、Tx:转录本Symbol
    20、Tx_start:转录本起始位点
    21、Tx_end:转录本终止位点
    22、Overlapped_tx_length:转录本与SV重叠的长度(bp)
    23、Overlapped_CDS_length:编码序列与SV重叠的长度(CDS) (bp)
    24、Overlapped_CDS_percent:编码序列(CDS)与SV重叠的百分比(bp)
    25、Frameshift:表示CDS长度是否能被3整除(yes或no)
    26、Exon_count:转录本中外显子数
    27、Location:SV在基因中的定位,取值txStart, txEnd, exon’i’, intron’i
    28、Location2:SV在基因编码区的定位,取值UTR(基因中无CDS)、5'UTR (CDS开始前)、3'UTR (CDS结束后)、CDS (CDS开始到CDS结束之间,可以是外显子,也可以是内含子)。
    29、Dist_nearest_SS:考虑外显子和内含子SV断点后,到最近剪接位点的绝对距离
    30、Nearest_SS_type:最近的剪接位点类型:5'(供体)或3'(受体)
    31、Intersect_start:SV和转录本之间交集的起始位置
    32、Intersect_end:SV和转录本之间的交叉点的结束位置
    33、RE_gene:受调节元件调节的基因名称与SV重叠以进行注释。如果可以,相关单倍不全(HI),三倍敏感性(TS), Exomiser (EX)评分,OMIM和候选基因的详细调控基因名称。(关于过滤输出,请参见-REselect1和-REselect2选项)
    34、P_gain_phen:完全重叠于SV的致病gain基因组区域的坐标来注释
    35、P_gain_hpo:描述致病增益基因组区域的HPO术语与SV完全重叠来注释
    36、P_gain_source:致病增益基因组区域的起源与SV完全重叠以注释:dbVarNR (dbVar), ClinVar (CLN), ClinGen (TS3)
    37、P_gain_coord:致病增益基因组区域的坐标与SV完全重叠以注释
    38、P_loss_phen:致病损失基因组的表型区域与SV完全重叠注释
    39、P_loss_hpo:描述致病损失基因组区域的HPO术语与SV完全重叠来注释
    40、P_loss_source:致病损失基因组区域的起源与SV完全重叠注释:dbVarNR (dbVar), ClinVar (CLN), ClinGen (HI3), morbid(病变部位)
    41、P_loss_coord:致病性缺失基因组区域的坐标与SV完全重叠以注释
    42、P_ins_phen:致病基因插入基因组区域的表型与SV完全重叠来注释
    43、P_ins_hpo:描述致病插入基因组区域的HPO术语与SV完全重叠来注释
    44、P_ins_source:致病插入基因组区域的起源与SV完全重叠以注释:dbVarNR (dbVar), ClinVar (CLN)
    45、P_ins_coord:致病性插入基因组区域的坐标与SV完全重叠以注释
    46、P_snvindel_nb:公共数据库中致病snv/indel的数量与SV完全重叠以进行注释
    47、P_snvindel_phen:公共数据库中致病snv/indel的表型与SV完全重叠来注释
    48、B_gain_source:良性gain基因组区起源完全重叠SV注释: gnomAD, ClinVar (CLN), ClinGen (TS40), DGV (DGV, nsv或esv), DDD, 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
    49、B_gain_coord:完全重叠于SV的良性gain基因组区域的坐标来注释
    50、B_loss_source:良性loss基因组区域的起源完全重叠SV注释: gnomAD, ClinVar (CLN), ClinGen (HI40), DGV (DGV, nsv或esv), DDD, 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
    51、B_loss_coord:完全重叠于SV的良性loss基因组区域的坐标来注释
    52、B_ins_source:良性insert基因组区域的起源完全重叠SV注释:gnomAD, ClinVar (CLN), 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
    53、B_ins_coord:完全重叠于SV的良性insert基因组区域的坐标来注释
    54、B_inv_source:良性inversion基因组区域的起源完全重叠SV注释:gnomAD, ClinVar (CLN), 1000个基因组(1000g), Ira M. Hall’s实验室(IMH),儿童慈善研究所(CMRI)
    55、B_inv_coord:完全重叠于SV的良性inversion基因组区域的坐标来注释
    56、TAD_coordinate:边界与标注的SV重叠的TAD坐标(坐标中包含的边界)
    57、ENCODE_experiment:ENCODE实验用来定义TAD
    58、GC_content_left:左侧SV断点附近GC含量(+/- 100bp)
    59、GC_content_right:右侧SV断点附近GC含量(+/- 100bp)
    60、Repeat_coord_left:重复左SV断点周围的坐标(+/- 100bp)
    61、Repeat_type_left:在左SV断点附近重复输入(+/- 100bp),例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
    62、Repeat_coord_right:重复右SV断点周围的坐标(+/- 100bp)
    63、Repeat_type_right:在右SV断点(+/- 100bp)周围重复键入,例如AluSp, L2b, L1PA2, LTR12C, SVA_D,...
    64、Gap_left:左SV断点周围间隙区域坐标(+/- 100bp)
    65、Gap_right:右SV断点周围间隙区域坐标(+/- 100bp)
    66、SegDup_left:分段复制区域坐标围绕左SV断点(+/- 100bp)
    67、SegDup_right:分段复制区域坐标围绕右SV断点(+/- 100bp)
    68、ENCODE_blacklist_left:编码黑名单区域坐标围绕左SV断点(+/- 100bp)
    69、ENCODE_blacklist_characteristics_left:左SV断点附近ENCODE黑名单区域特征(+/- 100bp)
    70、ENCODE_blacklist_right:编码黑名单区域坐标围绕右SV断点(+/- 100bp)
    71、ENCODE_blacklist_characteristics_right:右SV断点附近ENCODE黑名单区域特征(+/- 100bp)
    72、ACMG:ACMG基因
    73、HI:ClinGen单倍体不全(Haploinsufficiency)得分
    注:Haploinsufficiency得分。当评估单倍不全(HI)时,先证者必须具备以下任一条件: 1. 被评估基因中预测或证实为无效,2. 功能缺失(LoF)变异。
    74、TS:ClinGen Triplosensitivity得分
    75、DDD_HI_percent:DDD排序的单倍体不足
    76、DDD_status:DDD状态:如已确认,可能
    77、DDD_mode:DDD等位基因要求:例如双等位基因,半合子…
    78、DDD_consequence:DDD等位基因要求:例如双等位基因,半合子…
    79、DDD_disease:DDD疾病名称:例如。“OCULOAURICULAR综合症”
    80、DDD_pmid:DDD Pubmed ID
    81、ExAC_delZ:ExAC阳性的delZ_ExAC (Z score)表明该基因不耐受缺失
    82、ExAC_dupZ:dupZ_ExAC (Z score)阳性来自ExAC,表明该基因不耐受复制
    83、ExAC_cnvZ:ExAC阳性的cnvZ_ExAC (Z score)表明该基因对CNV不耐受
    84、ExAC_synZ:synZ_ExAC (Z score)从ExAC阳性表明该基因不耐受同义变异
    85、ExAC_misZ:从ExAC阳性的misZ_ExAC (Z score)表明该基因不耐受错义变异
    86、OMIM_ID:OMIM唯一的六位标识符
    87、OMIM_phenotype:例如疾病腓骨肌萎缩
    88、OMIM_inheritance:例如AD(=“常染色体显性遗传”)
    89、OMIM_morbid:如果SV与OMIM的致病基因重叠,则设置为“yes”
    90、OMIM_morbid_candidate:如果SV与OMIM候选疾病基因重叠,则设置为“yes”
    91、LOEUF_bin:给定基因转录本的最小“LOEUF的十分位数箱”(值越低表示约束越强),值= integer [0-9]
    92、GnomAD_pLI:由gnomAD计算的得分,表明基因不耐受功能变异的概率(无意义,SNV/indel导致的剪接受体/供体变异)。
    93、ExAC_pLI:ExAC计算的得分,表明基因不耐受功能变异的概率(无意义,SNV/indel导致的剪接受体/供体变异)。ExAC认为pLI>=0.9是一个极LoF不耐基因
    94、AnnotSV_ranking_score:根据ACMG和克林根2019年的联合共识推荐,SV排名得分。评分:致病性≥0.99,可能致病性[0.90;0.98],差异不确定[0.89;-0.89],可能良性[-0.90;-0.98],良性≤-0.99。
    95、AnnotSV_ranking_criteria:解释AnnotSV排名得分的决定标准
    96、ACMG_class:SV等级为5级中的1级:1级(良性),2级(可能良性),3级(变异的意义未知),4级(可能致病),5级(致病)


    参考:https://lbgi.fr/AnnotSV/Documentation/README.AnnotSV_latest.pdf

    AnnotSV结果
    AnnotSV output
    AnnotSV解释


    end

    相关文章

      网友评论

        本文标题:AnnotSV输出结果列名

        本文链接:https://www.haomeiwen.com/subject/giiajrtx.html