美文网首页生物信息学与算法全基因组/外显子组测序分析
难道我一直没理解segmentation文件的拷贝数计算?

难道我一直没理解segmentation文件的拷贝数计算?

作者: 王诗翔 | 来源:发表于2018-10-25 20:42 被阅读74次

    一个比较典型的segmentation file格式如下:

    > head(segfile)
    # A tibble: 6 x 6
      Sample                       Chromosome    Start      End Num_Probes Segment_Mean
      <chr>                             <int>    <int>    <int>      <int>        <dbl>
    1 TCGA-DK-A1A6-01A-11D-A13V-01          1  3218610 14449771       5840       -0.133
    2 TCGA-DK-A1A6-01A-11D-A13V-01          1 14450545 14453003          2       -1.94 
    3 TCGA-DK-A1A6-01A-11D-A13V-01          1 14455748 31677633       9063       -0.114
    4 TCGA-DK-A1A6-01A-11D-A13V-01          1 31682380 31736123         40       -0.558
    5 TCGA-DK-A1A6-01A-11D-A13V-01          1 31740706 31750640          4        0.184
    6 TCGA-DK-A1A6-01A-11D-A13V-01          1 31751191 31829873         35        0.468
    

    根据Segment_Mean列计算拷贝数及拷贝数Ratio(Tumor vs. Normal)呢?

    算拷贝数我使用2 * 2 ^ Segment_Mean,拷贝数Ratio的话就是2 ^ Segment_Mean

    但我在看了ABSOLUTE包的源码后,我很崩溃

    然后它算出来的拷贝数ratio是下面这样的:

    > head(segtab2)
    # A tibble: 6 x 16
      sample Chromosome Start.bp End.bp n_probes length seg_sigma       W copy_ratio modal_cn expected_cn subclonal
      <chr>       <int>    <int>  <int>    <int>  <int>     <dbl>   <dbl>      <dbl>    <int>       <dbl>     <int>
    1 solid…          1  3218610 1.44e7     5840 1.12e7   0.00164 0.00394      0.456        2       2.08          0
    2 solid…          1 14450545 1.45e7        2 2.46e3   0.0884  0            0.131        0       0.583         0
    3 solid…          1 14455748 3.17e7     9063 1.72e7   0.00131 0.00604      0.462        2       2.11          0
    4 solid…          1 31682380 3.17e7       40 5.37e4   0.0198  0.00002      0.340        1       1.48          0
    5 solid…          1 31740706 3.18e7        4 9.93e3   0.0625  0            0.568        3       2.69          0
    6 solid…          1 31751191 3.18e7       35 7.87e4   0.0211  0.00003      0.692        3       3.52          0
    

    谁可以告诉我真相是什么? :cry:

    刚好2倍的差别~

    相关文章

      网友评论

      • LeoinUSA:看源码然后修改,遇到不靠谱的作者会哭:joy:
        王诗翔:@LeoinUSA 按你的理解,这个也是有问题的对吗

      本文标题:难道我一直没理解segmentation文件的拷贝数计算?

      本文链接:https://www.haomeiwen.com/subject/dnzctqtx.html