使用python得到TCGA表格

作者: 生信杂谈 | 来源:发表于2017-11-14 10:10 被阅读190次

    我们需要提取下面的表格到本地,具体图片如下:

    tcga1.png

    我们首先先点击表格右上角的JSON下载为JSON格式(假设保存的为data.json格式),打开可以发现其数据与表格上的数据是有差别的,我们用如下代码进行处理:

    #-*-coding:utf-8-*-
    # author:kangsgo
    
    import json
    
    model={}
    #解码json
    with open('data.json','r',encoding='utf-8') as json_file:
        model=json.load(json_file)
    
    #写入到data.csv文件中
    f=open('data.csv','w')
    count=0
    for i in model:
        a=[]
        for j in i['consequence']:
            a.append(j['transcript']['aa_change'])
        a=list(set(a))
        f.write(i['genomic_dna_change']+';'+i['ssm_id']+';'+i['mutation_subtype']+';' \
           +str(len(a))+'/567'+';'+str(len(i['consequence']))+'/10188')
        f.write('\n')
        count += 1
    f.close()
    

    将会得到data.csv的csv文件,可以用excel等工具进一步处理分析。


    更多原创精彩视频敬请关注生信杂谈:

    相关文章

      网友评论

      • shuofeng18:或者这个在什么系统下操作才好
      • shuofeng18:请问能否说得再详细一些,例如这一段代码输入完成之后对文件该如何操作😀
        shuofeng18:@生信杂谈 好的,十分感谢😄
        生信杂谈:@shuofeng18 都可以呀,就是csv文件了,可以直接用软件做图分析或者pandas等软件里进一步分析了。不好意思,最近比较忙,没有看到

      本文标题:使用python得到TCGA表格

      本文链接:https://www.haomeiwen.com/subject/vpsxvxtx.html