基因拷贝数目文件下载下来之后,发现文件名字和TCGA国际认证的命名方式对不上。
所以下载了对应的json文件,发现命名真是乱七八糟。
来吧!写程序提取吧!
这个只是提起我们需要的名称,便于和基因表达量进行关联哈。
这里只是个提取信息的程序,后续详细步骤会进一步更新的。
"""
作者:谢京合
功能:提取json文件当中的信息,并且将其变成列表格式
时间:2020年11月4日
"""
import json
def main():
"""
main function
:return:
"""
my_file = open('metadata.cart.json', encoding='utf-8')
my_result = open('result.txt', 'w')
json_data = json.load(my_file)
# print(json_data)
for list_data in json_data:
# print(list_data)
print(list_data['associated_entities'][0]['entity_id'])
my_result.write(list_data['associated_entities'][0]['entity_id'] \
+ '\t' \
+ list_data['associated_entities'][0]['entity_submitter_id'] \
+ '\n')
my_result.close()
my_file.close()
if __name__ == '__main__':
main()
网友评论