美文网首页科研信息学
TCGA原始文件id转换

TCGA原始文件id转换

作者: 落寞的橙子 | 来源:发表于2022-06-16 05:15 被阅读0次

    本文适用于下载受保护的数据的文件,从文件id转换为TCGA样本id
    官网教程
    Windows下的方法
    bug解决
    自行下载manifest文件,具体参照官网方法
    在R中运行

    options(stringsAsFactors=F)
    setwd("~/Desktop/gdc/")
    manifest= "gdc_manifest.2022-06-15.txt"#下载于TCGA官网
    x=read.table(manifest,header = T) 
    manifest_length= nrow(x) 
    id= toString(sprintf('"%s"', x$id))
    
    Part1= '{"filters":{"op":"in","content":{"field":"files.file_id","value":[ '
    
    
    Part2= '] }},"format":"TSV","fields":"file_id,file_name,cases.submitter_id,cases.case_id,data_category,data_type,cases.samples.tumor_descriptor,cases.samples.tissue_type,cases.samples.sample_type,cases.samples.submitter_id,cases.samples.sample_id,cases.samples.portions.analytes.aliquots.aliquot_id,cases.samples.portions.analytes.aliquots.submitter_id","size":'
    
    Part3= paste0("\"",manifest_length, "\"", "}") #这里其实跟官网是不一样的
    
    
    
    Sentence= paste(Part1,id,Part2,Part3, collapse=" ")
    write.table(Sentence,"Payload.txt",quote=F,col.names=F,row.names=F,sep="\t")
    
    
    

    在terminal终端中输入,我这里是用conda管理的环境

    source /Users/nhlbihelp/opt/anaconda3/etc/profile.d/conda.sh
    conda activate /Users/jiangc4/Documents/conda/cj 
    cd ~/Desktop/gdc/
    curl --request POST --header "Content-Type: application/json" --data @Payload.txt "https://api.gdc.cancer.gov/files" > File_metadata.txt
    
    gdc_manifest File_metadata

    相关文章

      网友评论

        本文标题:TCGA原始文件id转换

        本文链接:https://www.haomeiwen.com/subject/iumfvrtx.html