美文网首页
2020-10-05 miRNA预后模型文章套路视频(COX模型

2020-10-05 miRNA预后模型文章套路视频(COX模型

作者: whykm | 来源:发表于2020-10-06 06:43 被阅读0次

    mRNAdownload-转录组数据下载

    Google一下 “TCGA GDC”,进入网址:https://portal.gdc.cancer.gov/
    清空cart中的数据

    image.png
    点击repository下载数据
    image.png
    先选择“Cases”中的数据
    image.png
    再选择“Files”中的数据
    image.png
    选择好以后加入Carts
    image.png
    要下载三个数据
    第一个是Metadata
    第二个是Manifest
    第三个是Cart
    网页版下载可直接点击后下载
    image.png
    下载好的数据如图所示:
    image.png

    软件下载数据方法:

    先下载gdc_manifest数据和gdc_sample_sheet数据到一个文件夹中
    将gdc-client拷贝于同个文件夹


    image.png

    点击这个圈圈后输入cmd进入终端,然后输入代码 【cd 文件夹路径】(例子:cd C:\Users\Administrator\Desktop\m6A_ESCA_data )进入该文件夹
    然后输入代码【软件名 download -m manifest文件名】(例子: )


    image.png

    转录组数据整理

    • 将cart文件(gdc_download_20191221_001421.542019.tar.gz)和.json文件(metadata.cart.2019-12-21.json)拷贝到同个文件夹,将cart文件进行解压,可看到每个样品有一个目录,目录下是一个压缩包。
      +将moveFile.pl脚本拷贝到cart文件解压后的文件夹中,然后运行脚本。


      image.png
    • 运行方法:cmd进入终端,然后cd 文件夹名字,然后进入该文件夹,然后输入perl moveFile.pl将所有目录下的压缩包移动到一个文件夹中。


      image.png

      我们可看到多了个file文件夹


      image.png
    • 在这个文件夹中将所有文件解压到当前文件夹,删除压缩包,然后将merge.pl和meta文件拷贝到这个文件夹。


      image.png

      然后再运行一下perl脚本。运行代码:perl merge.pl metadata.cart.2019-12-21.json(即 perl merge.pl meta文件)


      image.png
      可得到所需行名为ensemble id,列名为样品名的矩阵,然后得到正常样本和肿瘤样本的个数,将这个数值记录下来。
      image.png
      image.png

    id转换

    • 输入文件准备:一个脚本:symbol.pl,一个是human.gtf(GCA_000001405.27),一个是上面得到的mRNAmatrix.txt文件,运行脚本,得到symbol.txt

    • 临床数据下载 谷歌TCGA GDC ,清空cart,然后选cases和files,加入到cart

    https://portal.gdc.cancer.gov/

    image.png
    image.png
    image.png
    只需要下载cart文件
    image.png

    另外一种下载方法:

    • 先下载好manifest文件,


      image.png
      image.png

      使用gdc-client.exe软件,cmd进入终端,输入gdc-client.exe download -m gdc_manifest_20200406_123044.txt
      可下载好文件如图所示,共307个文件:


      image.png

    getClinical-临床信息提取

    将下载好的临床数据的cart文件解压


    image.png

    将脚本getClinical.pl拷贝进文件夹


    image.png

    得到clinical.xls文件


    image.png

    miRNA数据下载

    进入TCGA官网,清空cart
    https://portal.gdc.cancer.gov/repository

    image.png
    image.png
    加入到cart
    仍然是下载三种数据
    image.png
    下载好的数据如图所示
    image.png

    miRNA数据合并

    • 输入文件准备:
      • cart文件(gdc_download_20191219_135157.526001.tar.gz)
      • meta文件(metadata.cart.2019-12-18.json)
        • 将cart文件进行解压
          • image.png
          • 将脚本(miRNA_merge.pl)和meta文件(metadata.cart.2019-12-18.json)拷贝进解压后的文件夹,运行脚本(注意文件名不要有中文!!!!!)

    miRNAidTrans-miRNA数据id转换

    • 输入文件准备:得到的miRNAbase.txt
    • 进入miRNAbase数据库,进入download界面(http://www.mirbase.org/ftp.shtml
      image.png
      下载成熟体文件
      image.png
      将下载好的文件进行解压
      image.png
      将脚本拷贝到同个文件夹
      运行脚本:perl matureTrans.pl
      可得到结果:
      image.png

    mRNAdiff-转录组差异分析

    • 准备好输入文件:symbol.txt;
    • 记住正常样本和肿瘤样本的数目:normalTumor.txt


      image.png

      然后运行R脚本miRNAcox11.edgeR.R

    miRNAdiff-miRNA差异分析

    • 准备好输入文件:miRNAmatrix.txt
    • 记住miRNA中的正常赝本和肿瘤样本的是数据:normalTumorMi.txt
      运行R脚本:miRNAcox12.edgeR.R
      image.png

    miRNA数据和生存时间合并

    将clinical.txt数据删除掉生存时间不明及生存时间小于三十天数据,然后将id futime fustat三列数据拷贝到time.txt文件中,如图所示:


    image.png

    可用R语言处理,拙劣的代码如下:

    rm(list = ls())
    rt_data=read.table("diffMirnaExp.txt",sep="\t",header=T,check.names=F)  
    rt_time=read.table("time.txt",sep="\t",header=T,check.names=F) 
    t_rt_data=t(rt_data)
    colnames(t_rt_data) <- t_rt_data[1,]
    t_rt_data <- t_rt_data[-1,]
    data <- t_rt_data 
    group=sapply(strsplit(rownames(data),"\\-"),"[",4)
    table(group=sapply(strsplit(group,""),"[",1))
    data <- data[-(1:45),]
    dim(data)
    rownames(data)=gsub("(.*?)\\-(.*?)\\-(.*?)\\-(.*?)\\-.*","\\1\\-\\2\\-\\3",rownames(data))
    data <- cbind(rownames(data),data)
    colnames(data)[1] <- "Id"
    mergedata <- merge(rt_time, data, by = "Id")
    write.table(mergedata,file="expTime.txt",sep="\t",row.names=F,quote=F)
    
    

    预后模型构建

    输入文件准备:前面得到的expTime.txt文件
    运行miRNAcox14.COX.R脚本,根据自己的得到的结果进行小修改

    主要内容:

    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    ![image.png](https://img.haomeiwen.com/i12895379/e469e92ec88a78f4.png?imageMogr2/a

    相关文章

      网友评论

          本文标题:2020-10-05 miRNA预后模型文章套路视频(COX模型

          本文链接:https://www.haomeiwen.com/subject/xogauktx.html