美文网首页生物信息学学习生信点点滴滴文章套路
用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性

用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性

作者: 吴涛_631b | 来源:发表于2019-04-28 09:27 被阅读67次
    11111.PNG

    目的是重复上图。

    背景知识

    氟尿嘧啶:5-氟尿嘧啶在体内转化成氟脱氧尿嘧啶( FdUMP )是dUMP的类似物,与胸苷酸合酶发生不可逆的结合,抑制其活性。另外5-FU还可以转化成5-氟尿嘧啶核苷整合进RNA或者DNA,阻碍蛋白质的合成或者RNA发挥作用。


    fu.PNG

    MSI (microsatellite instability)是微卫星不稳定
    MMR(mismatch repair)是指基因错配修复功能
    人类错配修复基因(MMR基因)经转录翻译后可表达相应的错配修复蛋白,如果任一MMR蛋白表达缺失可造成细胞的错配修复功能缺陷,则对DNA复制过程中的碱基错配丧失修复功能而造成累积,导致微卫星不稳定(MSI)的发生,约15% 的结直肠癌是经由MSI途径引发的。MSI分为高度不稳定(MSI-H)、低度不稳定(MSI-L)和稳定(MS-S);MMR分为错配修复功能缺陷(dMMR)和错配修复功能完整(pMMR)。dMMR等同于微卫星高度不稳定(MSI-H), pMMR则等同于微卫星低度不稳定(MSI-L)或微卫星稳定(MSS)。

    step1 下载数据

    进入GDSC数据库(链接),进入下载界面,下载所需文件:

    step2 整理数据

    根据细胞系注释信息在EXCEL中筛选出CRC细胞系,并将其分开成MSS和MSI


    CRC.PNG

    根据细胞系与药物的数据筛选出5-FU处理的细胞系


    5fu.PNG
    根据细胞系基因表达数据整理出目标基因的表达数据
    gene.PNG

    每个数据都有带identifier便于后续数据间的合并

    step3 合并数据(R语言)

    setwd("D:\\GDSC")
    crc=read.table("CRC.txt",sep="\t",header=T,check.names=F)
    fu=read.table("celllines-5-fu.txt",sep="\t",header=T,check.names=F)
    total=merge(crc,fu,by='CELL_LINE_NAME')
    write.table( t, file="t.txt",sep="\t",quote=F,row.names=F)
    t=read.table("t.txt",sep="\t",header=T,check.names=F)
    MSS=read.table("MSS.txt",sep="\t",header=T,check.names=F)
    MSI=read.table("MSI.txt",sep="\t",header=T,check.names=F)
    exp=read.table("exp.txt",sep="\t",header=T,check.names=F)
    TET2=read.table("TET2.txt",sep="\t",header=T,check.names=F)
    MSITET2=merge(MSI,TET2,by='identifier')
    write.table( MSITET2, file="MSITET2.txt",sep="\t",quote=F,row.names=F)
    MSSTET2=merge(MSS,TET2,by='identifier')
    write.table( MSSTET2, file="MSSTET2.txt",sep="\t",quote=F,row.names=F)
    

    step4 作图(Graphpad)

    利用graphpad绘制基因与IC50的散点图,并做线性拟合,计算相关系数(pearson)


    KDM4CMSS.PNG
    KDM4CMSI.PNG

    参考文献:
    Ou J, Peng Y, Yang W, et al. ABHD5 blunts the sensitivity of colorectal cancer to fluorouracil via promoting autophagic uracil yield[J]. Nature communications, 2019, 10(1): 1078.

    相关文章

      网友评论

        本文标题:用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性

        本文链接:https://www.haomeiwen.com/subject/nournqtx.html