美文网首页
生物信息数据库:GEO

生物信息数据库:GEO

作者: 挽山 | 来源:发表于2020-02-23 23:27 被阅读0次

    基础知识:

    芯片数据处理(R语言):

    • GEO数据如何方便地下载?
    • 数据什么时候需要标准化?
    • 什么时候做log转换?
    • 芯片探针如何转换?
    • 差异基因如何获得?
    • 配对样本的对比矩阵如何构建?
    • 配对样本如何作图展示?
    • 热图火山图究竟在什么?
    • GO分析,KEGG分析怎么做,如何解释?

    主要参考部分:

    • 1.GEOquery(R包)数据下载
    • 6.探针转换与基因去重
    • 7.差异分析(limma)
    # 如果没有配对信息,差异分析做:
    design=model.matrix(~ group_list)
    fit=lmFit(exprSet,design)
    fit=eBayes(fit)
    allDiff=topTable(fit,adjust='fdr',coef="group_listafter",number=Inf,p.value=0.05)
    
    # 有配对信息的,差异分析应该这样做:
    pairinfo = factor(rep(1:18,2))
    design=model.matrix(~ pairinfo+group_list)
    fit=lmFit(exprSet,design)fit=eBayes(fit)
    allDiff_pair=topTable(fit,adjust='BH',coef="group_listafter",number=Inf,p.value=0.05)
    
    参考:

    RNA-seq数据处理:

    • 安装软件、新建conda python环境(包含部分Linux系统基础知识)
    • 下载数据(sra文件)
    • 数据过滤(去接头等)
    • Fastqc质控
    • Hisat2进行比对
    • 计数
    • R语言表达谱分析
    参考:

    相关文章

      网友评论

          本文标题:生物信息数据库:GEO

          本文链接:https://www.haomeiwen.com/subject/zihjqhtx.html