美文网首页RNAseq数据分析转录组测序学习RNA-seq
【转录组01】转录组背景、环境设置(目录管理)

【转录组01】转录组背景、环境设置(目录管理)

作者: 呆呱呱 | 来源:发表于2020-12-08 00:34 被阅读0次
    image.png image.png

    文献学习 【要做笔记】
    1.A comprehensive evaluation of normalization methods for illuminating high-thoughput RNA sequencing data analysis

    1. Methods to study splicing from high-throughput RNA sequencing data
    2. survey of best practices for RNA-seq data analysis
    3. hppRNA-a snakelike-based handy parameter-free pipeline for RNA-seq
      analysis of numerous samples
    4. Gaining comprehensive biological insight into the transcriptome by
      performing a broad-spectrum RNA-seq analysis
      • RNA sequencing: the teenage years

    转录组的最佳实践

    1.实验设计 2.测序设计 3.质控
    核心部分主要是:定量,差异表达分析,解释

    更进一步就是联合 image.png

    应用

    • 差异表达基因
      Drug treated vs. untreated cell line
      Wild type versus knock out organism
    • 发现新的转录本
    • RNA编辑
    • 可变剪接
    • LncRNA鉴定
    • 基因融合
    • SNP Indel

    分析策略

    如何选择软件?如何选择参数【要找综述进行参考】! image.png

    公司的pipline

    image.png

    实验流程图 image.png

    1.为何要打断?【技术限制,只能测短的】
    2.为啥要反转录生成cDNA呢?【RNA不够稳定】


    image.png 文库:连接好接头的cDNA,叫做文库,英文为library image.png

    index:一段特定的序列,标记不同来源的样本
    6-8个碱基
    read2测序引物结合位点:在Index序列的旁边GAT

    文库质控

    image.png
    如何看图?【如果降解了就会被打断,5‘被打断了,5就变短了】 image.png

    ------------------------------------分割线-------------------------------------------------------------------------------------------

    SBS(Sequencing-By-Synthesis):

    通过单分子阵列实现在小型芯片(Flowcell)上进行桥式PCR
    反应。通过可逆阻断技术实现每次只合成一个碱基,再利用
    四种带有不同荧光标记的碱基,通过荧光激发/捕获,读取碱
    基信息基于可逆终止的、荧光标记dNTP,边合成边测序

    叠氮集团 image.png

    双端测序(容易理解错)

    DNA链,除了正向读一遍,还可以从DNA的负向读一遍
    将DNA测序的有效长度加长了一倍
    Forward strand:read1
    Reverse Strand:read2,3'端引物

    ————————————————————————————————————————————————————————————————————

    目录管理

     示例如下:tree -L 1
    ├── biosoft #软件安装目录
    ├── database #数据库存放目录,包括参考基因组,注释文件,公共数据库等
    ├── pipline #流程搭建目录
    ├── project #项目分析目录
    └── project_backup #数据备份目录
    
    # 进入到个人目录
    cd ~
    
    ## 1.建立数据库目录
    mkdir database
    # 在数据库下建立参考基因组数据库,注意命名习惯:数据库名字/物种名字/参考基因组版本信息
    mkdir -p database/genome/Ensembl/Homo_sapiens/GRCh38_release95
    
    ## 2.建立软件安装目录
    mkdir biosoft
    
    ## 3.建立项目分析目录
    mkdir project
    cd project
    # 注意项目命名习惯:物种-样本数-疾病-分析流程
    mkdir Human-16-Asthma-Trans
    circRNA
    sRNA
    lncRNA
    RRBS
    tumorExome
    
    ## 4.建立数据备份目录
    mkdir project_backup
    # 哪天备份就在那个日期文件夹,非常有利于项目溯源
    cd project_backup
    mkdir 20200904
    # 在project_backup下放一个所有备份数据路径的txt文件,方便快速查找项目
    touch project_backup_all_220200904_update.xls
    用vim 编辑,粘贴项目路径
    
    
    

    ——————————————————————————————————————————————————————————————————————————————————————————————————————————


    image.png

    安装前记得激活小环境

    # 每次运行前,激活创建的小环境rna
    conda activate rna
    
    cd software/
    conda install -c hcc aspera-cli
    

    判断安装成功
    输入asc,按tab键补全ascp,

    ascp -h #出来帮助文档
    
    image.png image.png

    相关文章

      网友评论

        本文标题:【转录组01】转录组背景、环境设置(目录管理)

        本文链接:https://www.haomeiwen.com/subject/lmyxgktx.html