美文网首页
转录组入门(二) 读文章下数据

转录组入门(二) 读文章下数据

作者: Stone_Stan4d | 来源:发表于2017-12-30 15:29 被阅读43次

    开始部分看这里

    作业要求

    本系列课程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件作业,看文章里的methods部分,把它用到的软件和参数摘抄下来,然后理解GEO/SRA数据库的数据存放形式,把规律和笔记发在论坛上面!

    来源于生信技能树:http://www.biotrainee.com/forum.php?mod=viewthread&tid=1750#lastpost

    实验过程

    1.文献下载

    一般我都会去Google镜像搜索:https://xueshu.glgoo.net/.此外还会在SCI-HUB下载,不过前段时间被起诉了,还罚款,不知道这个牛逼的网站能够撑到什么时候。在实验方法的部分GSE81916存放了测序数据。

    2.数据下载

    进入NCBI的GEO数据库https://www.ncbi.nlm.nih.gov/geo/,搜索GSE81916。

    看到页面中的overall design:

    所以我们只需要下载样本9-15数据。

    数据储存的链接:

    通过ftp的方式下载数据,其中还介绍了测序平台。

    点击进入ftp,看到储存的所有测序文件:


    下面进入自己的记录

    发现网上部分代码是错的,而且用的是wget方法。我想用prefetch。
    代码如下:

    $ souce activate env1
    $ for((i=56; i<=62; i++)); do prefetch SRR35899$i; done
    
    prefecth

    这一部分很花时间,
    我们要把下好的数据进行压缩,这样可以减少占用的空间。
    命令如下:

    ls *sra |while read id; do fastq-dump --gzip --split-3 $id;done
    

    但是我是断断续续进行的,根据我之前完成的结果我对参数进行了修改:

    ls *95*sra | while read id; do fastq-dump --gzip --split-3 $id;done
    

    相关文章

      网友评论

          本文标题:转录组入门(二) 读文章下数据

          本文链接:https://www.haomeiwen.com/subject/yfwwgxtx.html