开始部分看这里
作业要求
本系列课程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件作业,看文章里的methods部分,把它用到的软件和参数摘抄下来,然后理解GEO/SRA数据库的数据存放形式,把规律和笔记发在论坛上面!
来源于生信技能树:http://www.biotrainee.com/forum.php?mod=viewthread&tid=1750#lastpost
实验过程
1.文献下载
一般我都会去Google镜像搜索:https://xueshu.glgoo.net/.此外还会在SCI-HUB下载,不过前段时间被起诉了,还罚款,不知道这个牛逼的网站能够撑到什么时候。在实验方法的部分GSE81916存放了测序数据。
2.数据下载
进入NCBI的GEO数据库https://www.ncbi.nlm.nih.gov/geo/,搜索GSE81916。
看到页面中的overall design:
所以我们只需要下载样本9-15数据。
数据储存的链接:
通过ftp的方式下载数据,其中还介绍了测序平台。
点击进入ftp,看到储存的所有测序文件:
下面进入自己的记录
发现网上部分代码是错的,而且用的是wget方法。我想用prefetch。
代码如下:
$ souce activate env1
$ for((i=56; i<=62; i++)); do prefetch SRR35899$i; done
prefecth
这一部分很花时间,
我们要把下好的数据进行压缩,这样可以减少占用的空间。
命令如下:
ls *sra |while read id; do fastq-dump --gzip --split-3 $id;done
但是我是断断续续进行的,根据我之前完成的结果我对参数进行了修改:
ls *95*sra | while read id; do fastq-dump --gzip --split-3 $id;done
网友评论