数据库下载

作者: kangroomoon | 来源:发表于2022-01-15 19:21 被阅读0次

OXFORD Journals 按照功能进行数据库分类

https://www.oxfordjournals.org
数据处理的本质:基于序列本身特征预测基因;无特征,而通过序列比对进行功能注释。

1、命令行下载

wget ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/technical/reference/human_g1k_v37.fasta.gz
- O 下载时重命名文件
- c 断点续传
- b 放到后台下载
- r 递归下载,用于下载整个目录
- i 从文件批量下载,将下载地址写入文件

2、flp下载 #较http 协议好

ncbi 的 ftp 地址为,ftp://ftp.ncbi.nlm.nih.gov/
embl 的 ftp 地址为:ftp://ftp.ensembl.org/pub/

mamba install -y lftp  #安装 
exit  #退出
lftp ftp://ftp.ncbi.nlm.nih.gov/
>>>ls  #列出列表,文件夹中有啥
>>>cd /blast/db
>>>megt swissprot.tar.gz  #下载文件
>>>mirror genomics/  #下载文件夹

也可以用xftp软件直接访问网址下载

3、aspera高速下载

安装aspera:不要使用conda下载,后面使用会出现问题

wget https://download.asperasoft.com/download/sw/connect/3.9.9/ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.tar.gz  #下载
tar -zxvf ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.tar.gz  #解压
sh ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.sh  #运行
ln -s ~/biosoft/ibm-aspera-connect-3.9.9.177872/bin/aspera ./  #链接
#利用 aspera 下载数据
ascp -i .aspera/connect/etc/asperaweb_id_dsa.openssh --overwrite=diff -QTr -l6000m anonftp@ftp.ncbi.nlm.nih.gov:blast/db/swissprot.tar.gz ./
只需改动blast后面的:
blast/db/FASTA/ ./
blast/db/FASTA/nr.gz ./
pub/COG/ ./
blast/db/FASTA/nt.gz ./

anonftp@ftp.ncbi.nlm.nih.gov #账号
asperaweb_id_dsa.openssh #权限license

批量下载

1、通过NCBI的Batch entrez (Accession number, GI, GeenID)
send to, file, 下载AC号
新建一个txt文件,在Batchentrez中下载。
2、测序数据的下载:SRA数据库(二代测序数据)

Bioproject是一个项目(逐渐变大):
SRR  run号
SRX  experiments号
SRS  sample号
ERP/SRP  studies号

直接用命令下载:
找到Data access,通过谷歌云AWS和亚马逊云GCP

wget+地址

3、sratoolkit工具(不能使用conda安装)
(prefetch——下载SRA、fastq-dump——SRA到fastq,fasterq-dump——速度更快)
批量获得run号:点击run selector,Go,显示所有run的详细信息。Metadata下载列表,显示全部信息。

设定存储目录:~/Database/sequences/
prefetch SRRxxxxxxx -O ./  #默认创建一个ncbi文件夹,这里修改成当前文件夹
如果数据上传后还没移走,会使用aspera高速下载,一段时间后回移到sos出,高速下载就不可用了。

相关文章

  • annovar 注释

    重新用annovar注释:先转换适合的文件格式: 再下载适合的数据库文件:下载指令如下: 下载的数据库: 数据库文...

  • Maestro使用

    蛋白准备 蛋白从pdb数据库下载 下载pdb格式文件 小分子从pubchem或者zinc数据库下载 小分子下载sd...

  • H2(Java嵌入式数据库)

    简介 1. 下载H2数据库 下载H2数据库 下载最新版本的H2数据库(选择Platform-Independent...

  • eggnog-mapper 数据库的下载

    数据库下载 直接使用命令下载数据库的话速度非常慢,我们可以使用迅雷或者其他工具下载。wget http://egg...

  • nodeJs连接数据库MongoDB

    连接启动数据库: 下载node_modules依赖包(必备): 下载第三方依赖包(连接数据库必备): 连接数据库代...

  • R 联合SQLite数据库和Spark分析大数据集

    SQLite 数据库使用 1.下载SQLite数据库,并配置环境变量,或者再下载个SQLiteStudio进行编辑...

  • 000MySQL的window安装

    MySQL 数据库的安装及配置 先下载MySQL数据库的安装包,下载地址: 链接:https://pan.baid...

  • 化繁为简的MySQL数据库

    MySQL数据库 数据库(MySQL.com下载) 查看系统所有数据库:show databases; 创建数据库...

  • TCGA突变数据下载与处理

    实验内容 1.在TCGA数据库下载疾病BRCA的突变数据熟悉TCGA数据库的结构与数据下载方法2.处理下载数据,将...

  • 【数据库之MYSQL】navicat windows下安装与使用

    【数据库之MYSQL】navicat windows下安装与使用 一、下载 官方下载地址根据系统需要进行下载下载 ...

网友评论

    本文标题:数据库下载

    本文链接:https://www.haomeiwen.com/subject/uxpucrtx.html