ICGC数据下载软件安装

作者: 王诗翔 | 来源:发表于2018-11-20 16:06 被阅读44次

这应该是全网第一篇记录ICGC数据下载软件安装的笔记。

  • 由于icgc连接了世界多个数据库(云端)资源,所以架构比GDC复杂很多,conda也没有channel提供编译好的icgc-get
  • icgc-get提供了ICGC数据库的搜索与下载功能,但它本身下载功能的实现需要特定的软件,也就是icgc-get包是ICGC与多个软件的连接器
  • 因为hpc无root权限,尝试安装ICGC直接提供的压缩包安装软件失败,也不能用docker,所以只能一步一步把这些软件拼起来。我也是在逐步的摸索中了解ICGC数据库的布局以及数据下载的大致轮廓。
  • ICGC本身的官方文档看似不错,实则很混乱,通过对比和研究可以真正理解如何下载、安装以及配置。几个重要doc
  • 安装icgc-get
    • github链接: https://github.com/icgc/icgc-get
    • 克隆仓库,然后运行pip install -r ./requirements.txt
    • 再运行pyinstaller --clean icgc-get-data.spec得到可执行文件(位于dist目录下)
  • ICGC的数据存储在不同的repository中,不同的仓库有不同的下载工具,所以当在ICGC上搜索到想要下载的数据后,确定其仓库,安装好对应的客户端。
    • Collaboratory和AWS使用客户端 score-client
      • wget -O score-client.tar.gz https://artifacts.oicr.on.ca/artifactory/dcc-release/bio/overture/score-client/[RELEASE]/score-client-[RELEASE]-dist.tar.gz
      • tar -xvzf score-client.tar.gz 软件位于bin下
      • 实际要使用还要安装依赖
        • The Score Client requires Java 8 to be installed. It has been tested using the Oracle distribution. The procedure for installing Java 8 will vary depending on the operating system and package manager used. 这里不能使用open JDK
        • In order to use the mount feature, FUSE is required. On most Linux based systems this will require installing libfuse-dev and fuse packages. 这个应该是可选项,不过最好安装了。使用conda install -c jessetg/label/sbu-hpc libfuse安装
    • GDC使用客户端gdc-client,这个没什么好说的,文档很多,也很简单。
    • EGA 看https://ega-archive.org/download/using-ega-download-client#DownloadClient, 我暂时也用不到
    • PDC这个仓库很重要,It is a secure data cloud that stores US PCAWG data. 它存了PCAWG很多样本的WGS数据,里面就有TCGA的!使用的客户端是Amazon Web Services Command Line Interface,需要follow https://docs.aws.amazon.com/cli/latest/userguide/installing.html进行安装,其实也使用pip,一句话pip install awscli --upgrade --user 安装完后要把执行文件添加到路径中去 export PATH=~/.local/bin:$PATH 。
  • 除了安装,另外一个重要点就是获取下载权限了。

看到一个相关报道,分享一下 AWS全新公共数据集助力癌症研究

相关文章

  • ICGC数据下载软件安装

    这应该是全网第一篇记录ICGC数据下载软件安装的笔记。 由于icgc连接了世界多个数据库(云端)资源,所以架构比G...

  • art-illumina模拟测序

    1.安装软件及下载基因组数据 1.1 下载art-illumina测序软件 链接 1.2 下载基因组数据 从gen...

  • 6-2数据可视化工具之tableau

    教程: 软件自带的help; 配套看数据的软件: Navicat Premium; 关于下载和安装: ...

  • ubuntu18.04 安装mongoDB

    安装MongoDB 下载mongodb软件包从mongoDB下载软件包 解压 建立数据目录 建立日志目录 添加环境...

  • mac 下安装openfire的步骤

    下载openfire和 JDK两个软件并安装(不安装JDK,openfire启动会出问题)。 下载MySQL数据库...

  • Pfam安装与使用

    一:下载安装 Pfam软件下载地址下载对应数据地址下载三个:Pfam-A.hmm.dat.gzPfam-A.hmm...

  • osclass的lamp安装

    一、软件简介二、安装环境 三、安装软件包并配置数据库,下载php、apache、mariadb的包,执行以下命令。...

  • 安装ES

    1.1 安装ES 1.1.1 安装前 机器列表 软件下载 软件下载 下载 elasticsearch-5.1.1....

  • 将ICGC的基因表达数据处理成表达矩阵(perl)

    小程序的目的 最近在搞ICGC的数据库,想作为TCGA数据挖掘的验证集,然后发现ICGC下下来的数据不能够直接用于...

  • 学习小组Day3笔记--郝志刚

    LInux安装软件 conda相当于软件管家可以下载多款软件。安装思路:wget 下载软件bash 安装sourc...

网友评论

    本文标题:ICGC数据下载软件安装

    本文链接:https://www.haomeiwen.com/subject/ahjxqqtx.html