美文网首页
UKBB数据集下载流程(第二节)

UKBB数据集下载流程(第二节)

作者: MaiyuAmmy | 来源:发表于2021-03-19 20:48 被阅读0次

很久没有更新,被老板抓走做别的去了。

主要数据集下载

阅读使用手册上,会有一些field,bulk, individuals这样的词,比较难以对应网站上的标签。下面我来讲解一下网站标签的对应。进去点击“Catalogues”(https://biobank.ndph.ox.ac.uk/showcase/catalogs.cgi?tk=Sg3qJFY27r3WRu6KR4GdRTqN6W3KEW5T130717)会有上述的类别。Fields指个体数据,Categories指对应表型特征,Returns表述研究反馈结果,Resources是数据采集时一些资料,Schema是biobank数据内部结构。

例如,找到blood biochemistry 中的数据对应项:https://biobank.ndph.ox.ac.uk/showcase/label.cgi?tk=Sg3qJFY27r3WRu6KR4GdRTqN6W3KEW5T130717&id=17518,接着推荐UKBB关联的几个软件,用来读入UKBB数据,进行下载和格式转换。

1.根据手册首先需要获取以下文件

UKB data download

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukbmd5

chmod 755 ukbmd5

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukbconv

chmod 755 ukbconv

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukbunpack

chmod 755 ukbunpack

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukbfetch

chomd 755 ukbfetch

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukblink

chmod 755 ukblink

wget  -nd  biobank.ndph.ox.ac.uk/showcase/util/ukbgene

chmod 755 ukbgene

2.基因型数据获取

#!/bin/sh

#SBATCH --account=nn9769k  --job-name=imp

#SBATCH --partition=bigmem

#SBATCH --time=7-0:0:0

#SBATCH --ntasks=2 --cpus-per-task=4

#SBATCH --mem-per-cpu=32G

if [[ $1 != "cal" && $1 != "con" && $1 != "int" && $1 != "baf"

        && $1 != "l2r" && $1 != "imp" && $1 != "hap" ]]

then

  echo "First param must be one of cal,con,int,baf,l2r,imp,hap"

  exit

fi

#

# Loop through chromosomes

#

for CHR in {1..26}

do

  ukbgene $1 -c$CHR -a.ukbkey

done

3.获取R文件

+++++++++++++++++++++Converting to a R file(tab)++++++++++++++++++++++

../ukbunpack ukbXXXXX.enc ../kxxxxx.key

home/UKBiobank/ukbconv ukbxxxxx.enc_ukb txt

4.表型文件获取

这里推荐ukbhelper

python3 ./ukb_helper.py pheno --input "../ukbxxxx.csv" --fields 31 21003 34 52 54 53 21000 189 --out home/UKBiobank/phenotype_data/primary_demographics/primary_demographics

5.其实在UKBB赋予权限后,掌握上述基因型表型获取方式,基本就可以完全拿到UKBB原始数据

我目前手边工作忙完,可能会接入UKBB原始数据质控等项目,我会继续更新。

相关文章

  • UKBB数据集下载流程(第二节)

    很久没有更新,被老板抓走做别的去了。 主要数据集下载 阅读使用手册上,会有一些field,bulk, indivi...

  • UKBB数据下载流程(第一节)

    从今天开始,我又要经常回到简书记录一些数据下载,处理流程了。目前需要UKBB的GWAS, 用的人很多,都是大文章,...

  • wide&deep试验

    背景 :通过人口调查数据来判断收入情况, 分类问题 主要流程: 1. 下载数据 2. 定义训练集input_fn ...

  • 基于Keras实现Kaggle2013--Dogs vs. Ca

    【下载数据集】 下载链接--百度网盘关于猫的部分数据集示例 【整理数据集】 将训练数据集分割成训练集、验证集、测试...

  • 2020-09-14

    《数据分析完整流程》 《用tableau制作你的第一张dashboard》 《推荐几个免费数据集下载练习网站》在我...

  • 多层神经网络用于猫分类

    工具包 工具包下载 数据集 数据集下载 数据集基本信息 输出: 数据集预处理 输出: 两层神经网络 测试: 输出:...

  • 深度学习中猫🐱和狗🐶的分类 1

    以猫狗分类,讲述深度学习的分类算法。 第1部分,数据集,包括: 下载数据集:使用Kaggle API下载数据集; ...

  • Task1 数据集探索

    IMDB数据集下载和探索 根据TensorFlow官方教程实现: THUCNews数据集下载和探索 根据githu...

  • 机器学习实战教程(五):Logistic回归基础篇之梯度上升算法

    三、Python3实战 1、数据准备 数据集已经为大家准备好,下载地址:数据集下载[https://github....

  • 数据集下载

    Microsoft COCO 数据集 介绍:http://www.cnblogs.com/geekvc/p/665...

网友评论

      本文标题:UKBB数据集下载流程(第二节)

      本文链接:https://www.haomeiwen.com/subject/jrrdbktx.html