美文网首页
利用Linux下载阿里云以及诺禾云(诺禾致源)提供的测序数据

利用Linux下载阿里云以及诺禾云(诺禾致源)提供的测序数据

作者: Aji | 来源:发表于2023-02-22 11:34 被阅读0次

    早上在处理数据的时候,发现花的时间比预期多出一半,原本计划45分钟完成,花了一个半小时,当然啦,也有摸鱼的水分在啦,哈哈哈哈,然后我想着还是整理出来一下数据下载流程,这样方便自己后续使用的时候一下子就检索到!早上原本还计划了其他事情,然后呜呜呜现在都11点半啦!!改图改图整理图!!快乐的生活呀,最近没有其他课题烦扰,专心做一件事情的感觉真棒呀!夸夸自己,我咋如此棒棒的呀,看到此篇博文的你也是如此棒棒的呀,哈哈哈!!快乐就好

    1. 阿里云平台数据下载

    (1) 软件下载

    我用的是ossutil工具下载,可以在官网上找到

    ossutil.png
    我下载l的是inux x86 64bit
    然后安装
    sudo -v ; curl https://gosspublic.alicdn.com/ossutil/install.sh | sudo bash
    

    (2) 配置

    在交付数据的时候一般会提供以下信息
    阿里云交付 :下载win64版本ossbrowser软件下载测序数据,链接如下:
    https://gosspublic.alicdn.com/oss-browser/1.16.0/oss-browser-win32-x64.zip?spm=a2c4g.11186623.0.0.65df71c5W6HIRD&file=oss-browser-win32-x64.zip
    AccessKeyId:LTAI5t6ttv7X
    AccessKeySecret: WJqbHcgl8gS2yH
    路径:oss://10kgenomics/data-1094/
    区域:华东2(上海)## (2) 基本命令
    然后你需要配置文件/home/username/.ossutilconfig(这个的话你安装的时候没有改变路径的话就是这个目录下面),才可以登录并查看数据

    # 修改/home/username/.ossutilconfig
    vi /home/username/.ossutilconfig 
    

    在这个文件/home/username/.ossutilconfig中填写这个内容
    [Credentials]
    language=EN
    endpoint=oss-cn-shanghai.aliyuncs.com
    accessKeyID=LTAI5t6ttv7X
    accessKeySecret=WJqbHcgl8gS2yH

    (3) 常用命令见官网

    https://www.alibabacloud.com/help/zh/object-storage-service/latest/common-commands

    (4) 具体使用

    # 1.获取数据列表
    cd ~/Software/ossbrowser
    ./ossutil64 ls oss://10kgenomics/data-1094/
    ./ossutil64 ls oss://10kgenomics/data-1094/ --include *.fq.gz | awk -F ' ' '{print $8}' > pancreas_xenopus_ssutil_datapath.txt
    
    # 2.下载数据
    cd ~/Software/ossbrowser
    datapath=/home/username/projects/Pancreas/Data
    cat pancreas_xenopus_ssutil_datapath.txt | while read line; do echo "nohup ./ossutil64 cp ${line} ${datapath} --update &"; done >> 20221218_xenopus_data_download_command_new.sh
    sh 20221218_xenopus_data_download_command_new.sh
    
    # 3.下载md5文件并检查文件完整性
    nohup ./ossutil64 cp oss://10kgenomics/data-1094/md5.txt /home/username/projects/Pancreas/Data --update & 
    md5sum V350094917_L04_read_1.fq.gz
    # 5e6239554b6c290de15699172cb4bf1c  V350094917_L04_read_1.fq.gz
    md5sum V350094917_L04_read_2.fq.gz
    # d97401e0b8e028f1f827676ec07b6928  V350094917_L04_read_2.fq.gz
    
    

    2. 诺禾云平台数据下载

    参考诺禾致源linux下数据下载

    (1) 软件下载

    需要先使用账户密码到诺禾致源交付平台上下载


    image.png
    下载linux版本,解压之后就可以使用

    (2) 基本命令

     # 1. 登录
    ./lnd login -u 用户名 -p 密码
    # 2. 列举用户根目录
     ./lnd list
    #  3. 目录名称 :列举目录下的所有文件
    ./lnd list oss:// 
    # 4. 下载文件 到 本地, 
    ./lnd cp oss:// 目录/文件 本地目录
    # 5. 下载整个文件夹到本地目录,相比于下载一个文件多了-d参数
    ./lnd cp -d oss:// 一个目录 本地目录 
    

    (3) 具体使用

    为了方便,批量下载数据,这边的话是一个一个文件下载的,也可以把nohup ./lnd cp 改成nohup ./lnd cp -d 就是批量下载文件夹了。

    ## 批量下载数据代码
    # sn_feizhou_xenopus_pan_datalist.txt这个需要自己构建
    lnd_command="nohup ./lnd cp "
    oss_path=" oss://CP2019092000014/H101SC23011182/RSSQ00504/X101SC23011182-Z01/X101SC23011182-Z01-J011/"
    datapath="/home/zhengjh/projects/Pancreas/Data/snRNAseqData &"
    cat sn_feizhou_xenopus_pan_datalist.txt  | while read line; do echo "${lnd_command}${oss_path}${line}" "${datapath}" ; done >> Download_sn_feizhou_xenopous_command.sh
    chmod +x Download_sn_feizhou_xenopous_command.sh
    cat Download_sn_feizhou_xenopous_command.sh
    sh Download_sn_feizhou_xenopous_command.sh > sn_feizhou_xenopous.out 
    

    相关文章

      网友评论

          本文标题:利用Linux下载阿里云以及诺禾云(诺禾致源)提供的测序数据

          本文链接:https://www.haomeiwen.com/subject/emkakdtx.html