美文网首页
转录组分析——二、数据完整性检验

转录组分析——二、数据完整性检验

作者: A西方不亮东方亮 | 来源:发表于2021-03-26 21:22 被阅读0次

    一、md5值检验

    md5值检验需要用到的东西
    1、一个txt文件(第一列为md5值,第二列为sra文件名,两列中间有两个空格,固定格式)
    2、下载好的sra文件
    3、txt文件和sra文件放在同一目录下

    #以4、5、6三行为例
    cat 'file.tsv' | awk 'NR>3&&NR<7 {print$11"  "$4}'>md5.txt
    # 检验md5值完整性,md5sum函数加-c参数
    md5sum -c md5.txt 
    # md5检验过程较慢,可以挂后台,结果重定向到check
    md5sum -c md5.txt>check &
    

    二、如何生成md5值

    命令还是md5sum,没有参数就是生成,生成的文本符合md5值检验格式(两列,第一列为md5值,第二列为sra文件名)
    不加其他命令,直接打印在屏幕上,可以重定向至一个新的文件

    # 生成单个文件的md5值
    md5sum SRR1039510 
    # 生成多个SRR开头文件的md5值,并输出到文件md5.txt,并挂载在后台
    md5sum SRR*>md5.txt &
    

    md5值如果写路径名,生成的md5结果第二列也有路径名,所以不建议写路径名,在工作目录下处理!!!!!

    相关文章

      网友评论

          本文标题:转录组分析——二、数据完整性检验

          本文链接:https://www.haomeiwen.com/subject/iurkhltx.html