去SNP

作者: byejya | 来源:发表于2021-06-25 16:26 被阅读0次

GRCH37 是NCBI的编号 而hg19是ucsc的编号

更新到v7已经新增时间计算,并检查了输出结果,之后的v8不再输出SNP的信息

1

下一次更新的v9针对读取SNP过于耗时的问题,

新增支持输入多个文件名,或者文件名列表。

新增:对每个文件比对结果的计时和对总时长的计时

新增--nonamecheck功能,其实就是对长,按_或者-截取,对短的增补chr

1

输入参数设计:

-i 输入文件

-o 输出文件名,不写则使用输入文件名+后缀的形式

--input_file_list 输入文件名列表

--output_file_list 输出文件名列表,不写则使用输入文件名+后缀的形式

--snp clear_snp文件

usage: -i/--input_file_list   [-o/--output_file_list] --snp

设计思路:先实现功能,再快速迭代

回到测试部分:

时间表现为3小时读完,感觉不太对。

1 1

白色部分为normal

更新计划:

1.独立出建索引步骤,独立出clear-snp步骤,计划是想 hisat2 index这种方式传参,但是不知怎么实现,先分步进行。

模拟建索引思路的方式是:将snp字典写入json文件。

已实现:

1

2.添加nucleotide检查步骤,直接一步输出去snp后的

这个写为了snp_filter,可测

1

测试结束无误

提取的intron exon地址:

/mnt/T30/wus/brantch_point_human/Mercer_data/SRR1049830_1.5/classify

相关文章

  • 去SNP

    GRCH37 是NCBI的编号 而hg19是ucsc的编号 更新到v7已经新增时间计算,并检查了输出结果,之后的v...

  • 2021-03-31 为VCF文件建立索引(.idx)

    问题背景: 做GWAS分析,对方只提供了具有SNP和indel的vcf文件,需要提取SNP时,提取时去发现,需要对...

  • 种群基因组学笔记

    一、SNP分析内容(包括但不局限):①call SNP的软件——freebayes;②计算全部SNP数量;③平均多...

  • 低成本全基因组SNP分型策略

    1. SNP芯片 目前最常用的全基因组SNP分型方法,主流的SNP芯片: Illumina Infinium技术。...

  • SNP芯片的原理

    SNP芯片的原理 Illumina的SNP芯片原理Illumina的SNP生物芯片的优势在于:第1,它的检测通量很...

  • GWAS需要了解的概念

    snp

  • 「博客翻译」SNP过滤教程(二)

    原文地址: SNP Filtering Tutorial 接「博客翻译」SNP过滤教程(一) FreeBayes输...

  • snp面膜

    *去韩国必买的snp面膜来啦!一片不到9块钱! *4款面膜4种功能,总有一种适合你~ *snp紧致发酵面膜,帮你留...

  • bed文件格式

    有snp的坐标,提取snp位点前后100bp的参考基因组 对snp位点bed文件 start 减10 ,end 加...

  • plink - 关于提取某一个特定的SNP

    一、 查看某一个snp的基因型频率 如果要计算全部snp频率则去掉“--snp rs10402893”命令就好 二...

网友评论

      本文标题:去SNP

      本文链接:https://www.haomeiwen.com/subject/amksdltx.html