统计序列的基础信息

作者: 小黑采蘑菇 | 来源:发表于2024-01-17 13:55 被阅读0次

在把序列合并起来以后,如果要用于建树的话,一般在此之前建议看一下序列的常规指数,比如序列的长度、序列的配对相似度、序列的有效信息位点、还有序列的相对成分变异性,看看这些序列都是否适合用于系统发育树的构建。下面是计算这些之恶表的代码,我个人还是挺常用的,但是这个没有使用多线程速度会稍慢,以后更改出多线程版本应该就会快很多了。

# 计算序列长度、配对相似度、有效信息位点占比、相对组成变异
# 在seq_stats.txt文件的第一行写入表头
echo -e "File\tAlignment Length\tPairwise Identity\tParsimony Informative Sites\tRelative Composition Variability" > seq_stats.txt

# 循环遍历所有以.gb结尾的文件
for i in *.gb;do
    # 在每一行的开头写入文件名
    printf "%s\t" ${i} >> seq_stats.txt
    # 计算alignment length,并写入第二列
    phykit alignment_length ${i} | awk '{print $NF}' | xargs printf "%s\t" >> seq_stats.txt
    # 计算pairwise identity,并提取mean的值,写入第三列
    phykit pairwise_identity ${i} | awk '/mean/ {print $NF}' | xargs printf "%s\t" >> seq_stats.txt
    # 计算parsimony informative sites,并提取第三个值,写入第四列
    phykit parsimony_informative_sites ${i} | awk '{print $NF}' | xargs printf "%s\t" >> seq_stats.txt
    # 计算relative composition variability,并写入第五列
    phykit relative_composition_variability ${i} | awk '{print $NF}' | xargs printf "%s\n" >> seq_stats.txt
done

相关文章

  • 全长转录组分析

    sample1 sample1基本测序信息统计 画频数分布直方图 获取一致性序列CCS 统计CCS信息 画频数分布...

  • AI技术体系和领域浅总结

    数学基础 微积分 《高等数学》 线性代数 《线性代数》 概率统计 《概率论与数理统计》 信息论 《信息论基础》( ...

  • Python脚本:fasta文件单序列信息提取

    使用Python对fasta格式的序列进行基本信息统计预期设计输出文件中包括fasta文件名,序列长度,GC含量以...

  • 数据挖掘之---AprioriAll算法

    AprioriAll算法总结使用场景:AprioriAll算法是在Apriori算法基础上加入了时间序列的统计方法...

  • 关于javaScript中序列化注意时项

    JavaScript中序列化的注意事项 报错信息 基础的回顾 JavaScript对象序列化Json格式的字符串 ...

  • 序列比对中的基本概念

    序列比对作为生物信息学基础中的基础,可以说是一切后续生信分析的基础,没有比对后续分析便无法进行。那么给定两条序列,...

  • Python脚本:fasta文件多序列信息统计

    设计需求 统计fasta文件中多条序列信息,设计目标效果: 将结果输入到csv格式的表格中,因为csv格式表格用,...

  • biostar handbook(六)| 序列联配

    序列联配 序列联配是生物信息学最基础的概念,因为大多数数据分析分析策略都需要使用联配得到的信息。 举个简单的例子,...

  • 使用wmic命令获得计算机硬件信息

    wmic的使用方法: wmic 硬件信息名称 get 属性名称,属性名称2 代码示例: 基础信息 计算机的序列号:...

  • 2019-05-04

    fasta和fastq格式文件的shell小练习 1 统计reads_1.fq 文件中共有多少条序列信息 2 输出...

网友评论

    本文标题:统计序列的基础信息

    本文链接:https://www.haomeiwen.com/subject/ifwlodtx.html