美文网首页
Awk的一般功能2---Read数的筛除

Awk的一般功能2---Read数的筛除

作者: 食品猪的生信鸡 | 来源:发表于2023-10-06 09:37 被阅读0次

Awk作为linux内置的文本数据处理工具,具有简单迅速的特点,在处理上万行数据时,其相对于EXCEL具有优势突出,因此我们在转录组数据分析的最后一步,将Read count数据上传到DEseq2计算差异表达基因前,需要将样本中Read count数据为0较多的基因筛除掉。

1、我们现在有这样的一个文件MEVN_MEVE.txt

MEVN_MEVE.txt

2、目前想把它变成这样的文件MEVN_MEVE_sift.txt

MEVN_MEVE_sift.txt

3、这两个文件的差别是:

MEVN_MEVE_sift.txt文件是把MEVN_MEVE.txt文件中的后六列中至少有3个列不为0的行提取出来

4、那如何用awk去实现这个功能呢?

上代码:

awk '$2+$3+$4+$5!=0 && $2+$3+$4+$6!=0 && $2+$3+$4+$7!=0 && $2+$3+$5+$6!=0 && $2+$3+$5+$7!=0 && $2+$3+$6+$7!=0 && $2+$4+$5+$6!=0 && $2+$4+$5+$7!=0 && $2+$4+$6+$7!=0 && $2+$5+$6+$7!=0 && $3+$4+$5+$6!=0 && $3+$4+$5+$7!=0 && $3+$4+$6+$7!=0 && $3+$5+$6+$7!=0 && $4+$5+$6+$7!=0 {print $0}' MEVN_MEVE.txt > MEVN_MEVE_sift.txt

这个代码的意思是:任意四个数相加都不为0的行保留下来。
我们可以体会一个思想的转换:
一行中共有6个数,保证其中至少3个数都不为0。
一行中共有6个数,任意四个数相加都不为0。

这其实才是编程的核心思想!!!

相关文章

  • awk

    Linux System Environment awk功能 awk格式 awk 参数 一、awk截取列 二、显示...

  • Linux工具之awk的一般功能

    awk对于我来说强大的功能在于:当处理超过5万行的EXCEL数据,Windows频繁卡死的情况下,在基于linux...

  • awk 命令使用方法

    1. awk 擅长功能 awk 擅长对列进行操作/进行数据信息的统计(数组) awk 基本使用(高级使用-shel...

  • AWK 基础

    1、通过man awk可知它的详情 awk 是一种编程语言,awk有很多内建的功能,比如数组、函数等..... 实...

  • Linux中的部分awk命令 2019-11-18

    awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU...

  • awk

    awk的简介和功能 awk: Linux 文本处理三剑客:grep、sed和awk。其中grep是一种文本过滤工具...

  • linux下文本分析的神器—awk命令

    awk命令简介: awk 是一个很强大的文本分析命令。awk的功能,简单来说就是把文件逐行的读入,以空格为默认分隔...

  • gawk--文本处理

    gawk是 GNU的awk,具有很强的文本处理功能awk对文本处理有很强的功能,对于文字档里的资料进行修改比对抽取...

  • 生物信息学中可能用到的几个awk操作命令

    awk作为强大的文本分析工具其功能十分强大。 其语法结构为 :awk “{pattern + action}” {...

  • shell练习

    1、awk详解 awk的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息 语法:awk '{pattern...

网友评论

      本文标题:Awk的一般功能2---Read数的筛除

      本文链接:https://www.haomeiwen.com/subject/vtmpbdtx.html