美文网首页
脚本 | Shell | 任意n个样本表达量超过0.5视为表达

脚本 | Shell | 任意n个样本表达量超过0.5视为表达

作者: shwzhao | 来源:发表于2021-05-10 23:03 被阅读0次

20210904 更新,今天上午完成了开题,最近没睡好觉,躺在床上,不知怎么想起了这段代码,发现真的非常之愚蠢。

只需下面简简单单的代码就能得到结果

awk '{a=0;for(i=2;i<=NF;i++){if($i>0.5)a++};if(a>=2)print}' a.tsv

以下为原文章:

文献上的一个简单的数据过滤问题。
很蠢地解决了。 :D

# 任意$1个样本的表达量超过0.5视为表达
$ cat aaaa.sh
awk '{for(i=2;i<=NF;i++){if($i > 0.5)print}}' $2 | \
uniq -c | awk -vb=$1 '{if($1>=b)print}' | \
sed -e 's/^[[:space:]]*//g' -e 's/[[:space:]]/\t/g' | \
cut -f 2-
$ cat a.tsv
a       0.8     0.6     0.5     0       0.7
b       1       0       0.3     0       0.8
c       0.5     0       0       0.4     0.9
d       0       0.5     0       0.5     1
e       1       0       0.4     0       0.8
f       0.6     0       0       0.7     0
g       0.7     0       0.8     0       2
$ bash aaaa.sh 2 a.tsv
a       0.8     0.6     0.5     0       0.7
b       1       0       0.3     0       0.8
e       1       0       0.4     0       0.8
f       0.6     0       0       0.7     0
g       0.7     0       0.8     0       2
$ bash aaaa.sh 3 a.tsv
a       0.8     0.6     0.5     0       0.7
g       0.7     0       0.8     0       2

相关文章

  • 脚本 | Shell | 任意n个样本表达量超过0.5视为表达

    20210904 更新,今天上午完成了开题,最近没睡好觉,躺在床上,不知怎么想起了这段代码,发现真的非常之愚蠢。 ...

  • R语言中级作业

    主要内容 探针ID转换 表达矩阵处理 任意基因任意癌症表达量和临床形状的关联 任意基因任意癌症表达量分组的生存分析...

  • 目录

    shell 一、 初识shell二、 shell变量三、 正则表达式四、 认识脚本和shell判断表达式五、she...

  • 如何对时间节点样本进行趋势分析?

    适用场景 当样本为时间节点样本时(如上图,分别为0h,0.5h,3h,6h,12h五个时间节点样本的基因表达量),...

  • 六、JSP 语法

    JSP 语法 脚本程序 脚本程序可以包含任意量的Java语句、变量、方法或表达式,只要它们在脚本语言中是有效的。 ...

  • #TCGA系列#TCGA基因/miRNA表达谱数据整合(二)

    上期(#TCGA系列#TCGA基因/miRNA表达谱数据整合​)使用shell 对多样本表达谱文件整合,实现方式是...

  • 生信入门-GEO学习

    用探针的表达量来反映基因的表达量。 知识点 1、GEO Datasets包括: 样本:以GSM开头 平台(手段):...

  • Shell 传递参数

    Shell 传递参数 我们可以在执行 Shell 脚本时,向脚本传递参数,脚本内获取参数的格式为:$n。n代表一个...

  • 学习Shell - 传递参数

    Shell传递参数 我们可以在执行 Shell 脚本时,向脚本传递参数,脚本内获取参数的格式为:$n。n 代表一个...

  • shell传递参数

    Shell 传递参数 我们可以在执行 Shell 脚本时,向脚本传递参数,脚本内获取参数的格式为:$n。n代表一个...

网友评论

      本文标题:脚本 | Shell | 任意n个样本表达量超过0.5视为表达

      本文链接:https://www.haomeiwen.com/subject/rgewdltx.html