在服务器共享群里有个朋友贴了下面这张图并艾特了我问: 萌老师, 为啥awk在使用单双引号时结果会不一样呢?
在这张图里, 当awk的最外层使用双引号时, 命令没有任何的返回结果, 但当把双引号替换成单引号的时候, 就能正常返回结果了. 这是怎么回事呢?

之前我在给生信技能树的生信入门12期学员讲课时没有给大家展开仔细讲这个单双引号的区别, 只在最后一节课讲自定义变量的时候提了一下:
当我定义一个$a为gene时, 用单引号和双引号扩起来分别echo出来, 会发现单引号里$a就是本体, 而双引号里的$a则会被解释(扩展)为对应的变量内容.

当时给出的解释是:
单引号:变量不会被解释
双引号:变量被解释
在awk的部分没有具体讲是因为这事儿太细致了, 只要当作这是一种“固定用法”, 养成习惯最外层用单引号而内层用双引号就完事儿了, 就能避免绝大多数情况下的错误.
那既然现在有人提问了, 那就再解释一下.
在中文世界里找了一圈, 不太有合适的解释帖子. 于是就到英文世界里去搜了一圈, 找到下面两个链接:
- Why does using double quotes to enclose awk's action statements produce different results than when using single quotes to enclose them?
- Shell Quoting Issues
第一个是个问询贴, 第二个是GNU官方的gawk的官方手册.
要说区别的话就是shell和awk对单双引号的处理是不一样的.
在第一个链接的问询贴里有这么一句:
If you use double quotes the $2 gets replaced by the shell before awk is called.
这句话意思就是, 如果你用双引号, shell会在awk处理之前就把$2给展开了, 那么awk识别的时候就出错了, 就得不到你要的结果了. 为了避免这种shell把awk活儿给提前抢了的问题, 最外层用单引号就好了.
回到最前面的截图, 在①中, 因为用了双引号, awk后面的$0先被shell解释了(一般专业词汇应该叫展开, extend). 这时候$0不再是awk里的“所有字段”(代表整个文本行)的含义, 而是一个叫做“$0”的变量(就跟前面举例的$a一样). 这就是为啥最后awk回没有结果的原因.
在②中, 因为使用的单引号, $0不会被shell展开, 其含义仍是awk内的含义.
如果大家对awk比较感兴趣的话, 有一些awk编程相关的书籍可以查询的.
例如介绍sed和awk的书: 《sed与awk》或者是《awk programming》


网友评论