背景:这两天在使用Linux进行16S数据分析,分析流程里有一步要对原始数据(raw data)进行切除引物的操作,而在切除引物的过程中,需要了解引物(Primer)的长度。
为了方便,我用wc写了一个统计函数。
Prime.png
根据统计出来的数据进行下游分析,结果差别很大。
于是,我从头开始分析,将数据与模板进行对照,发现在模板中也出现了这样的问题:
明明引物长度为20,结果统计出来的字符长度却为21!
然后我又做了测试文件测试了一下,结果如下:
(只有8个字符,结果计算成了9个)
然后搜索了一下:
search.png
才知道是多了一个换行符,改正,继续运算……
心得:在你没有完全了解数据之前,最好还是亲自计算一下,否则,错了你都不知道是怎么回事!
网友评论