准备基因名称信息
基因名称
编写脚本
cat gene.txt |while read id
do
grep ${id} pb_pav.tsv >> gene_pav.txt
done
没有得到结果文件,使用cat -v 命令查看文件格式,发现结尾有^M的标记
编码问题
dos2unix是将Windows格式文件转换为Unix、Linux格式的实用命令。Windows格式文件的换行符为\r\n ,而Unix&Linux文件的换行符为\n. dos2unix命令其实就是将文件中的\r\n 转换为\n。
而unix2dos则是和dos2unix互为孪生的一个命令,它是将Linux&Unix格式文件转换为Windows格式文件的命令。
感谢梁同学提供的帮助
dos2unix gene.txt
再次运行脚本,得到相关基因信息
发现没有表头,先把第一行提取出来就可以
awk 'NR==1' pb_pav.tsv >> gene_pav.txt
再运行脚本,得到结果信息:
网友评论