美文网首页
windows中 Excel导出文件多换行符问题

windows中 Excel导出文件多换行符问题

作者: 余绕 | 来源:发表于2024-05-05 00:27 被阅读0次

最近遇见一个奇葩问题,从excel 导出的文件,导入服务器进行处理老是报错。

bedtools intersect -a hda705_edgeR_up.bed -b Up_bed_no_clean.bed |wc -l 

#Unexpected file format. Please use tab-delimited BED, GFF, or VCF. Perhaps you have non-integer starts or ends at line 1?

后来发现原来windows导出后自带换行符。

例如 使用cat -v命令显示文件中的非打印字符:

cat -v your_file.bed

Chr9 14088131 14088623^M
Chr9 14088131 14088623^M
Chr9 14088131 14088623^M
Chr9 14088131 14088623^M

^M 是 Windows 操作系统中换行符 \r 的可见表示形式。它通常会出现在通过 Windows 环境下创建的文件中,而在 Linux 或 Unix 环境下查看时可能会出现问题。

你可以使用以下命令将文件中的 ^M 替换为标准的 Unix 换行符:

sed -i 's/\r$//' your_file.bed

这个命令会在文件中删除所有的 \r(^M 的实际表示)字符,并将文件保存为 Unix 格式的换行符。然后你可以再次检查文件内容,确保 ^M 字符已经被移除了。

cat -v your_file.bed

Chr9 14088131 14088623
Chr9 14088131 14088623
Chr9 14088131 14088623
Chr9 14088131 14088623

这样后续在进行操作就不会报错了!!!

bedtools intersect -a hda705_edgeR_up.bed -b Up_bed_no_clean.bed |wc -l
3597

相关文章

网友评论

      本文标题:windows中 Excel导出文件多换行符问题

      本文链接:https://www.haomeiwen.com/subject/zafkfjtx.html