美文网首页人体菌群研究
python: 指定行数切割文本

python: 指定行数切割文本

作者: 胡童远 | 来源:发表于2022-03-04 10:02 被阅读0次

一个1089行的文件需要被每100行拆到一个新的文件,最后剩下的放到最后一个文件。即,批量指定行数切割文件。后面就可以多线程的处理这些文件了。

1 待处理文件

2 python script
代码思路:

  • 打开文件,readlines全部读取,计算行数
  • 行数除拆分单元,提取n到n+拆分单元位文件,依次
  • 余数用linux tail提取
#!/usr/bin/env python3
import re, os, sys

size = 100  # 多少行一个文件
inpath = "3324path.list"  # 需要拆分的文件,3324行

with open(inpath) as infile:
    infile = infile.readlines()
    nrow = len(infile)
    start = 0
    end = size
    for i in range(nrow//size): 
        #print(''.join(infile[start:end]))
        batch_name = "batch_" + str(i+1) + ".path" 
        with open(batch_name, 'w') as o:
            o.write(''.join(infile[start:end]))
        start = start + size
        end = end + size
    os.system("tail -n " + str(nrow%size) + " " + inpath + " > batch_left.path")

3 使用script

运行程序

python3 ../script/cut_file.py

结果

相关文章

网友评论

    本文标题:python: 指定行数切割文本

    本文链接:https://www.haomeiwen.com/subject/qabprrtx.html