美文网首页
python:按行切割,同行名列加和

python:按行切割,同行名列加和

作者: 胡童远 | 来源:发表于2022-05-18 16:38 被阅读0次

    按指定行数切割文本;相同列名(>=2个列名)行加和。

    从别的博主那里拷贝过来的,忘记记录地址了

    切割

    #!/usr/bin/env python
    f = open('tpm_all.txt','r') #打开文件
    i = 0 #设置计数器
    while i<1460431 : 
    #这里12345表示文件行数,如果不知道行数可用每行长度等其他条件来判断
        with open('batch_'+str(i)+'.txt', 'w') as f1:
            for j in range(0, 100000) : #这里设置每个子文件的大小
                if i < 1460431 : #这里判断是否已结束,否则最后可能报错
                    f1.writelines(f.readline())
                    i = i+1
                else:
                    break
    

    使用

    # 数据拆分 10万行一个文件
    python sc_split.py
    

    同行名加列

    #!/usr/bin/python3
    # -*- coding: utf-8 -*-
    import pandas as pd
    import os,sys,re
    ms, infile, outfile = sys.argv
    
    frame = pd.read_table(infile,sep='\t')
    df = frame.groupby(['Name','KO_ID']).sum()
    df.to_csv(outfile,sep='\t')
    

    使用

    source /public/home/zzumgg03/huty/softwares/miniconda3/etc/profile.d/conda.sh
    conda activate py37
    for i in `ls ./split_head_rmcol1/`; do
        echo -e "nohup python3 ./sc_ko_sum.py ./split_head_rmcol1/$i ./split_head_rmcol1_merge/$i &"
    done
    

    相关文章

      网友评论

          本文标题:python:按行切割,同行名列加和

          本文链接:https://www.haomeiwen.com/subject/mcuaurtx.html