美文网首页
-数据求差异-

-数据求差异-

作者: 宗肃書 | 来源:发表于2023-02-23 10:18 被阅读0次
用python 命令: python test.py a.txt b.txt -o c.txt 写出以下需求:文件a.txt 有一列数据,文件b.txt有一列数据,列出两列数据不一样的数据并输出为新文件从c.txt
#!/usr/bin/env python3
import sys, argparse
 
ap = argparse.ArgumentParser()
ap.add_argument("file1", help="first file")
ap.add_argument("file2", help="second file")
ap.add_argument("--output", "-o", help="Output file name")
args = ap.parse_args()
 
f1 = open(args.file1, "r")          
f2 = open(args.file2, "r")
 
file1_set = set([x for x in f1.read().splitlines()])
file2_set = set([x for x in f2.read().splitlines()])
 
differences = file1_set.symmetric_difference(file2_set)
 
if args.output:
    ofile = open(args.output, "w")
    for line in differences:
        ofile.write("{}\n".format(line))
    ofile.close()
else:
    for line in differences:
        print(line)

相关文章

  • limma分析差异基因

    limma分析差异基因 数据载入 多个探针求平均值 PCA plot Principal Component An...

  • #多个数据集差异基因整合#

    加载包,设置差异倍数logFC和P值 读取各个数据集的差异基因 读取各个数据集的差异基因 读取这些差异基因的数据框...

  • 最简单的GEO分析

    GEO 数据集的差异分析语言:R差异分析包:limma前提:GSE数据集内有数据,GPL数据有数据“Series ...

  • 同步备份数据

    server to Windows 先安装babun rsync 可以同步数据,她会分析数据间的差异,只传输差异的...

  • 你拍脑袋做的策略对吗?从统计学中寻找答案

    从数据差异寻找经营的差异 统计学中,把不是因数据分散而偶然产生的差异叫作统计学上的显著性差异 在商业分析中,仅仅理...

  • TCGA差异分析——limma, DEseq2, edgeR

    TCGA转录组数据 转录组数据的差异分析与芯片数据的差异分析有不同,这里我们使用count数据,因为这几种包中包装...

  • 数据差异运算

    又来吐槽一下码狗的办公日常,被要求从数据库批量导出数据,发现源数据条目与导出的目标数据不一致,在上万条数据中寻找几...

  • 初学者R语言:热图基础画法及个性化调整详解

    热图(Heatmap):用颜色变化直观的表达数据之间差异的图,是对实验数据进行质制和差异数据的展现,是数据挖掘类文...

  • R|FPKM、RPKM差异分析

    芯片数据差异分析,常规用limma进行差异分析,而对于RNA-seq数据,常用edgeR、DEseq2和limma...

  • GEO芯片数据下载和差异分析

    保存后,对数据进行整理,只保留想要分析的样本数据。 报错 自行替换,然后再分组做差异分析 差异分析 绘图 临床数据下载

网友评论

      本文标题:-数据求差异-

      本文链接:https://www.haomeiwen.com/subject/ybbzkdtx.html