我用2个小时写的代码,就让同事省去了巨量的工作,同事们表示很惊喜,我也收获了一丝丝的成就感。
最近做产品的同事在做文档的查重,就是检查文档A里面的句子是不是在文档B里面有出现,或在文档B里面有个相似的句子,如果有,就要做修改。就是这么一个简单的事情,但是如果我说每个文档都有几百页,那么问题就会变得复杂起来,查重的工作量会随着页数的增加而爆炸,这时就有一个这么聪明的同事想到了能不能通过程序来完成这个事情,因为他是做产品的不会写程序,所以就跑过来问题我这事能不能做,我之前总做这种用程序帮别人处理数据的事情,所以他也自然的想到了我。我想了一下方案,觉得这个能实现,工作量并不大,同时他有好几个几百页的文档这样给他节省的时间也会很可观,这个是有价值的事情。读取word文字,拆分成句子,遍历做比对,基本上没遇到什么问题,从10点开始,到了中午12点就完成了,下午用他们的文档做了下测试,加了一些进度输出,查重效果非常好,同事们表示都惊呆了,很多重复的句子被检查了出来,效率提升了几十倍不止。
网友评论