美文网首页
069 小积累

069 小积累

作者: 青峰在北京 | 来源:发表于2023-05-27 16:39 被阅读0次
    成长最好的状态可能就是每天乐此不疲地有积累和产出,要做到这点,确实很难。

    今天虽然做不到有大积累,但是小积累也给了自己对未来的信心。今天我编了个小程序,功能是对一本扫描的书籍,通过其它转化软件转成文字文档后,对该文字文档中一些不符合格式的内容进行批量化处理。

    首先要寻找合格、好用的转换格式软件,源文件是扫描版的pdf文件,就需要转换软件具备OCR功能,而不仅仅是另存为功能。根据之前的经验,首先找acrobat的官方免费在线转换服务,其次从百度上搜了一些在线转换软件,都是比较坑,基本上不付钱等于无用,另外从知乎上也看了几篇文章,看来并没有太合适的,有些勉强用的软件,但识别率并不是很高,满足不了自己的要求。而我之前一直付费购买的一家小众软件公司开发的全家桶软件,今天想起来了,查找了其包含的软件,全家桶里面的软件包含了一款扫描版pdf转word文件或者是文本文件的软件,识别率基本可以满足要求。

    然后,这个转化后的文本文件是有些格式上的问题,因为它是从纸质版文件转化而来的,纸质版文件里面存在一些页眉、页脚以及页码等散布在文本文件中,如果逐个去删除的话会耗费大量的人工时,并且对着一大堆文字进行筛选,眼睛的压力也不少。为此早上就在想到了这一个问题,于是思考虑可否通过编一个小程序设定一些条件自动判断,每符合一个条件下就对判断这一行是否需要替换或者需要改成其他的格式。当然word只能处理简单的替换功能,像修改不同页眉、页脚和页码的情况还应有智能化的工具来完成。

    最后,有了以上这个需求,按照这个想法,理清思路,今天有时间就写几句测试语句,今天就在原来积累的基础上开发出了一个小程序,现在虽然并不是很完善,但是起码达到能用的地步,基本上可以成为一个定制化的文本处理程序。这个程序的完成其实就是一些小想法和小思路构成的,形成需求,目标是提高效率,减少出错率,最后形成小成果。而今天能完成,主要还是依赖于之前一定要有类似的脚本积累,其实积累是一点点的,但每天的一点点,对未来意义重大。同时,在编写的过程中自己有很多基础命令也印象不深了,当然是先自责一番,然后再找原来的笔记,还有在网上查找解决方法,这也是一种解决问题的基本思路实践,实践多了就知道去哪找和怎么找了。

    所以最好每天至少有小积累,保持有产出的状态。虽然今天积累的东西花费了大量的时间,但一点点小积累还是会给自己带来极大的信心,要重视小积累的力量。

    相关文章

      网友评论

          本文标题:069 小积累

          本文链接:https://www.haomeiwen.com/subject/fatredtx.html