美文网首页
批量word中抓取特定字段

批量word中抓取特定字段

作者: f30771f856a8 | 来源:发表于2018-05-17 09:53 被阅读0次

    一. 如果有不同版本word,需要将docx转为doc

    1. 在word所在文件夹内新建txt,在里面输入'ren *.docx *.doc',修改txt的扩展名为bat,双击运行即可。

    2. 如果文件名不规则,在word转txt时会报错,需要批量修改文件名,如下:

        2.1 批量重命名:

    单个用ren命令,多个分行放到一个文本文档里,如:

    保存在文件所在文件夹里,改为.bat后缀,运行即可。

    那么,问题来了,如果需重命名的文件较多,如何把众多文件名及新文件名放到文本文档里呢?一个个复制岂不累死?不用,看方法:

    运行CMD调出DOS窗口,先用“CD C:\XXX" 定位到文件所在文件夹XXX,再输入命令“dir /b>rename.xls",就会在XXX文件夹里生成一个rename.xls文档,里面列出了该文件夹中的所有文件名。然后,在其前面插入一列用ren填充,后面一列一一对应输入新文件名(一般都是用某规律自动填充的啦),最后这三列复制粘贴到文本文档里,就OK了!

    二、将所有.doc格式转为txt格式

    软件下载:http://www.wordlm.com/html/2348.html或者白牛弟弟的糯米百度网盘中找

    三、使用linux的grep命令提取所需要字段

    只是玩耍,了解linux基础用法的话,win10上装个ubuntu好了,装完之后在cmd里面直接敲bash就进入ubuntu环境了,放个传送门Install the Linux Subsystem on Windows 10:https://docs.microsoft.com/zh-cn/windows/wsl/install-on-server

    grep命令用法:http://www.runoob.com/linux/linux-comm-grep.html

    相关文章

      网友评论

          本文标题:批量word中抓取特定字段

          本文链接:https://www.haomeiwen.com/subject/yzbvdftx.html