春天来了
申请各种本子的日子到了
我们踏着欢快的步伐,
来到实验室, 来到电脑前。
奋笔疾书, 准备材料
可是,每次上传材料的时候, 系统总是有各种各样的非礼要求,让人头疼, 其中最难受的莫过于文件大小限制。在不禁破口大骂这是什么破系统的同时, 我们该上传的本子,还是得上传滴......
在经过了两天醉生梦死的压缩机状态后, 写下如下感想,希望能对读者有所帮助。
以下为本人使用的究极方法和经验:
经验如下
- 经过多次尝试,我发现一般来说,文字的PDF版本,会小于扫描版,如果压缩要求不变态,请使用文字版(word)转PDF
- 可以使用的压缩优化工具首推Adobe acrobat, 用过都说好, 他提供编辑PDF, 组织页面,导出为各个格式, 优化扫描, 减小大小等,后面两个都可以有效减小PDF的大小, 并且优化PDF的同时,还有各种参数可以选,如更改内嵌的图片分辨率 (对于必须彩色上传的文件,貌似只能采用文字版PDF和降低图片分辨率来实现了,这时adobe就很强大了),这里不多做介绍。
- 如果没有这个软件,大家还可以 百度,必应,谷歌 ‘PDF 压缩 compressor’ 等字样,有很多在线的工具
一般来说,本身是文字版本,文件不会很大,也很难很进行大幅地压缩,如果里面有图片考虑降低图片像素等
如果是扫描版,或者主要是图片的PDF,通过这些工具也大概能瘦身文件了
接下来 > > > > > > > > > >
如果还不行的话 > > > > > >
将图片转化成 indexed 类型的图像啊!
indexed image的图像是通过颜色索引记录的,常见的索引图,有8bit类型,它可以用 0-255来代替256种颜色,然后在图像中就可以用0-255来指代每一个像素点的颜色, 即每个像素点需要8bit记录, 而普通RGB每个像素点需要3个8bit,这样不就省下空间了吗。其实GIF这个格式就是这么干的。
这还没完,我们可以更加穷凶极恶地只用一个bit来表示图片哦, 这就是0和1, 分别指代白黑,一般来说,申请本子黑白的文档是可以接受的。
这时,你有两个选择:
- 只转化文档的图片
- 将每页PDF转化为图片
对于扫描版文档,只能用方法2了,这样的图片压缩算法压缩之后,貌似比文字版还小,可能字符的编码比图片会需要更多的字节来存储,或者更加无序,不利于压缩的缘故,还是只是本人错觉?望懂行人告知
那么怎么做呢
- 用adobe或者在线工具把PDF转化成图片,推荐转化为灰度,分辨率为能看清文档文字的最小分辨率
- 通过GIMP或者PS等工具,将图片转化为mono indexed, 即 0,1 两色的索引模式,并开启dither。 (GIMP有批量处理方法,PS不知)
- 导出为PNG, 压缩全开。
- 用这些图片制作PDF, 再扫描优化啊,减小大小啊之类的来一遍,就是见证奇迹的时刻。
这时图片效果很差, 但文字应该清晰可辨认,会图像处理的还可以自己调节对比度啥的
网友评论