美文网首页MAC + LINUX + VIM + GIT + Latex + Markdown个人收藏手机~
简书PDF生成器 1.0.0:如何优雅地下载简书文章

简书PDF生成器 1.0.0:如何优雅地下载简书文章

作者: 逸之 | 来源:发表于2015-11-17 10:15 被阅读6978次

    缘起

    笔者因着小时候一次丢失电子资料的经历,直到现在,重要的资料都很少肯只放一处——自己本机要有一份,网上也要有一份,这样不论是自己硬盘损坏还是人家服务器关停,我都不至于有多大损失。学习资料、影视文件、代码成果如此,写好的文章更是如此。

    在使用简书之前,我习惯在本地word里写作,每写几个字都会下意识地按一下Ctrl+S(保存),写完之后发到网上。有时回头读一读,发现几个错别字、想到几个更好的用词,网上和本地两头都要改一遍。在渐渐习惯使用简书写作之后,情况就倒了过来,先在简书写,写好了再复制粘贴到word里。后来终于嫌麻烦,再加上发现这里有下载自己所有文章的功能,便舍弃了在本地的实时备份,改过字句、写过新文章后来简书下载所有文章就行。

    在文章备份方面,简书其实已经做得十分到位,它像SVN一样自动保存着我们文章的每一个版本,比自己用word备份强得多。但当我们出于安全考虑,使用本地备份的功能(下载文章),下载下来的是一个压缩包,里头是与文集一一对应的文件夹,文件夹里HTML格式的文章,点开一看,是这样的:(以我最近的一篇《01改变世界:机械之美——机械时期的计算设备》为例)

    我喜爱的黑体字体和夜间模式不见了 引用部分只保留了缩进,没有背景色;图片直接按原尺寸显示,下面的说明文字也失去了格式

    当然这些现象还是可以忍受的,毕竟是备份,不需要保持那么美观,内容都在就行。然而内容真的都在吗?事实证明我没有多虑,这些HTML文件的体积是如此之小:

    通常只有几K、十几K

    很明显没有将图片数据包含进去,仍然只是保存了图片的url地址,如果你断开网络,清空浏览器缓存,图片将不再显示。也就是说这里的文章备份是不完整的,如果哪一天图床出了故障或者关停(当然我们都不希望这些情况发生),文章里的图片将无处可寻,文学类的还行,强烈依赖于插图的文章等于残废,有些图是作者自己截的、画的、PS的,可谓损失惨重。

    我想会不会不是只有我一个在寻求额外的备份方案,在简书一搜,还真有人琢磨过——《简书文章备份设想》,文中提出了一种将文章转存至word的设想,但也仅仅是设想,而且word文档的兼容性实在不敢恭维。

    当我兴奋地询问……

    好吧,光说不练都是没用的,看来有必要自己动手丰衣足食。我选择的是PDF,因为PDF是一种写死的格式(不像word那么矫情),内嵌字体,用任何软件打开都不会出现排版错乱,这样在实现备份的同时还可以保留原本优雅的阅读体验,一般提交、打印论文和简历也都会选择PDF。

    成果

    经过10天的艰苦奋斗,终于整出了一个凑合能用的版本,先来看看效果:(以自己的一篇散文《刹那寒》为例)

    左边为网页原效果,右侧为PDF效果

    · 页面宽度为A4纸宽度,没有分页,即文章有多长,页面就有多长;

    · 秉承简书的排版风格,行间距、段间距、字体颜色都经过悉心调整;

    · 为保障作者权益,文章标题和作者名字都含有超链接,点击可以打开文章页面和作者主页;

    · 作为简书的忠实拥护者,为保护版权,在右上角添加了简书logo,同样带有前往简书首页的超链接。

    · 内嵌图片,以合适的尺寸显示;

    · 扩展阅读、打赏、评论等元素没有保留,旨在备份文章本身。

    下面来考察一下其他页面元素,以一篇比较复杂的文章《01改变世界:没有计算器的日子怎么过——手动时期的计算工具》为例:

    文中的小标题、图片下方的说明文字都是追求与简书保持一致的(说明文字下方偷懒没有像简书那样划线,好像也并不难看) 超链接和引用块的色彩也都与简书一致 分割线

    当然,正文里的粗体、斜体、删除线也都支持,这里就不一一展示了,大家可以自己尝试,总之各项格式跟你在网页上看到的都是一样的。

    软件下载链接(百度云)

    有32位和64位两个版本,请根据自己的系统合理选择。

    欢迎订阅《逸之的程序小库》专题,软件后续推出的版本更新将收录其中。

    使用说明

    这是一款只能在Windows下运行的软件,因为是MFC做的,界面非常朴(nan)实(kan):

    甚至连icon都没有换

    你只需要将文章的页面地址粘贴进去,点击保存,在获取好网页内容之后会弹出选择保存路径的对话框:(再以《刹那寒》为例)

    弹出选择保存路径的对话框,默认文件名是自动解析到的文章题目

    选好路径,改好名字,点击保存,如果一切顺利,程序会提示你生成成功:

    大功告成\(^o^)/

    有此神器在手,妈妈再也不用担心我的文章丢失~

    除了作者保存自己的文章,读者也可以下载自己喜欢的文章

    额外声明&程序的不足

    · 目前只针对单篇文章,不能批量下载,这也是值得商榷的,因为批量下载有可能侵犯到作者的权益。

    · 目前只支持白天模式+黑体,不支持夜间模式存在一定的技术原因,而不支持宋体是因为我本人觉得黑体更好看!

    · 由于PDF本身不支持动图,因此你只能看到GIF的第一帧。

    · 暂不支持一些特殊字符,比如☜☝☟☞。

    · 不支持包含视频的文章下载,如果你非要下,程序有可能忽略视频,只保留其他内容,有时可能也会一并忽略视频以下的所有内容。

    · 暂不支持使用Markdown编辑的文章,因为Markdown的元素更丰富,比如列表、表格、代码段(目前精力有限),同时某些元素与富文本的文章格式也不一致。如果你非要下,在没有使用富文本以外的元素的情况下,有可能生成成功,但更多时候是提示失败。

    · 在网速不给力的情况下,多图的文章下载可能会很慢,界面会假死,这个时候程序其实还没崩溃,请耐心等待,然而它最终可能会提示你图片加载(或下载)失败,没关系,你可以重试,或者,过会儿再试。

    · 程序遵循PDF/A-2b标准,原则上文章可以很长很长,可以有381千米,我的个天,但我没允许这么长,大约限制在百来米的样子,也足够长了,超出限制程序会提示失败。

    · 简书文章的格式并不完全统一(尤其是移动端写出来的),还有一些我尚未遇到的情况和尚未能解决的问题,也就是说程序有着大量潜在的bug,而且简书也会时不时调整格式,如果生成的页面排版混乱或出现乱码,或者程序在运行时崩溃,请反馈给我,我会尽可能修正。

    2015年11月16日 西安

    相关文章

      网友评论

      • Ricsy:很有想法啊
        逸之:@紫枫星 😁
      • 雨夜飞雪:怎么把标题下面的链接去掉。就是可以链接到文章地址的超链接
        雨夜飞雪:@逸之 直接用虚拟打印机打印
        逸之:@王海洋Ericvon 嗯,为了版权,链接留着。你用什么工具转的PDF呢?
        雨夜飞雪:是为了保护版权吗?。。。可我把自己的文章转成pdf也没办法去掉超链接哎
      • 芭比哪吒:哇,真的是了不起,竟然自己撸了个神器,今天我也遇到了这样的问题,先试用一下,如果可以必然再来感谢。
        芭比哪吒:@逸之 我不太清楚HTML中图片是怎么处理的,最后下载下来的HTML文件,那么图片是保存在哪里的呢?
        芭比哪吒:@逸之 好的,真的好用
        逸之:@玖湖弋 哈哈,记得下最新版
      • 秋日麦田:请问怎么样把简书没有发布的文章发送邮件出去?
        逸之:@秋日麦田 可以直接在APP中分享出去啊,如果要下载文件那就只能用简粉,或者简书有生成图片的功能。
        秋日麦田:@逸之 那简书文章必须得生成PDF才能转发邮件是吗
        逸之:@秋日麦田 目前简书和简粉都没有这个功能
      • Zszen:其实只要写个汇总多个文章到一个网页即可, 然后chrome对这个网页做成pdf
      • 㭍葉:您好!请问一下我生成pdf的时候代码段都不见了要怎么处理呀~
        㭍葉:@逸之 谢谢
        逸之: @㭍葉 PDF不支持markdown的元素,建议生成HTML
      • 倔强的潇洒小姐:我把简书的链接copy进去提示文章不存在,咋回事
        倔强的潇洒小姐:@逸之 下载新版就可以了,不过还是会有链接不能生成
        倔强的潇洒小姐:@逸之 是的,试了四五篇都是这样的,生成器是1.0的
        逸之: @倔强的潇洒小姐 每一篇都是吗?有没有下载最新版
      • 书氢:网上有一份是啥意思
        逸之: @小抒 就是自己电脑坏了,文章在网上,没有丢失啊
      • 京城十三叔:楼主,这个软件很牛啊,但是我一直是runtime error 不知道是为什么,我用的是win8 + 64,下载的是最新的1.2.0, 不知道会不会有影响
        逸之: @京城十三叔 下载前一个版本试试呢?
        京城十三叔:@逸之 win8 64
        逸之: @京城十三叔 你的系统是多少位的?
      • 楠天下的太阳花:精彩,收入到专题《楠天下的太阳花》。👍
        同时,欢迎关注我们专题。🌻🌻🌻
      • 猫声喧哗:好详细的说明,赞!
        逸之:@猫声喧哗 这两天要出下一个版本,欢迎关注😏
      • 书谨:学习
      • d4a9e79d51d0:Instapaper搞定:smile:
        逸之:@小小的宇 丧心病狂_(:з」∠)_
      • b2a833906c26:直接Evernote剪藏岂不是更省事?
        b2a833906c26:@逸之 不过看着架势,印象笔记说不准哪天就倒闭了,还是Onenote更靠谱一些
        逸之:@知何 印象笔记呀
        逸之:@大智若愚 有道理啊,我out了_(:з」∠)_
      • 71ecbd2191b6:在手机上我直接转存为知笔记
        逸之:@埋头喝酒 Orz我只能以PDF的独立性来安慰自己了_(:з」∠)_
        71ecbd2191b6: @逸之 全文照搬
        逸之:@埋头喝酒 效果咋样?
      • Kunz:牛逼
        逸之:@sunning_Zhu :blush:
      • 魔术师:简书自己服务器有自动保存,话说除非简书挂了应该不会丢吧
        逸之: @kscorpio 所以就用简粉吧😏
        kscorpio:@逸之 主要是怕 作者删除啊, 我想离线保存一些别人的文章
        逸之:@魔术师 云时代确实也很少需要这样费尽心思地备份,本文也算是给大家提供多一种选择吧!
      • 7ea1c483b7c3:点击分享-添加到我的印象笔记
        逸之:@GranMagisterio 其实现在服务器也很少有突然关掉的情况,除非是天灾了,我也只是对PDF有情结吧_(:з」∠)_
        7ea1c483b7c3:@逸之 而且它还有无限历史版本保存,放心用吧,要是这都丢了😅可以去买彩票了(前两天刚刚升级PREMIUM 还多送了六个月
        逸之:@GranMagisterio 有道理 :joy:
      • mtobeiyf:其实Ctrl+P就可以打印页面至PDF。就是难看了点。
        逸之:@mtobeiyf 嗯是的,是可以保存网页至PDF
      • eab15edf7052:Ctrl+F好像是查找…
        逸之:@hjg1028 噢shit打错了,多谢提醒
      • LostAbaddon:赏你的,别找零了~~~~
        逸之:@塔塔酱 谢谢老板Orz Orz Orz Orz Orz
      • LostAbaddon:这个东东不错哎~~~
        逸之:@塔塔酱 确实解析得好崩溃 :sob:
        LostAbaddon:@逸之 PDF嘛,是挺麻烦的
        逸之:@塔塔酱 唉,文章格式不统一,bug横出,调得我心累啊_(:з」∠)_
      • LostAbaddon:不过倒是可以考虑保存为MHT文件,把图片的信息也一并保存到文件里,不过这样文件就太大了。。。
        逸之:@塔塔酱 呃,那就出浏览器插件,或者客户端……
        LostAbaddon:@逸之 我擦你得考虑服务器压力啊。。。
        逸之:@塔塔酱 放呀,文件大点又没事
      • LostAbaddon:图片是放在七牛这个图床里的,原则上来说,只要七牛不倒,你的图片就一直都在,当然前提是你连着网。。。
        逸之:@塔塔酱 是啊,天灾人祸难以预料啊
        LostAbaddon:@逸之 那这个收影响的就不单单是我们简书一家了。。。这个打击面太广了。。。
        逸之:@塔塔酱 万一七牛倒了_(:з」∠)_

      本文标题:简书PDF生成器 1.0.0:如何优雅地下载简书文章

      本文链接:https://www.haomeiwen.com/subject/thikhttx.html