美文网首页手机APP控 ᝰ 奇葩工具箱资源一起学起来
【干货】如何高效地订阅微信公众号

【干货】如何高效地订阅微信公众号

作者: xzonepiece | 来源:发表于2017-05-13 20:44 被阅读5768次

    微信已然成了国内最流行的社交软件,甚至成了人们的一种生活方式,依托于这个平台的微信公众号自然是新媒体传播的最佳途径,是获取资讯的最佳场所,有很多优质的微信公众号都是值得订阅的。但是,在微信内订阅与阅读公众号文章的体验却是极差的,这个我想大家应该都是有目共睹的。

    微信公众号订阅
    本文会介绍大家几种订阅微信公众号的绝佳方法,相信总有一款是适合你的(最后一种方法强烈推荐)。为了衡量这些方法的优缺点,我会使用下面三个公众号进行测试:
    • warfalcon:刘洋老师的个人微信公共号,著名的博客写手,主要是分享一些关于学习以及生活的思考,粉丝较多;
    • 木西AlexanDENG:邓楠的个人微信公众号,著名的青年商业摄影师,主要是分享一些关于摄影的干货,在圈内粉丝较多;
    • MXPRESSO:一个好朋友公司的微信公众号,主要是分享一些关于咖啡与生活的文章,粉丝数不清楚。

    1. 即刻APP

    在聚合类APP里,我觉得即刻做得是最棒的。我是从2015年开始使用这个APP的,应该是最早的那批用户,从刚开始只有一些人工筛选的主题到现在用户可以自定义主题,即刻的功能越来越强大,我在之前的文章中就安利过多次。在3.0版本以后,即刻加入了自定义主题功能,用户可以通过APP提供的追踪机器人创建自定义主题(提醒),这个功能的加入让我对这个APP更加刮目相看,因为这个功能在别的APP中是找不到的。

    即刻的追踪机器人
    即刻提供的追踪机器人中就有公众号文章更新这个机器人,通过它就可以订阅微信公众号,创建一个关于公众号的自定义主题,微信公众号更新文章以后,就可以收到提醒,在即刻APP里阅读,而且创建的自定义主题还可以分享给其他人使用,通过审核后的主题还会被系统推荐给其他人使用。我测试了上面的三个微信公众号,都可以通过这种方式来订阅,如果你经常使用即刻的话,这种订阅方式是再适合不过的啦。

    2. 轻芒阅读APP

    轻芒阅读是另一款信息聚合类APP,就是以前的豌豆荚一览,现在已经从豌豆荚里分离出来了。在这个APP里可以阅读一些应用以及公众号的文章,使用体验很不错,高效且优雅。我搜索了上面的三个公众号,没有搜索到MXPRESSO,可能是因为没有收录吧。在内容更新上,Warfarcon的文章都有更新,包括前天的文章,但是木西AlexanDENG中昨天发布的文章就没有更新。

    轻芒阅读

    3. 一览

    一览是一款国内的RSS阅读器(免费版只支持系统提供的数据源),支持订阅微信公众号和知乎,还可以将文章推送至Kindle,有网页版和APP客户端。我再次测试了一下上面的三个公众号,很遗憾,只能搜到Warfalcon,其他两个公众号都没有收录。在内容更新上,warfarcon五月份发布的文章暂时没有更新。

    4. RSS+Huginn

    我在【干货】信息大爆炸时代,该如何高效阅读中就介绍过将微信公众号转化成RSS的方法,推荐了大家使用微广场,但是,最近微广场正式关闭,这个方法已经彻底失效,甚至,连微口网这种提供摘要型RSS的方法都已经失效了。我在网上重新搜索了一下,貌似还有今天看啥还在提供RSS服务,但好像也是个人提供的付费服务,不知道能坚持到什么时候。因此,为了应对这种情况,我不得不祭出大招-Huginn,这也是我一直在推崇的方法,利用Huginn可以订阅一切网站的更新,当然也包括微信公众号,通过它,我们就可以将公众号变成RSS,而且更新速度快,阅读体验只取决于你的RSS阅读器(RSS阅读器的选择可依据你的喜好来)。

    安装部署Huginn的方法请参见我前面的文章-Huginn 安装教程—建立你自己的 IFTTT,更多安装部署方法可参见我们的Huginn中文网。如果你想更深入地了解Huginn,请参见我之前的文章-使用 Huginn 打造自动化云端信息助手,或者来我们的论坛上进行交流。

    下面我来详细说一下如何通过Huginn将微信公众号转化成RSS,因为Huginn必须依托网页源才能制作RSS,所以我们先要有获取微信公众号文章的网址,你可以使用已有的微信公众号聚合网站,比如,传送门启蒙,等等。但是,最全、更新最及时地莫过于搜狗微信,大部分聚合网站基本上也是通过爬搜狗微信获取公众号的全文,下面以将木西大神的木西AlexanDENG为例。

    (1) 利用搜狗微信搜索想订阅的微信公众号

    搜狗微信搜索结果
    我们可以看到搜索获得的页面上就有最新文章的标题,我们只需要监控这个标题的变化就可以知道这个公众号有无更新,这里需要使用Huginn最常用的Website Agent,具体选项如下:
    {
      "expected_update_period_in_days": "2",
      "url": [
        "http://weixin.sogou.com/weixin?type=1&query=%E6%9C%A8%E8%A5%BF+AlexanDENG&ie=utf8&_sug_=n&_sug_type_=&w=01019900&sut=2064&sst0=1470553392399&lkt=0%2C0%2C0"
      ],
      "type": "html",
      "mode": "on_change",
      "extract": {
        "title": {
          "css": "#sogou_vr_11002301_box_0 > dl:nth-child(4) > dd > a",
          "value": "string(.)"
        }
      }
    }
    

    url对应的是搜狗微信搜索微信公众号对应的搜索结果地址

    (2) 获取最新文章对应的链接地址

    在上面的Agent,我并没有直接获取对应文章的链接地址,因为微信全文对应的链接地址不是永久地址,如果也放到上面的Agent中的话,会导致无效的触发,继续使用Website Agent,具体选项如下:

    {
      "expected_update_period_in_days": "2",
      "url": [
        "http://weixin.sogou.com/weixin?type=1&query=%E6%9C%A8%E8%A5%BF+AlexanDENG&ie=utf8&_sug_=n&_sug_type_=&w=01019900&sut=2064&sst0=1470553392399&lkt=0%2C0%2C0"
      ],
      "type": "html",
      "mode": "all",
      "extract": {
        "url": {
          "css": "#sogou_vr_11002301_box_0 > dl:nth-child(4) > dd > a",
          "value": "@href"
        }
      }
    

    (3) 获取公众号文章的全文

    在获得最新文章对应的链接地址后,就可以获取文章的全文,下面继续使用 Website Agent 解析获得文章的全文,具体的选项如下:

    {
      "expected_update_period_in_days": "2",
      "url_from_event": "{{url}}",
      "type": "html",
      "mode": "merge",
      "extract": {
        "title": {
          "css": "#activity-name",
          "value": "."
        },
        "fulltext": {
          "css": "#js_content",
          "value": "."
        }
      }
    }
    

    url对应的是上一个Agent获得的链接地址;mode模式选择merge,可以保留上一个Agent获得的url内容

    (4) 输出RSS

    最后,只需要使用 Data Output Agent 输出RSS即可,具体设置如下:

    {
      "secrets": [
        "weixin"
      ],
      "expected_receive_period_in_days": 2,
      "template": {
        "title": "订阅微信公众号(木西AlexanDENG)",
        "description": "将微信公众号(木西AlexanDENG)输出RSS",
        "item": {
          "title": "{{title}}",
          "description": "{{fulltext|regex_replace:'data-src','src'}}",
          "link": "{{url}}"
        }
      }
    }
    

    需要注意的是,公众号全文中的Html并非标准的Html,要将其中的data-src 全部替换成src,否则输出的RSS中图片无法正常显示**

    将微信公众号制作成RSS

    通过上面的设置,你就可以在你的Data Output Agent 界面的Summary上获得对应的RSS地址,将这个RSS地址放进你的RSS阅读器吧!!!

    如果你不想一步一步地进行设置,你可以直接把这个文件导入Scenarios中,即可获得木西AlexanDENG对应的RSS地址;你只需要将前两步中的url换成你想订阅的微信公众号在搜狗微信中对应的搜索结果地址即可

    因为搜狗上有反爬虫机制,所以你的Agent的触发间隔最好长一点,像木西大神的这个公众号最多一天也就更新一篇文章,因此我就设置成了一天触发一次。如果你想将触发间隔设置短一些,又不会触发到反爬虫机制,你可以使用Phantomjscloud提供的API,借助云端模拟浏览器进行爬取,这个方式是最棒的。最新版本的Huginn可以直接使用 Phantom Js Cloud Agent,老版本的Huginn可参见这篇教程-Browser Emulation Using PhantomJs Cloud

    更新

    通过Phantom JsCloud Agent的流程如下:

    通过PhantomJsCloud Agent将微信公众号的文章制作成RSS

    详细设置的使用文件见链接

    5. 总结

    总结一下上面提供的四种方法:

    • 即刻APP:可更新几乎所有的微信公众号,更新速度快,即刻用户强推;
    • 轻芒阅读APP:收录的微信公众号较多,更新速度一般,阅读体验好,可考虑使用;
    • 一览:主要收录了一些热门的微信公众号,不同公众号的更新速度不一样,可以推送到Kindle上阅读,Kindle用户可以考虑一下;
    • RSS+Huginn:搜狗微信上有的公众号都可以制作成RSS,更新速度可设置,阅读体验取决于使用的RSS阅读器,爱折腾的用户强推。

    不知道上面这几种方法有没有适合你的,有任何不明白的或好的想法,随时欢迎与我交流。

    相关文章

      网友评论

      • 2830d6fbb07f:我这边使用PhantomJs Cloud对微信公众好抓取内容的时候失败,应该是微信那边查封了。有什么办法可以绕过?
      • 麦穗一足:你好请问一下,可以同时订阅对个微信公众号嘛?
        麦穗一足:对多个微信进行订阅
      • BIGJUN777:你好,我想问一下如果制作那种连发好几篇文章的公众号的RSS,直接检测最新文章应该不行吧,请问有解决办法么?搞了好几天,感觉需要点额外知识,Huginn资料又有点少
        xzonepiece:@BIGJUN777 可以去我们Huginn中文网上学习一下
      • 75672d39c096:上面的方法基本都已经失效,可以试试我开发的 https://werss.app 有免费订阅额度。
        xzonepiece:@75672d39c096 厉害,不过,huginn的方法没有失效的哈
      • 隔壁村老吴:利用搜狗微信搜索想订阅的微信公众号的Scenarios是否已经失效?我第一步获取成功后,后续的动作都无法成功。
      • 8d052cc5bab7:第三步获取不了全文
        8d052cc5bab7:刷新了下第二步,就OK了。。。
      • 匡哐哐:您好,打扰了,请问将最后输出RSS的summary里xml后缀的地址复制进inoreader里显示找不到订阅源是为什么呢?我就是直接导入您的json文件,修改了1、2的url的。感激不尽!!
        匡哐哐:@xzonepiece 谢谢您!
        xzonepiece:@匡哐哐 可能是失效了吧,改天我更新一下
        45c8a31616c2:我不知道你的问题怎么解决,但是想问一个问题,你复制的地址在浏览器里打开能看到内容吗?
      • b871905672d9:您好,请问一下为什么我导入文件之后,4个agent的工作状态一直是no的?
        xzonepiece: @柱坚 恩,是这样的
        b871905672d9:@xzonepiece 所以我只要导入文件到Scenarios后,更改(1)(2)步骤的公众号链接,最后再订阅在Data Output Agent界面的Summary上的xml地址就可以了吗?
        xzonepiece: @柱坚 这个跟expected_update_period_in_days的设置有关,如果agent的运行周期小于这个设置值的话,working就会显示no,但是,这是不影响使用的
      • Joeyspace:那个我使用你的代码后,发现即使是微信公众号没更新时,huginn也会重复推送之前的文章。请问你有出现类似的状况吗?
        xzonepiece: @Joeyspac 第一个和第二个agent不能合并在一起的
      • 电子怪兽:只取公众号页面的最新文章,对于那种更新频率高的公众号,会漏掉文章的吧
        xzonepiece: @电子怪兽 那个也是可以做到的,思路是类似的,只不过我关注的公众号都是个人公众号,基本上更新都不是那木频繁,所以这个方法就没有再优化

      本文标题:【干货】如何高效地订阅微信公众号

      本文链接:https://www.haomeiwen.com/subject/eptfxxtx.html