打造属于自己的RSS源

作者: 源小白 | 来源:发表于2016-10-02 00:01 被阅读5557次

    (更新了些RSS 源订阅方法,简书不好编辑,请移步我的博客

    阅读是一个主动寻求知识的过程,在如今碎片信息充斥着我们生活中的时代,我们需要清楚自己想要获取什么,把有限的时间放在消化信息上,而不是放在获取信息的途径上。如今我们可以通过各种APP、公众号、聚合信息网站获取相对大众并符合自己的信息,但也有缺点:我需要下载这么多个APP吗?公众号我还需要一个个点开看吗?这些网站就拥有所有我想知道的吗?当初的我找到了解决方法,也一直使用到现在,这个方法就是订阅RSS源。

    本篇文章将简介RSS,初步订阅适合自己的RSS源,并对于一部分不提供RSS订阅的网站,我们为其创建RSS源并订阅。

    RSS

    RSS(Really Simple Syndication,简易信息聚合)是一种消息来源格式规范,表达了「聚合真的很简单」这样的愿景,我们可以将其看作是一种定制个性化推送信息的服务。

    macOS客户端

    我推荐 Reeder 3,因其功能足且美观,还支持iOS平台。

    另外 Leaf 也不错。

    Windows客户端

    自己不使用 Windows,根据你必读的 RSS 订阅源有哪些?推荐 FeedDemon

    其他平台

    入门的话推荐深蓝阅读,支持iOS、Android平台。

    进阶推荐Inoreader 官网 评测

    RSS源

    常见网站RSS订阅位置

    我们可以再去到自己常去的网站,看看有没有提供RSS订阅。例如少数派首页,我搜索rss,就找到了RSS源。

    再例如爱范儿,找到RSS订阅的图标,不认识的话现在就记下来吧~

    我们可以直接复制链接地址到阅读器中,这样就能简单的订阅RSS了。

    RSS源搜索引擎

    Instant RSS Search

    RSS源也有搜索引擎,这里介绍 Instant RSS Search,是一个谷歌驱动的RSS搜索引擎。

    快看看你关注的网站有没有原生的RSS源吧~

    微广场

    微广场提供微信公众号的RSS订阅,免费用户可订阅10个内容源。

    RSS源推荐

    你必读的 RSS 订阅源有哪些? 这里已经总结了很多优秀的订阅源。

    例如:

    名称 RSS地址
    知乎每日精选 http://www.zhihu.com/rss
    读书笔记 http://www.write.org.cn/feed
    褪墨 http://feed.mifengtd.cn/

    不再阐述太多,适合自己的才是最好的。

    创建RSS源

    部分网站可能比较看重PV值,就是希望用户主动进入他们的网站,或者其他原因不提供RSS源,这时候就需要我们使用 feed43 的服务来为我们扫平障碍。国内网站似乎不太热衷主动提供RSS订阅地址,这点国外做的较好。

    Step 1

    首先点进 feed43 右上角 Create Account 注册,登录完之后到主页点击 Create new feed 来创建自己的RSS源。接下来我将会用科学人|果壳网来做示范。

    我们把http://www.guokr.com/scientific/复制进Step 1的Address,编码会自动选择,如果出现乱码可以尝试utf-8或其他编码,之后点击Reload。

    Step 2

    我们可以看到页面的源码,看到这不要慌,这些都有套路。

    像上面的图一样,红框中就是我们想要获取的单条信息。其中文章都是一块一块的,样子一样,变的只是其中的文字内容、图片地址,所以相应的代码块也是相似的。我们要清楚的就是想要获取的信息,例如:标题、图片、简介。

    网页源代码是一层一层的,我们首先定位到大红框单个文章块的代码块。简单点可以直接 Ctrl+F 查询其中的标题,例如弱光子。

    如果不容易找到文章所在的代码块的话可以搜索下一个文章标题来找到代码之间的分界点,现在总结下找到的代码。

    由于简书自动识别图片标签上传,相关代码可以在Step 3上面的截图查看

    <div class="article">
    ...无关代码...
    <h3>
    <a class="article-title" href="http://www.guokr.com/article/441758/" target="_blank" data-gaevent="scientific_title:v1.1.1.1:scientific">“弱光子人体安检仪”会损害健康吗?</a>
    </h3>
    ...无关代码...
    <a href="http://www.guokr.com/article/441758/" target="_blank" data-gaevent="scientific_image:v1.1.1.1:scientific">![](https://img.haomeiwen.com/i1218014/7ac5090f1fd373af.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)</a>
    ...无关空格...
    <p class="article-summary">成都双流机场使用的“弱光子人体安检仪”,其实是一种X射线成像装置,这种仪器会对人体健康产生什么影响,目前尚无法验证。而在安检中应该使用何种仪器,则不只是个科学问题。</p>
    ...无关空格...
    </div>
    

    你还可以用Chrome或其他浏览器来找到文章对应的代码块。

    注意HTML标记符号是两两对应的,在截取的时候尽量保持完整,例如:<h3>标题代码</h3><a href...></a><p ..>简介内容</p>

    在feed43中,我们会用到两种代码块:{%}{*},其中{%}替换你想获取的内容,{*}用来省略无关代码。

    替换之后得到:

    <div class="article">{*}
    <h3>{*}
    <a class="article-title" href="{*}" target="_blank" data-gaevent="scientific_title:v1.1.1.1:scientific">{%}</a>{*}
    </h3>{*}
    <a href="{%}" target="_blank" data-gaevent="scientific_image:v1.1.1.1:scientific">[站外图片上传中……(24)]</a>{*}
    <p class="article-summary">{%}</p>{*}
    </div>
    

    注意:

    • <div></div>之间就是一个层,注意保留对应文章代码块的完整
    • 两个标签中间有空格可以直接用{*}代替
    • 上面文章链接出现了不止一次,可以只找一个,其他忽略
    • 观察代码,图片宽高不一致,所以data-heightdata-width处参数要用{*}忽略
    • class=""可以看作为小套路,一般代码块对应的参数都是一致的,例如标题对标题,内容对内容。
    • 多用{*}替换你觉得出错的地方

    点击Extract,可以看到想要的信息都被找出来了,接下来就是用这些信息去组成RSS文章的界面。

    Step 3

    把对应的文章标题、文章链接标记块填到对应区域,当然你可以自定义每个文章的标题、链接、内容,这里我们用我们获取到的。

    <center>...</center>表示居中代码块中的元素,<img src="">是图片标签,中间填入图片链接以显示图片,<br>表示换一行。你还可以在内容内再添加一个指向文章的链接,例如<a href="{%2}">链接显示文字</a>,更多标签可以参考HTML图片标签左下角的标签列表。

    点击Preview来到 Step 4 收获成果。

    Step 4

    把地址添加到RSS阅读器上

    我们可以直接点击标题跳转到网页(其他阅读器可能不一样),现在说说feed43的注意事项。

    注意

    feed43 爬取限制

    免费的计划是六小时刷新一次RSS地址,也就是六小时才更新一次内容,有需要的可以购买计划,不过一般够用了。

    feed43 爬取失败原因
    • 需要登录才看到内容的网页,例如一些论坛。
    • 内容由JS方式生成
    • 网站禁止了feed43 ip的访问,即403错误。
    • 网站不支持IE浏览器

    RSS全文输出

    Free Full RSS

    全文输出即是直接从文章链接提取内容,并替代RSS文章内容显示。简介还是全文,选择在于你,这里我用 Free Full RSS 做示范。

    创建成功后,会得到新的RSS订阅地址。科学人 | 果壳网 全文输出RSS源地址

    效果:

    其他全文输出网站
    名称 网址
    Full Text RSS Feed Builder 完全免费
    fivefilters 抠门的免费计划,有付费计划。
    FULL CONTENT RSS 限时免费KEY,过时失效

    总结

    想要了解更多关于RSS可以看看这篇文章 使用 RSS 可以做什么你未曾想过的事

    2013年 Google Reader 关闭,谷歌给的原因是用户流失,这最主流的RSS阅读器的退出似乎说明了RSS已经快要成为一个过时的阅读方式。这种阅读方式减少了网站和用户之间的交流,也不太适应短信息的节奏(想想你会用RSS刷微博吗),往大了看这是当今社会的节奏,人们喜欢刷微博、刷朋友圈。海量的信息导致人们喜欢浅浅尝一口,而缺少深度的思考,逐渐迷失在海量的信息流中。当然,RSS阅读器也在努力将这种慢吞吞的阅读方式变得更适应人们生活:更快的刷新频率、清爽的界面、优秀的阅读体验。

    如果你看到这,或许可以考虑尝试下这种阅读方式?RSS源贵精不贵多,先养成习惯,并判断这些信息对于自己的价值。

    另外如果你根据本文成功创建了自己的RSS源,或者有疑问,请在本文评论中告诉我,欢迎分享你的RSS地址和经验。

    相关文章

      网友评论

      • 7a5955735405:有没有什么可以编排全文输出啊????
        源小白:@7a5955735405 呃 不太懂你的意思
      • 90ba8a0d95c4:学习了!正在研究怎么用feed43+rss订阅购物网站的新品,可是遇到一些问题feed43上总也不成功,大师可以帮忙看看这个网址不http://you.163.com/item/newItem?_stat_area=newItem_link&_stat_referer=index。我想订阅“新品首发”那个板块。麻烦了!
        源小白:@myqueen_12bf 你好,那网页是用js加载的,feed43读取不了
      • ee63e6ce18b9:有些网站用js前台渲染,feed43也取不到数据,只能抓数据自己解析。

        分享一下:www.rssmaker.cc

      • Xavier_yang:谢谢分享,feed43需要翻墙吗?我这访问很慢很慢
        源小白:@Xavier_yang 不用啊,刚 ping 了一下平均 260ms 吧。
      • 小程有话说:感谢分享,写的很棒。
      • 书氢:感觉自己太白痴了,没看懂不知道你要说啥😱
        源小白:@小抒 呃,简单的说就是自己可以在RSS阅读器上关注多个网站的信息,例如知乎、豆瓣小组、公众号,下面的创建RSS源是指如果网站不提供这种订阅方式,我们可以自己创建一个。
      • 8828ac975551:学习了,谢谢
        源小白:@抖爷抖抖抖 哈哈好,有疑问直接问就好了。
        8828ac975551:@源小白 你也是哦..一会就照着你的分享试试看:smile:
        源小白:@抖爷抖抖抖 国庆快乐~

      本文标题:打造属于自己的RSS源

      本文链接:https://www.haomeiwen.com/subject/kcqdyttx.html