美文网首页办公@IT·互联网工具癖
“当网站内容有更新时发邮件提醒我”——利用feed43&

“当网站内容有更新时发邮件提醒我”——利用feed43&

作者: 天机大师姐 | 来源:发表于2017-01-19 18:33 被阅读1132次

    发邮件告诉你:研究生考试报名开始了!公务员招考报名开始了!会计从业资格证考试报名开始了!职称英语考试开始了!……

    这些考试一年就一次或两次,每年报名的时间都不一样,一不留神就会错过报考时间。现在,利用feed43和ifttt这两样神器,一旦报名信息发布,我们的邮箱就能收到邮件提醒,再也不怕错过了!也不用每天登陆网站查看了!

    简单实例

    获取湖南公务员考试网上新发布的招考信息
    解决思路:获得该网站的rss订阅源,订阅源有更新时自动发一封邮件到指定邮箱。但是该网站并没有提供rss订阅地址,我们需要通过Feed43自制一个rss feed,再利用IFTTT进行邮件推送。
    所需工具:Feed43、IFTTT
    前置知识:需要了解一点html知识

    解决措施

    步骤一、获取订阅源——Feed43

    登陆 Feed43,单击 Create your own feed 进入

    • ① 输入页面地址:http://www.gkz6.net/baokao/
    • ② 输入页面编码:gb2312。单击 Reload,可看到Step2 。
      Step 1. Specify source page address (URL) 我们的目的是检测招考信息的增加,所以找到招考信息链接代码:
      Step 2. Define extraction rules
    • ③ 输入搜索范围:<ul id="alist">{%}</ul>。可不填,不填会搜索整个页面。

    网页上的招考信息链接有很多条,我们可以发现它们的代码都是类似的,归纳总结后,定义模板如下:

    • ④ 输入条目搜索规则:

    <li><div><a href="{%}">{%}</a>{*}</small>{%}</em> {%}</div></li>

    3-4步的意思是:在<ul id="alist"></ul>块状元素范围内,找到<li><div><a,让紧跟的 href 双引号内容成为第一个参数,<a>标签的文本内容成为第二个参数,</small>前面的内容任意,</em>前的内容成为第三个参数,</div>前的内容成为第四个参数。{%}代替你希望得到的信息,比如招考信息标题,发布时间等;{}代替任意内容。*

    单击 Extract,得到如下Item

    Step2 Extract后
    • ⑤ 输入条目的标题格式:{%2}({%4}){%3}
    • ⑥ 输入条目的链接地址:{%1}
    Step 3. Define output format
    单击 Preview 后的页面表现为:

    步骤二、订阅源的更新发送到邮箱——IFTTT

    突然不想写了呢。简单提一下,IFTTT的机制是“if this then that”,进入网站后,傻瓜式操作——“if RSS更新 then Email”,订阅源更新时,IFTTT就会把更新内容发你在IFTTT的注册邮箱了。


    当然,步骤一中,实际操作时会碰见不少问题,例如:

    • 在第①步时,怎样选取一个最合适的页面。网站主页上有招考信息,从主页上点进“更多招考信息”的页面上也有招考信息,选取哪一个最有利于后续的RSS化呢?
    • 在第②步时,如何知道该页面的Encoding是什么?Encoding就是页面<meta>标签里的charset属性的值,按F12可查看页面的html编码。
    • ③、④步定义模板规则是重难点,只可意会,不可言传。一点经验之谈是:先用{%}替换你希望得到的内容,再运用好{*}对html代码的替换。以后我会多上传几个例子让大家自己体会。

    下次再写一个复杂一点的案例:当所需内容在<iframe>元素里时该怎么办?Feed43无法直接从<iframe>里提取item。比如实现这个功能:当湖南会计信息网发布会计从业资格证报考讯息时给我发邮件。

    相关文章

      网友评论

      本文标题:“当网站内容有更新时发邮件提醒我”——利用feed43&

      本文链接:https://www.haomeiwen.com/subject/ijribttx.html