美文网首页
Pholcus动态规则示例(翻译)

Pholcus动态规则示例(翻译)

作者: 简书却又不简 | 来源:发表于2016-11-17 14:15 被阅读0次

特点:动态加载规则,无需重新编译软件,书写简单,添加自由,适用于轻量级的采集项目

xxx.pholcus.html

<Spider>
    <Name>HTML动态规则示例</Name>
    <DeScription>HTML动态规则示例 [Auto Page] [http://xxx.xxx.xxx]</DeScription>
    <Pausetime>300</Pausetime>
    <EnableLimit>false</EnableLimit>
    <EnableCookie>true</EnableCookie>
    <EnableKeyin>false</EnableKeyin>
    <NotDefaultField>false</NotDefaultField>
    <Namespace>
        <Script></Script>
    </Namespace>
    <SubNamespace>
        <Script></Script>
    </SubNamespace>
    <Root>
        <Script param="ctx">
        console.log("Root");
        ctx.JsAddQueue({
            Url: "http://xxx.xxx.xxx",
            Rule: "登录页"
        });
        </Script>
    </Root>
    <Rule name="登录页">
        <AidFunc>
            <Script param="ctx,aid">
            </Script>
        </AidFunc>
        <ParseFunc>
            <Script param="ctx">
            console.log(ctx.GetRuleName());
            ctx.JsAddQueue({
                Url: "http://xxx.xxx.xxx",
                Rule: "登录后",
                Method: "POST",
                PostData: "username=44444444@qq.com&amp;password=44444444&amp;login_btn=login_btn&amp;submit=login_btn"
            });
            </Script>
        </ParseFunc>
    </Rule>
    <Rule name="登录后">
        <ParseFunc>
            <Script param="ctx">
            console.log(ctx.GetRuleName());
            ctx.Output({
                "全部": ctx.GetText()
            });
            ctx.JsAddQueue({
                Url: "http://accounts.xxx.xxx/member",
                Rule: "个人中心",
                Header: {
                    "Referer": [ctx.GetUrl()]
                }
            });
            </Script>
        </ParseFunc>
    </Rule>
    <Rule name="个人中心">
        <ParseFunc>
            <Script param="ctx">
            console.log("个人中心: " + ctx.GetRuleName());
            ctx.Output({
                "全部": ctx.GetText()
            });
            </Script>
        </ParseFunc>
    </Rule>
</Spider>

Tag:翻译

<Spider>:蜘蛛🕷️
<DeScription>:描述
<Pausetime>:停顿时间
<EnableLimit>:启用限制
<EnableCookie>:启用浏览器缓存
<EnableKeyin>:键盘录入
<NotDefaultField>:不是默认字段
<Namespace>:名称空间
<SubNamespace>:次级名称空间
<Root>:根
<Rule>:管辖
<AidFunc>:帮助Func
<ParseFunc>:解析Func

javascript:翻译

param:参数
JsAddQueue():js添加队列
GetRuleName():获取管辖名称
Output ():输出

文章摘自:github /作者:henrylee

相关文章

  • Pholcus动态规则示例(翻译)

    特点:动态加载规则,无需重新编译软件,书写简单,添加自由,适用于轻量级的采集项目 xxx.pholcus.html...

  • 翻译示例

    新款奥林巴斯相机PEN 使用50年前复古设计 作者 Pete Pachal 题图:新旗舰款PEN 奥林巴斯PEN ...

  • mockjs可以@什么

    mockjs的生成规则: 示例1: 示例2:

  • Redis常用命令

    字符串 设置字符串键值对 规则 示例 批量设置字符串键值对 规则 示例 获取字符串 规则 示例 批量设置字符串 规...

  • 11、canvas动态画圆

    canvas动态画圆,示例:

  • 逻辑判断(翻译推理)

    翻译推理 一、翻译规则之“前推后” 二、推理规则之“逆否等价” 三、翻译规则之“后→前” 四、且和或 五、推理规则...

  • IIS7.5 URL重写

    示例: 规则1匹配示例:http://localhost/6001 注意事项: 1,如果导入、添加、修改规则后不生...

  • springboot jpa JpaSpecificationE

    示例一 Spring Data JPA之JpaSpecificationExecutor复杂动态查询实例 示例二 ...

  • 编码规则

    订单编码规则:规则:yymmdd + 7位流水 单日上限近千万示例:2108030000001 部门编码规则:规则...

  • Json Path

    安装 语法规则 代码示例

网友评论

      本文标题:Pholcus动态规则示例(翻译)

      本文链接:https://www.haomeiwen.com/subject/goedpttx.html