基础方法

作者: iA_Ai | 来源:发表于2018-01-03 12:09 被阅读0次

mongoose使用之查询篇
判断文件时间
基础方法
手机号正则表达式验证
化学平衡
Android 自定义控件基础
python基础之os.system函数
张嵩老师，幽默语言让我爱上英语
JQuery写拓展
Java基础方法7(Math.random())

1.抽取方法:

"value_handle": [# 内容处理

{

"name":"extract",

"regex":"(低|中|高|地下)楼层?",

"value":""

},

],

2.父子路由：

"url_page": {

"seed_urls": {

"field": "seed_urls", # 字段名称

"depict": "种子url",

"status": True, # 是否禁用

"type": [], # list # 字段类型

"select": "xpath", # 提取方式

"deep": False,

"split": True,

"regex": "//div[@class='section']/div", # 提取规则

"child": {

"seed_url": {

"field": "seed_url", # 字段名称

"depict": "种子url",

"status": True, # 是否禁用

"type": "", # list # 字段类型

"select": "xpath", # 提取方式

"deep": False,

"split": True,

"regex": "//h4[@class='house-title']/a/@href", # 提取规则

"value_handle": [ # 内容处理

{

"name": "urljoin"

}

],

},

"house_floor": {

"field": "house_floor", # 字段名称

"depict": "所在楼层",

"status": True, # 是否禁用

"type": "", # 字段类型

# "separator": "", # list->str 分隔符默认按","分割

"select": "xpath", # 提取方式

"deep": False,

"split": True,

"regex": "//p[@class='house-txt'][1]/text()[2]", # 提取规则

"value_handle": [ # 内容处理

],

},

"thumbnails": {

"field": "thumbnails", # 字段名称

"depict": "缩略图",

"status": True, # 是否禁用

"type": "", # list # 字段类型

"select": "xpath", # 提取方式//ul[@class='listUl']/li/div[@class='img_list']/a/img/@src

"deep": False,

"split": True,

"regex": "//img[@class='lazy']/@data-original", # 提取规则

"value_handle": [ # 内容处理

],

},

"house_title": {

"field": "house_title", # 字段名称

"depict": "房源标题",

"status": True, # 是否禁用

"type": "", # list # 字段类

网友评论

本文标题：基础方法

本文链接：https://www.haomeiwen.com/subject/btdhnxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

基础方法

相关文章

mongoose使用之查询篇

判断文件时间

基础方法

手机号正则表达式验证

化学平衡

Android 自定义控件基础

python基础之os.system函数

张嵩老师，幽默语言让我爱上英语

JQuery写拓展

Java基础方法7(Math.random())

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读