本篇呢,本来打算写一下,pipeline里面的ResultItems对象,但是呢,简单看了一下,里面东西不是很多。所以呢,我这次说,这个selectable 对象,也就是节点对象,就想jsoup里面element对象.不过呢,这个对象内容较多所以,我们就只看一下他的接口,而不去看他的很多个实现类了!

前面呢,我们说过webmagic呢,是一个集成了jquery选择器,css选择器,跟正则选择器,xpath,正则选择器,等诸多选择器于一身的爬虫框架,而我们在这里的时候呢,就蛀牙看看他们的使用方法!
public Selectable xpath(String xpath);//xpath选择器
public Selectable $(String selector);//jquery选择器
public Selectable $(String selector, String attrName);//jquery选择器
public Selectable css(String selector);//css选择器器
public Selectable css(String selector, String attrName);//css选择器
public Selectable smartContent();//智能内容
public Selectable links();//获取整个页面的所有的连接
public Selectable regex(String regex);//正则表达式获取数据
public Selectable regex(String regex, int group);//正则表达式获取数据
public Selectable replace(String regex, String replacement);//正则表达式字符串你替换
public String toString();//转成string
public String get();//获取字符串
public boolean match();//判断是否正确,一般跟正则表达式混用
public List all();// 获取字符串类型 的list
public Selectable jsonPath(String jsonPath);//使用jsonPath 来获取数据
public Selectable select(Selector selector);//查询某个节点 没用过
public Selectable selectList(Selector selector);//查询每个节点 没用过
public List nodes();//获取内部是节点的List
以上呢,就是SelectTable 的一些方法,已经我所知道的某些方法,关于那些我没有使用过的方法,欢迎哥哥大佬,为我指点一下,告诉我这些方法还怎么使用!
网友评论