美文网首页
php之phpQuery使用来做爬虫

php之phpQuery使用来做爬虫

作者: 黑小马_ | 来源:发表于2018-10-04 22:35 被阅读0次

phpQuery是一个开源的项目,一句话好用太好用了,虽然我是一个专业的Java程序员但是平时喜欢玩玩php,以前的web框架到WorkerMan,以及硬件相关内容,我用过Java的JSoup,这个phpQuery和他太像了,哎,真香,
我们这次举例使用phpQuery,爬去斗图啦图片
第一步需要下载phpQuery
http://www.zixuephp.net/uploads/file/20171017/1508224720414417.zip
github上也有
然后留下核心,phpQuery

深度截图_选择区域_20181004222128.png
$eg1=phpQuery::newDocumentFile("http://www.baidu.com");
$html="<div>
        <ul>
            <li>第一行</li>
            <li>第二行</li>
        </ul>
       </div";
$eg2=phpQuery::newDocument($html);

以上算是实例化,一个对象,可以传入网址,或者内容
然后就是厉害的pq选择器,写选择器就像写css一样
/* 基本选择器*/

1)  #id                     pq("#myDiv");
2)  element                 pq("div"); 
3)  .class                  pq(".myClass"); 
4)  *                       pq("*") 
5)  selector1,selectorN     pq("div,span,p.myClass")

然后举例看我的代码


深度截图_选择区域_20181004222728.png

直接通过标签元素提取数据

深度截图_选择区域_20181004222831.png

通过类选择器提取数据,然后循环遍历,
程序运行效果如图:


深度截图_选择区域_20181004223102.png

本程序需要在php_cli模式下运行
https://pan.baidu.com/s/1gU20Kg4_QR4kkNGsqTXDtA

相关文章

网友评论

      本文标题:php之phpQuery使用来做爬虫

      本文链接:https://www.haomeiwen.com/subject/rcrfaftx.html