2018-04-10

作者: 1367bfee4461 | 来源:发表于2018-04-10 01:32 被阅读0次

    一、什么是cURL

            1. cURL (Client URL Library Functions) 由Daniel Stenberg 创建

    2. 官方定义 : curl is a command line tool for transferring data with URL syntax 释义:使用URL语法传输数据的命令行工具

    3. 笼统总结 : curl是客户端向服务器请求资源的工具

    二、cURL的使用场景

    1. 网页资源                            (编写爬虫 新闻、购物等... ...)

    2. WebService 数据接口资源    (接口数据 天气、号码归属地... ...)

    3. FTP 服务器里面的文件资源   (文件下载)

    4. 其他资源                           (所有网络上的资源都可以用curl去访问和下载到---强大之处)

    三、在PHP中使用cURL

            1. 确认PHP支持cURL

     -Windows 确认方式:win+R 》cmd 》 php -i/m 》显示出所有PHP的设置 》在cmd中右键鼠标‘编辑-查找’ cURL 》如果查找到(cURL support)说明支持

    注 php -i 出错可能是环境变量导致 自行脑补 不再叙述

     -Linux 确认方式: xshell连接Linux,命令行输入 ‘php -i | grep cURL’。 如果看到cURL support=enabled 和 cURL Information 版本信息 说明支持

                         -通用方式:phpinfo() 查看 curl

                       -如果不支持:百度PHP Windows/Linux cURL 方法解决

    2.cURL操作步骤解析

                    客户端: 初始化curl    ->    向服务器发送请求    ->    接收服务器数据    ->    关闭curl

         curl_init()                             发送和接收之间是靠curl_exec()执行                       curl_close()

    三、cURL实战 

        1.用cURL做一个简单的网页爬虫

                    代码:

    $curl=curl_init("http://www.baidu.com");                 # 初始化

    curl_exec($curl); # 执行

    curl_close($curl); # 关闭curl

                                ?>

                    新需求:用cURL抓取网页信息并替换部分内容(将百度 替换为 ‘阿里巴巴’)

    $curlobj = curl_init(); #初始化

    curl_setopt($curlobj, CURLOPT_URL, "http://www.baidu.com"); #设置访问网页的URL地址

    curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #执行之后不用直接打印出来

    $output = curl_exec($curlobj); # 执行

    curl_close($curlobj); # 关闭 curl

    // echo str_replace("百度", "阿里巴巴", $output); #替换

    // echo str_replace("新闻", "阿里巴巴", $output); #替换

    echo str_replace("地图", "阿里巴巴", $output); #替换

        2.用cURL获取天气信息

    $data = "theCityName=兰州"; # 多个地址用 & 符号即可

    $curlobj =curl_init();

    curl_setopt($curlobj, CURLOPT_URL, "http://www.webxml.com.cn/WebServices/WeatherWebService.asmx/getWeatherbyCityName"); # 获取的路径

    curl_setopt($curlobj, CURLOPT_HEADER, 0);

    curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, 1);

    curl_setopt ($ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']);  # 解决为将对象引用设置到对象的实例问题

    curl_setopt($curlobj, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36');   # 解决为将对象引用设置到对象的实例问题

    curl_setopt($curlobj, CURLOPT_POST, 1);

    curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);

    curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded;charset=utf8","Content-length:".strlen($data))); # 设置编码格式 长度

    $rtn = curl_exec($curlobj);

    if (!curl_errno($curlobj)) {

    echo $rtn;

    } else {

    echo 'Curl 错误:'.curl_error($curlobj);

    }

    curl_close($curlobj);

        3.用cURL操作 ftp 服务器中的数据

    loding...

        4.用cURL访问 https 资源

     /**

    * 代码实例 -PHP-cURL实战

    * 实例描述:下载网络上面的一个HTTPS的资源

    *       注意 

    */

    $curlobj = curl_init();

    curl_setopt($curlobj, CURLOPT_URL, "https://ajax.aspnetcdn.com/ajax/jquery.validate/1.12.0/jquery.validate.js"); # 设置访问的页面

    curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); #执行之后不打印出来

    date_default_timezone_set('PRC'); # 使用Cookie时,必须先设时区

    curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, 0); # 终止服务器端进行验证

    $output = curl_exec($curlobj);

    curl_close($curlobj);

    echo $output;

        5.用cURL模拟登录后获取数据

    /**

    * 代码实例 -PHP-cURL实战

    * 实例描述:用cURL登录网站并且下载个人空间内容    (以慕课网为例)

    *  注意

    */

    $data = 'username=此处填写对应网站能够登录的用户名&password=登录密码&remember=1';

    $curlobj = curl_init(); # 初始化

    curl_setopt($curlobj, CURLOPT_URL, "https://m.imooc.com/account/login");# 设置访问网页的URL

    curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true); # 执行之后不直接打印出来

    // Cookie 相关设置,这部分设置需要在所有的会话开始之前就设置

    date_default_timezone_set('PRC'); # 使用cookie时 必须先设置时区

    curl_setopt($curlobj, CURLOPT_SSL_VERIFYPEER, FALSE);

    curl_setopt($curlobj, CURLOPT_SSL_VERIFYHOST, FALSE);

    curl_setopt($curlobj, CURLOPT_COOKIESESSION, true);

    curl_setopt($curlobj, CURLOPT_COOKIEFILE, "cookiefile");

    curl_setopt($curlobj, CURLOPT_COOKIEJAR, "cookiefile");

    curl_setopt($curlobj, CURLOPT_COOKIE, session_name() . '=' . session_id());

    curl_setopt($curlobj, CURLOPT_HEADER, 0);

    curl_setopt($curlobj, CURLOPT_FOLLOWLOCATION, 1); #能够让cURL支持饿页面链接跳转

    curl_setopt($curlobj, CURLOPT_POST, 1);

    curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);

    curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded; charset=utf-8","Content-length: ".strlen($data)));

    curl_exec($curlobj); # 执行

    curl_setopt($curlobj, CURLOPT_URL, "https://www.imooc.com/u/1893790");

    curl_setopt($curlobj, CURLOPT_POST, 0);

    curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("Content-type:text/xml"));

    $output=curl_exec($curlobj);

    curl_close($curlobj);

    echo $output;

    相关文章

      网友评论

        本文标题:2018-04-10

        本文链接:https://www.haomeiwen.com/subject/gyzwhftx.html