美文网首页
get_headers

get_headers

作者: answer6 | 来源:发表于2020-11-11 09:52 被阅读0次

采集数据的时候需要抓取第三方的数据,有的资源被重定向,重定向的地址需要再做进一步的判断。
自己用get_headers函数检测了下,发现有多个状态码,才有所了解。


代码示例
/**
 * 递归检测url重定向地址, 直到重定向到rule所指地址
 * 返回该地址
 *
 * @param string $url 待检测的地址
 * @param string $rule 匹配的地址
 * @return mixed
 */
function redirect($url, $rule = 'https://www.google.com/')
{
    $header = get_headers($url, 1);
    //print_r($header);
    // 检测第一个数组元素 是不是被重定向 如果被重定向的话再做下一步
    if (strpos($header[0], '301') !== false || strpos($header[0], '302') !== false) {
        // 检测到跳转
        if (array_key_exists('Set-Cookie', $header)) {
            // 检测到cookie, 进行设置
            $cookies = $header['Set-Cookie'];
            foreach ($cookies as $k => $v) {
                header('Set-Cookie: ' . $v);
            }
        }
        if (array_key_exists('Location', $header)) {
            $url = $header['Location'];
            if (is_array($url)) {
                foreach ($url as $k => $v) {
                    if (strpos($v, $rule) !== false) {
                        // 跳转地址与$rule匹配, 返回该地址
                        return $v;
                    } else {
                        // 不匹配则访问一次中转网址
                        file_get_contents($v);
                    }
                }
            } else {
                if (strpos($url, $rule) !== false) {
                    // 跳转地址与$rule匹配, 返回该地址
                    return $url;
                }
            }
        }
    }
    return false;
}

相关文章

  • get_headers

    采集数据的时候需要抓取第三方的数据,有的资源被重定向,重定向的地址需要再做进一步的判断。自己用get_header...

  • php curl 替换 get_headers 函数

    get_headers 获取远程URL头信息。如果遇到需要设置超时的话, 需要使用 stream_context_...

网友评论

      本文标题:get_headers

      本文链接:https://www.haomeiwen.com/subject/mcfebktx.html