美文网首页
一道ISCC题引申的PHP正则复习

一道ISCC题引申的PHP正则复习

作者: 云勺 | 来源:发表于2018-05-15 12:36 被阅读0次

    iscc中的一道web题“试试看”,描述为随意开火


    image.png

    起初看url,以为是一道常规的文件包含题,后面试了很多方法都出不来
    最后受到其他师傅的启发才得到payload
    这里有两种payload都可以

    http://118.190.152.202:8006/show.php?img=php://filter/resource=1.jpg/resource=show.php
    
    http://118.190.152.202:8006/show.php?img=php://filter/resource=show.php|jpg
    
    image.png
    image.png

    对这道题目的匹配规则很感兴趣,在本地搭建进行仔细分析,也是对正则以及php函数的复习
    在审计代码之前,先复习一下php的preg_match、strpos和file_get_contents等函数

    1、preg_match函数用于正则匹配,第一个参数是要匹配的正则规则,第二个参数是被匹配的字符串。后面的可选参数中,$matches是一个数组,用于返回匹配的字符串结果

    # preg_match
    (PHP 4, PHP 5, PHP 7)
    preg_match — 执行匹配正则表达式
    ### 说明
    int **preg_match** ( string `$pattern` , string `$subject` [, array `&$matches` [, int `$flags` = 0 [, int`$offset` = 0 ]]] )
    搜索`subject`与`pattern`给定的正则表达式的一个匹配.
    

    2、strpos函数用于字符串查找,如果找到则返回位置,位置从0开始计算。如果没有找到则返回false

    # strpos
    (PHP 4, PHP 5, PHP 7)
    strpos — 查找字符串首次出现的位置
    ### 说明
    int **strpos** ( string `$haystack` , [mixed]`$needle` [, int `$offset` = 0 ] )
    返回 `needle` 在 `haystack` 中首次出现的数字位置。
    如果提供了参数matches,它将被填充为搜索结果。 $matches[0]将包含完整模式匹配到的文本, $matches[1] 将包含第一个捕获子组匹配到的文本,以此类推。
    

    3、file_get_contents函数用于文本读取,可以获得文件内容,它更强大的地方在于可以通过http协议抓取内容

    # file_get_contents
    (PHP 4 >= 4.3.0, PHP 5, PHP 7)
    file_get_contents — 将整个文件读入一个字符串
    ### 说明
    string **file_get_contents** ( string `$filename` [, bool `$use_include_path` = false [, resource`$context` [, int `$offset` = -1 [, int `$maxlen` ]]]] )
    
    和 file()一样,只除了 **file_get_contents()** 把文件读入一个字符串。将在参数 `offset` 所指定的位置开始读取长度为`maxlen` 的内容。如果失败,**file_get_contents()** 将返回 **`FALSE`**。
    
    **file_get_contents()** 函数是用来将文件的内容读入到一个字符串中的首选方法。如果操作系统支持还会使用内存映射技术来增强性能。
    > **Note**:
    > 
    > 如果要打开有特殊字符的 URL (比如说有空格),就需要使用 [urlencode()]进行 URL 编码。
    
    

    本题中,经过注释和改造后的主要代码如下

    show.php
    <?php
    error_reporting(0);
    ini_set('display_errors','Off');
    
    include('config.php');
    
    $img = $_GET['img'];
    if(isset($img) && !empty($img))
    {
        if(strpos($img,'jpg') !== false)
        {        
            // strpos拿'resource='到$img中查找,如果匹配到了则前者为真;注意这里是全等
            // 如果没有匹配到'/resource=.*jpg/i'正则模式则后者为真;
            if(strpos($img,'resource=') !== false && preg_match('/resource=.*jpg/i',$img) === 0)
            {
                //满足上述两种情况,返回找不到文件
                die('File not found.');
            }
            // 再次进行正则匹配,如果以php://filter开头,并且字符串中存在resource=加上任意不包含|的字符串
            // 对$img进行左右两边空白或者预定符号的删除,最后匹配结果存到$matches数组
            preg_match('/^php:\/\/filter.*resource=([^|]*)/i',trim($img),$matches);
            // $matches[0]将包含完整模式匹配到的文本, $matches[1] 将包含第一个捕获子组匹配到的文本,以此类推。
            var_dump($matches);
            if(isset($matches[1]))
            {
                $img = $matches[1];
            }
            echo "<br>";
            echo $img;
            header('Content-Type: image/jpeg');
            // 关键函数get_contents,去获得文件内容
            $data = get_contents($img);
            echo $data;
        }
        else
        {
            die('File not found.');
        }
    
    }
    else
    {
        ?>
        <img src="1.jpg">
        <?php
    }
    ?>    
    
    config.php
    <?php  
    // 关键函数get_contents,去获得文件内容
    function get_contents($img)
    {
        // 如果$img中存在'jpg',返回$img文件内容
        if(strpos($img,'jpg') !== false)
        {
            return file_get_contents($img);
        }
        // 否则返回$img的同时,设置返回头为hmtl
        else
        {
            header('Content-Type: text/html');
            return file_get_contents($img);
        }
    }
    ?>  
    

    这里通过实际payload在执行中的流程,对关键地方进行输出,方便分析和查看结果

    0x01

    首先分析show.php?img=php://filter/resource=config.php|jpg

    逻辑中的第一个涉及preg_match的if语句中,只有在传入的$img中匹配到"resource="的同时,preg_match中$img匹配规则"/resource=.*jpg/i"匹配不到的情况下成立
    在这里不会对payload形成影响
    关键点在接下来的正则匹配

    // 再次进行正则匹配,如果以php://filter开头,并且字符串中存在resource=加上任意不包含|的字符串
            // 对$img进行左右两边空白或者预定符号的删除,最后匹配结果存到$matches数组
            preg_match('/^php:\/\/filter.*resource=([^|]*)/i',trim($img),$matches);
            // $matches[0]将包含完整模式匹配到的文本, $matches[1] 将包含第一个捕获子组匹配到的文本,以此类推。
            var_dump($matches);
            if(isset($matches[1]))
            {
                $img = $matches[1];
            }
            echo "<br>";
            echo $img;
            // header('Content-Type: image/jpeg');
            // 关键函数get_contents,去获得文件内容
            $data = get_contents($img);
            echo $data;
    

    可以看到,匹配规则是要求以php://filter开头,并且字符串中存在resource=加上任意不包含|的字符串
    ([^|]*)代表的意思就是排除|以外的字符,允许重复零次或多次,圆括号包裹则表示这是一个匹配的文本子组
    匹配的结果保存在$matches数组中,并且$img会被覆盖为$matches的第2个元素
    这里的关键在于$matches的第二个元素内容,第二个元素内容是圆括号包裹的([^|]*)子组的内容

    image.png
    经过正则后,$img已经被覆盖,内容为config.php
    在config.php中,将通过函数file_get_contents($img)去获取指定文件内容并且返回
        // 如果$img中存在'jpg',返回$img文件内容
        if(strpos($img,'jpg') !== false)
        {
            return file_get_contents($img);
        }
        // 否则返回$img的同时,设置返回头为hmtl
        else
        {
            header('Content-Type: text/html');
            return file_get_contents($img);
        }
    
    0x02

    接下来分析show.php?img=php://filter/resource=1.jpg/resource=config.php
    其他流程和上面的一样,只要字符串中包含jpg就可以,关键在于

    preg_match('/^php:\/\/filter.*resource=([^|]*)/i',trim($img),$matches);
    

    payload进去之后的匹配结果将是后面一个resource=config.php,而不是resource=1.jpg,因此拿到的$matches的第二个元素也是config.php!

    image.png

    相关文章

      网友评论

          本文标题:一道ISCC题引申的PHP正则复习

          本文链接:https://www.haomeiwen.com/subject/wpuedftx.html