爬虫：mitmproxy 获取京东APP 数据

作者: dex0423 | 来源:发表于2019-12-30 23:14 被阅读0次

爬虫：mitmproxy 获取京东APP 数据
iOS免费抓包工具mitmproxy使用备忘
4. 爬虫必备利器、抓包工具的使用
学习网址
【Python】Python3网络爬虫实战-6、APP爬取相关库
爬虫：使用mitmproxy抓包手机APP的配置步骤
爬虫、反爬虫与突破反爬虫
爬虫的概念
2w爬虫课程总结笔记
【Python爬虫】-爬出原理

配置 mitmproxy

编辑 script.py 文件

script.py 是用来处理 mitmproxy 获取到的 request 和 response 的 .py 脚本；
用户根据业务需求，在该文件中筛选、处理 request 和 response ；
本文模拟的获取 京东APP 数据，需要筛选出 url 包含 jd 字符的请求和响应；

import json
from urllib.parse import unquote
import re

def response(flow):
    # 提取请求的 url 地址
    request_url = flow.request.url
    # 通过 jd 字符串，过滤出 京东APP 的请求和返回数据
    if bool(re.search(r"jd", request_url)):     
        print("request_url >>> ", request_url)
        response_body = flow.response.text
        response_url = flow.request.url
        print("response_url >>> ", response_url)
        data = json.loads(response_body)
        ware_infos = data.get("wareInfo")
        goods_info = {}
        if ware_infos is not None:
            for ware_info in ware_infos:
                goods_info["wareId"]    = ware_info.get("wareId")
                goods_info["wname"]     = ware_info.get("wname")
                goods_info["jdPrice"]   = ware_info.get("jdPrice")
                goods_info["goodrate"]  = ware_info.get("good")
                goods_info["reviews"]   = ware_info.get("reviews")
                goods_info["shopId"]    = ware_info.get("shopId")
                goods_info["ShopName"]  = ware_info.get("goodShop").get("goodShopName")
                print(goods_info)

运行 script.py 文件

进入 script.py 文件所在文件夹

cd /XXX   # 进入 script.py 文件所在文件夹
mitmdump -s script.py

image.png

启动京东APP

注意：如果手机尚未配置好，请参考本博另一篇文章：[爬虫]使用mitmproxy抓包手机APP的配置步骤

启动 APP
启动京东APP 后，命令行窗口得到下图所示返回信息，数据获取成功。

image.png

联系博主：下为博主微信，欢迎骚扰

image.png

网友评论

Python3自学爬虫实战

本文标题：爬虫：mitmproxy 获取京东APP 数据

本文链接：https://www.haomeiwen.com/subject/igjvoctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

爬虫：mitmproxy 获取京东APP 数据

配置 mitmproxy

编辑 script.py 文件

运行 script.py 文件

启动京东APP

相关文章

爬虫：mitmproxy 获取京东APP 数据

iOS免费抓包工具mitmproxy使用备忘

4. 爬虫必备利器、抓包工具的使用

学习网址

【Python】Python3网络爬虫实战-6、APP爬取相关库

爬虫：使用mitmproxy抓包手机APP的配置步骤

爬虫、反爬虫与突破反爬虫

爬虫的概念

2w爬虫课程总结笔记

【Python爬虫】-爬出原理

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python3自学爬虫实战

爬虫：mitmproxy 获取 京东APP 数据

配置 mitmproxy

编辑 script.py 文件

运行 script.py 文件

启动 京东APP

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

爬虫：mitmproxy 获取京东APP 数据

启动京东APP