美文网首页其他记录
APK 批量爬取脚本(应用宝和360市场)

APK 批量爬取脚本(应用宝和360市场)

作者: 鸣人的大哥 | 来源:发表于2019-11-18 14:18 被阅读0次
  • python脚本批量下载apk文件(应用宝和360市场)
    360安卓市场下载 2000个,应用宝2000个
  • 代码中的下载路径自行更改
  • 运行截图


    image.png
  • 代码如下
# -*- coding: utf-8 -*-
 
import re
import urllib
import os


class class_360:
    def __init__(self):
        self.urllist=[]
        self.baseurl='http://zhushou.360.cn/list/index/cid/1?page='
    def geturl(self,pageindex):
        for i in range(35,pageindex):
            self.urllist.append(self.baseurl+str(i))
    def spider(self):
        for i in range(len(self.urllist)):
            response=urllib.urlopen(self.urllist[i])
            html=response.read()
            link_list=re.findall(r"(?<=&url=).*?apk",html)
            for url in link_list:
                file_name = url.split('/')[-1]
                # print file_name

                file_path=os.path.join("/tmp",file_name)
                print 'DOWNLOADING : ' + file_path
                urllib.urlretrieve(url,file_path)

    def start(self):
        self.geturl(40)
        self.spider()
        
class class_YYB:
    def __init__(self):
        self.urllist=[]
        self.baseurl='https://android.myapp.com/myapp/category.htm?orgame=1&categoryId='
    def geturl(self,pageindex):
        for i in range(100,pageindex):
            self.urllist.append(self.baseurl+str(i))
    def spider(self):
        for i in range(len(self.urllist)):
            response=urllib.urlopen(self.urllist[i])
            html=response.readlines()
            link_list = []
            for i in range(len(html)):
                if 'ex_url' in html[i]:
                    tmp = html[i].split('ex_url="')[1]
                    tmp = tmp.split('"')[0]
                    link_list.append(tmp)

            for url in link_list:
                file_name = url.split('=')[1]
                file_name = file_name.split('&')[0]
                # print file_name

                file_path=os.path.join("/tmp",file_name)
                print 'DOWNLOADING : ' + file_path
                urllib.urlretrieve(url,file_path)

    def start(self):
        self.geturl(122)
        self.spider()
        
if __name__ == '__main__':

    # # 360 应用市场
    # a=class_360()
    # a.start()

    # 应用宝
    b=class_YYB()
    b.start()




相关文章

网友评论

    本文标题:APK 批量爬取脚本(应用宝和360市场)

    本文链接:https://www.haomeiwen.com/subject/uozvictx.html