建立连接 client = pymongo.MongoClient(host="localhost",port=2...[作者空间]
连接数据库 db=pymysql.connect(host=" ", user=" ",password=" ",...[作者空间]
.txt文件 file = opne(文件名,打开方式,[编码格式]) file.write() file.clo...[作者空间]
pyquery借助于CSS选择器的强大功能 用类PyQuery对要解析的文本进行初始化 find() 符合条件的所...[作者空间]
Beautiful Soup是python官方的一个解析库,提供了许多方法,感觉用起来比较方便顺手 一般使用第三方...[作者空间]
lxml库里的etree模块 etree.HTML() 进行初始化,构造解析对象 etree.tostring()...[作者空间]
正则表达式的规则不多赘述,主要记录re库里一些函数的用法 1.match() 从字符串的开头进行匹配 提取匹配的字...[作者空间]
1.get() 参数:url,params,headers 返回属性text 为str类型 content为byt...[作者空间]
其实学习爬虫也挺简单,主要就是三个步骤 1.抓取网页 2.分析网页 3.保存数据 抓取网页 urllib库 url...[作者空间]