①抓数据前先看html页面的字符集 utf-8/gbk/gb2312
②如果是utf8 在cmd下看会乱码 但是不影响逻辑判断和插入数据库
如果requests请求的话 :
r=requests.get(urls)
解析utf8字符集
c=pq(r.content.decode('utf8',"ignore"))
设置编码utf8
no_search=no_search.encode("utf8")
③如果是gbk/gb2312的话
r=requests.get(final_url)
解析gbk字符集
d=pq(r.content.decode('gbk',"ignore"))
编码utf8
xx=xx.encode('utf8')
注意如果还是乱码的话 在decode解析utf8就行
网友评论