用cheerio爬取某小说网站数据时,出现中文乱码问题,这里记录一下解决方法.
1 查看网站编码
按f12查看网站源文件,然后搜索charset, 后面的内容就是该网站的编码,如下图, 可知该网站编码为'gbk'.

2 使用如下两个库
(1) request 用于发起http请求
- 重点在于options内一定要配置encoding.
options = {
url: 'https://m.biquge5200.cc/',
encoding: null,
}
(2) iconv 用于转码, 使用方法如下
const iconv = require('iconv-lite');
iconv.decode(
html, // request请求的返回值
'gbk' // 第一步查看到的网页编码
);
最终结果


网友评论