功能、效果说明
之前就有考虑过做一个小红书单个笔记的数据采集的功能。
笔记页面有图片、标题、描述信息、评论。
如若存在其他信息:地点、话题、艾特用户等。后续也会将此类信息归纳整理。
这个功能完整版包含了
- 采集下载所有图片到指定目录。
- 笔记描述保存成文本数据文件。
- 评论单独保存为一个文本数据文件。
效果演示
请求笔记详情页的接口可以获得以下数据。
![](https://img.haomeiwen.com/i12827390/19c72b876d469f3f.png)
写入到csv文件的数据结构大概如下图所示。
![](https://img.haomeiwen.com/i12827390/034c1914b377ac8d.png)
实现思路
先前有做过小红书关键词采集功能。
在那个功能中,我可以获得笔记基础信息。
在采集结果文件中有笔记的id
。
我们只需要把id
加上url
前缀,就可以拿到指定笔记页面主要的数据。
再借助程序,采集该页面的数据即可。
实现代码
以下是获取笔记数据并写入csv文件的相关代码。
![](https://img.haomeiwen.com/i12827390/efe1fa968e43d949.png)
实现原理
用request
模拟get
请求小红书微信端的笔记详情接口。
就可以拿到所有的笔记详情页的基础数据。
用csv简单处理数据,将所有数据写入到csv
文件中。
这个保存了笔记详情页数据的文件可以用于后续完整功能的编写。
总结与拓展
采集单个小红书笔记有助于我们对高赞高质量笔记进行内容分析。
对于内容运营者的我们,可以学习他们优秀的地方。
只有知己知彼方能百战不殆。
希望这个点子能帮助你我创作出更优质的小红书笔记。
网友评论