week14总结:
围绕selenium学了不少东西,起初的想法很简单:通过selenium做一个自动化的脚本,能看看文章和视频就可以,但实际操作起来发现没那么简单……
首先是登陆问题,通过保存加载cookies的方法行不通,因为目标网站的cookies有效时间很短,因此每次只能通过扫二维码登陆,但是如何获取二维码有花了不少时间:
一是二维码存在另一个Frame里,需要切换过去才行,即:
知道了以后很简单,但是当时怎么也想不明白;
二是二维码指向的不是一个图片地址,而是一段以‘data:image/png;base64,’开头的代码,查了查才知道,这是一种base64的编码,用起来很方便,通过python自带的base64库可解码:
解码后即常规的二进制内容。
至此获取到了二维码,通过扫码登陆后自动获取cookies。
其实有更优的解法,不过还是这么做了权当是熟悉selenium操作。
成功登陆后,开始浏览文章,发现每篇文章的url很难定位,不如直接通过selenium的click()点击功能打开新页面:
关键是要切换句柄,否则无法实现对页面的操作。
week15任务:
1.开始觉着整个脚本实现起来并不复杂,但实际实现起来发现有很多坑,走了很多弯路,所以这一周还是进一步完善吧,把看视频的功能完善起来。
2.数据处理numpy+matplotlib
网友评论