这个就很有意思了!
是这样的,我本来在研究爬虫技术。也就是在研究之前的那篇研究Chrome做爬虫的文章,点这个可以看
然后,在我刷新了一下百度的官网的页面的时候,我意外点开了这个包
中间那个包就在之前介绍那个关于Chrome进行网络爬取的文章
中讲了讲如何到这个部分。 就在之前所说的network
这个部分。
然后各位只需要跟我一样点差不多开头的包,那个就是了
如果发现了那个network
部分是空的,就 不要关掉这个network部分,直接刷新一下原来的网页,就可以检测到了。
-
点击这包,就可以看到这样的部分
可以看看那个被选中的部分url
看到那些被转义过的url(%...
这些基本就是被转移过后的中文)
想获取具体的信息,有两个方法。
-
直接把这个东西拖到最下面部分
那个hisdata就是我们想要的东西
哈哈哈, 一个月前,我确实用这个查了如何设置qrc。(有段时间没有用百度了hhh) 不过这确实是我之前用百度的时候查的东西。
- 用Python的 urllib库来解析之前那个被我用蓝色的光效选中的部分url
无论是python2 还是python3 都是可以urllib这个库。 不过有点区别,就是 python2直接用urllib.unquote(URL)
。而python3用的是urllib.parse.unquote(URL)
。
但是Python3可能会有点问题,就是可能会报下面这样的错误。
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: module 'urllib' has no attribute 'parse'
其实解决方法也简单,就直接
from urllib import parse
就好了~
后记
嘿嘿,专门写个小tip给大家看。以后女票要是发现自己看了什么电影,后果自负呀~ 反正我单身狗,无压力~
祝大家狗年快乐啦~
网友评论