署名夜斗,从今天开始和我一起学习爬虫吧!
> 人是早上起的,卷子是上午做的,心是下雪时凉的,人是下午走的; 今天刚考完概率论,表示明年重修的钱出不起了!因为概率论难就能阻挡我啃代码的心嘛?不可能的,就从今天开始记录自己python爬虫的成长史吧 ~~~~夜斗小神社
一:为什么想学爬虫
这得从疫情期间说起,这段时间刚好是自己接触python的时候,在这之前自己只会一些C语言的基本知识,甚至连指针都是不大会的那种,两个字形容自己吧就是拉跨;正好遇到学校的一个数学建模校赛,那时候需要通过自己去网上爬取高考数据然后进行建模预测,恰好了解到python写爬虫是比较方便的,然后就去了众所周知的学习网址b站学了一点爬虫的知识,就把那个数据弄下来了,然后自己组队的小伙伴觉得这个人还可以哈,有点东西;但是之后因为某些原因就没有再继续去深入学习爬虫了,然后之前学的也差不多都忘干净了,因此想通过自己写博客来记录一下自己这位爬虫小白的奋斗史吧!
*~~~~ *
二: 爬虫到底能干嘛
现在自己对爬虫的印象就是:
1. 通过写代码让其自己给我从我想要的网址上获得我想要的指定数据,比如说爬取淘宝店铺信息呐、比较出名的猫眼电影Top250;
2. 参加某些数据分析比赛、数学建模比赛,能够通过自己代码实现数据爬取,这些数据是自己比赛能否完成自己作品的基石
3. "爬虫学的好,局子进的早"指的是一些禁止爬虫爬取的网址,有一个rotbots协议吧, 不让你爬的千万别去爬,不然真会进局子的
4. 爬虫最难的一点就是反爬了吧,什么js逆向、字体加密啥的都是比较难的事情,这些东西之后估计也够我这个小白吃几壶了吧
爬虫这门系列课之后怎么学
- 其实我也没啥人教,纯小白一个,凭着爱好、兴趣吧,都是自学一些教程和一些大佬的文章吧,感谢那些出教学文章的大佬们!
网友评论