1. 实现模拟登录
模拟登录人人网,这是初始的一步,同时也是最困难的开头,很值得纪念。
-
网络爬虫
- 这是我第一接触到的,发现对我产生很大的吸引力。我再想个人怎么能从如此多的网页中抓取到自己想要的信息呢??后来知道一门语言“ Python ”。接触后发现代码还能写得如此简单,而且还很好理解。所以我就开始自学这门语言。
-
人生苦短,我用Python
-
不知道学习过C、C++等语言是什么感受,反正我都是觉得高大上
晦涩难懂。所以我开始学习这门简单的语言,而且感觉轻松。 -
<font face="微软雅黑">这门语言比Java的使用范围要少,但是并不代表它的作用就没Java大。很多时候Python很快速地解决问题,而不是先去找出模板。
-
2. 网页抓取
这需要一定的HTML和CSS基础,对我来说也很困难。
-
分析页面
-
看着如此长的界面,心里真的是不知道从何下手。但是参考别人的开源代码,就逐渐了解到该如何分析网页结构了。
-
另外,对于网页URL的内容读取需要用到 JSON 函数。这个我也是不知道如何处理,也是需要着重学习的。
-
3. 结尾
之后还需要结合数据库,web架构。这些还是需要更多的学习。现在学习了Markdown,编写md文档感觉也是很轻松啊。。
网友评论