done
- 理顺了爬取逻辑:从豆瓣各个页面的网址结构进行跳转
- 爬取以成员详情界面入手(group/people/9527/joins)
- 在linux 下搭建eclipse环境
- 在linux 下装mongoDB
todo
- linux虚拟机上网
- windows下爬取数据
- linux下用eclipse调用mongoDB
坑
- redhat的gtk版本太低带不动最新版的eclipse
- 重新下载的eclipse_sdk版本与系统不兼容
感受
一下午好不容易憋出了爬取数据的逻辑,这个项目的自学曲线太陡峭了,跟过山车一样心累
网友评论