美文网首页
爬虫就业冲刺20180728

爬虫就业冲刺20180728

作者: xsren2019 | 来源:发表于2019-11-25 17:35 被阅读0次

今日讲课内容:

  • 面试经验分享
  • 音乐爬虫

面试经验分享

教学内容:
分享面试经验和常见的面试题目。

教学目标:
让学生能对面试有个直观的感受,掌握面试技巧,知道应该准备哪些面试题目。

python爬虫面试1
python爬虫面试2
python爬虫面试3
python爬虫面试4

音乐爬虫

教学内容:
带学生走一个完整的爬虫项目。

总体教学目标:

  • 通过项目深入理解python编程和爬虫
  • 亲身感受爬虫商业项目
  • 能够自己开发一个类似的项目

今日教学目标:

  • 理解项目需求
  • 理解爬虫架构
  • 本地跑起项目来
爬虫总体架构.png
  • 到手一个新项目需要先阅读README.md,查看项目如何运行。
  • pdb和log对于调试程序很有用
  • charles 抓包

pdb基本命令

l list             查看代码
n next          走到下一步
c continue   到下一个断点
p print         打印变量

python3.6 无法使用pip直接安装twisted,需要自己编译安装

1、下载安装包
wget https://pypi.python.org/packages/source/T/Twisted/Twisted-15.2.1.tar.bz2
2、解压
tar -xjvf Twisted-15.2.1.tar.bz2
3、编译安装
cd Twisted-15.2.1
python3 setup.py install

项目代码:https://github.com/xsren/uplooking_spider

课后作业:
1、实现一个函数,可以输入歌手的url,获取歌手的详细信息,比如https://y.qq.com/n/yqq/singer/002J4UUk29y8BY.html
2、将现在的直接存储数据到mongodb改为通过http接口发送给flask server,通过flask server存储到mongodb

相关文章

  • 爬虫就业冲刺20180728

    今日讲课内容: 面试经验分享 音乐爬虫 面试经验分享 教学内容:分享面试经验和常见的面试题目。 教学目标:让学生能...

  • 爬虫就业冲刺20180804

    一、教学内容 1、知识点 flask写接口 charles使用复习 2、音乐爬虫 抓取歌手的信息 通过专辑抓取全量...

  • 爬虫就业冲刺20180811

    一、教学内容 1、知识点 charles使用复习 2、音乐爬虫 获取音乐的真实地址 提供获取音乐真实地址的接口 做...

  • 爬虫就业冲刺20180818

    一、教学内容 1、使用scrapy实现之前的音乐爬虫 教学内容: 复习之前的音乐爬虫项目 scrapy使用进阶 使...

  • 【丰盛日记】115

    20180728 晚安

  • “疯”眼看美国51:This too shall pass

    20180728六 This too shall pass 20180728-自然历史博物馆-洋基-大都会 在第八...

  • 20180728

    九岁多的小同学,倒有些像两三岁牙牙学语模样,常会有令人想象之外的言语。 前天在路上告诉我:妈妈,我发现侦探不只是能...

  • 20180728

    简品.Cathy 【知识学习】 1、背诵《六项精进大纲》1 2、背诵《大学》0 【经典名句分享】 知不难,行不易,...

  • 20180728

    淳犀哥哥五岁生日,和佳莹姐姐在哥哥家快玩疯了。这几个小朋友从几个月就开始在一块玩了,只要呆在一块就会玩得很...

  • 20180728

    明天和意外,永远不知道哪个先来。感慨近期。

网友评论

      本文标题:爬虫就业冲刺20180728

      本文链接:https://www.haomeiwen.com/subject/agpjwctx.html