美文网首页解密大数据
爬虫第一课作业

爬虫第一课作业

作者: 橙子LifeX | 来源:发表于2017-07-04 23:30 被阅读81次

要爬取的数据类别

计划获得一个地区某个医院的医生基础信息数据

对应的数据源网站及 URL

好大夫主站地址:http://www.haodf.com/

北京地区地址:http://beijing.haodf.com/

具体数据页面 url:http://www.haodf.com/doctor/DE4r0eJWGqZNDyuuyr3uFnyZYjeZpcO4.htm

有用的代码块

<h1><span="float:left:> 董强 </span></h1>

<a href="http://beijing.haodf.com" target="_blank">北京</a>

<a href="/hospital/DE4roiYGYZw0wWWuYe-Bqregr.htm" target="_blank">平谷区医院</a>

<a href="/faculty/DE4r08xQdKSLufRTkhY2Krrpb6FW.htm" target="_blank">呼吸科</a>

<td valign="top">副主任医师 </td>

数据保存

  • 姓名
  • 地区
  • 医院
  • 科室
  • 职称
  • 页面 url

相关文章

网友评论

    本文标题:爬虫第一课作业

    本文链接:https://www.haomeiwen.com/subject/ktlfhxtx.html