美文网首页解密大数据
爬虫入门L2 | 网页结构&元素标签位置

爬虫入门L2 | 网页结构&元素标签位置

作者: conniesun | 来源:发表于2017-07-17 12:33 被阅读72次

用上次L1作业的文档地址作为分析页面:
http://www.jianshu.com/p/0c007dbbf728

L1作业页面

先看网页结构

网页结构

网页的四个部分
<!DOCTYPE html> 这是说浏览器支持IE6-9?
<html>...</html>文档起终点
<head>...</head>文档头部
<body>...</body>文档主体

<head>部分

必须的包含的<title>元素:


head的title元素
<body>部分

body内容比较多,上张结构图看起来清晰点:

body.png

然后是各个元素的位置信息:

全局顶部导航栏.png title.png 作者区域.png 文章内容.png 页脚的专辑名称和版权信息.png 关注的作者信息.png 赞赏作者区.png 底部喜欢分享区.png 评论区.png 侧边栏.png 最下面灰色区域的收入专题.png 最下面灰色区域的推荐专题.png

然后查看了下元素id属性,
在查看器搜索id,出现35个id,大部分在head里面。还有在文档的网页里面。这里选取一个参考。

id属性.png

最下面能看到树状索引。


树状索引.png

L2还有部分内容需要消化,html基础知识还要补起来。

之后继续补充。。。

相关文章

  • 爬虫入门L2 | 网页结构&元素标签位置

    用上次L1作业的文档地址作为分析页面:http://www.jianshu.com/p/0c007dbbf728 ...

  • 慕课学习爬虫实战

    爬虫前奏: 明确目的; 找到数据对应的网页; 分析网页的结构找到数据所在的标签位置 模拟HTTP请求,向服务器发送...

  • 爬虫

    爬虫前奏: 明确目的,找到数据对应的网页,分析网页的结构找到数据s所在的标签位置 模拟Http请求,向服务器发送这...

  • 爬虫作业2

    分析要爬取目标的网页的网页结构与元素标签位置信息 任务回顾 1.爬取网页:看准网 http://www.kanzh...

  • 2018-05-29

    学习爬虫入门基本知识 1、什么是爬虫? 爬虫就是将网络中非结构化数据转化为结构化数据的工具。 通俗来讲:将网页数据...

  • 爬虫入门02作业

    作业: 选择简书“解密大数据”专题里面上次爬虫作业的文档地址作为分析页面。 分析并提交该页面结构分析与元素标签位置...

  • Python爬虫--认识网页的结构

    爬虫、网页结构简介 爬虫,爬取特定的网站,获取数据、信息等。 网页一般由三部分组成:HTML标签、CSS样式、Ja...

  • css样式表书写注意与排错

    网页版面出现错乱的情况有哪些? 检查元素如 div开始和结束标签是否正确 审查元素 发现 多了个标签,或者标签结构...

  • 爬虫作业02-html页面分析

    课堂作业 选择简书解密大数据专题里面上次爬虫课的作业文档地址作为分析页面 分析并提交该页面的网页结构分析与元素标签...

  • HTML基础

    html基本结构:html文件 ,头部信息 ,网页主体内容 水平线: (单标签) 段落标签: 元素:开始标签+...

网友评论

    本文标题:爬虫入门L2 | 网页结构&元素标签位置

    本文链接:https://www.haomeiwen.com/subject/bekfkxtx.html