爬虫

爬虫

作者: Rain师兄 | 来源:发表于2020-09-27 22:28 被阅读0次

11.20-11.26
爬虫入门基础
01-认识爬虫
爬虫原理与数据抓取之一: 通用爬虫和聚焦爬虫
（了解）通用爬虫和聚焦爬虫--爬虫基础教程（python）（二）
Python 网络爬虫（一）
7.爬虫概述
1-基本概念
认识爬虫
爬虫入门

学爬虫有点崩溃。

有什么简单的爬虫代码。简单容易懂的爬虫代码。一直在找，看。终于自己会了一点。

需要下载用Beautifulsoup模块，和requests库

然后就可以比较简单的爬取网页内容。

缺点就是只能一个网站一个网站来，不能自动翻页爬取。有些网站不知道怎么爬取整页，比如爬知乎

先贴下源代码

import requests

from bs4 import BeautifulSoupas as bf

if __name__ =='__main__':

    url ='https://www.zhihu.com/question/51134718'

headers = {'User-Agent':''}

    html = requests.get(url,headers=headers)

    html_text = html.text

    soup = bf(html_text,'lxml')

    texts = soup.find_all('p')

    for i in range(1000):

print(texts[i].text.replace('\xa0'*4,'\n\n'))

url就是你要爬取的网址

headers是网页源代码对应的你的电脑的'user-Agent'：'Mozilla/5.0.......'

soup.find_all('p')是找到源代码所有p标签，如果不是p标签可以换成其他标签，如果有属性还可以添加属性

比如find_all('div',class_= 'shows')

只要换了这两个基本上很容易爬文字，只是不能连续爬自动翻页。

for 循环是因为p标签不止一个。

方法很多。

相关文章

11.20-11.26
本周目标爬虫爬虫爬虫爬虫
爬虫入门基础
Day01 一、爬虫介绍什么是爬虫 Python爬虫的优势 Python爬虫需要掌握什么爬虫与反爬虫与反反爬虫...
01-认识爬虫
一、爬虫介绍什么是爬虫 Python爬虫的优势 Python爬虫需要掌握什么爬虫与反爬虫与反反爬虫三角之争网...
爬虫原理与数据抓取之一: 通用爬虫和聚焦爬虫
通用爬虫和聚焦爬虫根据使用场景，网络爬虫可分为通用爬虫和聚焦爬虫两种. 通用爬虫通用网络爬虫是捜索...
（了解）通用爬虫和聚焦爬虫--爬虫基础教程（python）（二）
通用爬虫和聚焦爬虫根据使用场景，网络爬虫可分为通用爬虫和聚焦爬虫两种.我们主要写通用爬虫。通用爬虫通...
Python 网络爬虫（一）
网络爬虫的基本介绍学习爬虫，我想主要从以下几个方面来切入 -爬虫的原理？ -爬虫的作用？ -爬虫的实现？ -爬虫...
7.爬虫概述
爬虫概述知识点：了解爬虫的概念了解爬虫的作用了解爬虫的分类掌握爬虫的流程 1. 爬虫的概念模拟...
1-基本概念
简介为什么选择Python做爬虫需要技能爬虫与反爬虫网络爬虫类型通用网络爬虫聚焦网络爬虫增量式网络爬...
认识爬虫
前言我的爬虫笔记经常看别人通过爬虫分析数据，很有意思，来了兴趣，就开始了爬虫之路。爬虫爬虫，即网络爬虫，大...
爬虫入门
为什么要学习爬虫？ Python做爬虫优势关于Python网络爬虫，我们需要学习的有：什么是爬虫？网络爬虫（...

网友评论

本文标题：爬虫

本文链接：https://www.haomeiwen.com/subject/uqcquktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|爬虫|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！