-- coding: utf-8 -

from bs4 import BeautifulSoup
import time
import requests
import time
import io
import sys
import urllib.request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

url = 'https://knewone.com/things/?page='
def get_page(url,data=None):
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text,'lxml')
imgs = soup.select('a.cover-inner > img')
titles =soup.select('section.content > h4 > a')
links = soup.select('section.content > h4 > a')
#print(soup)
if data ==None:
for img,title,link in zip(imgs,titles,links):
data = {
'img':img.get('src'),
'title':title.get('title'),
'link':link.get('href'),
}
print(data)
def get_more_page(start,end):
for one in range(start,end):
get_page(url+str(one))
time.sleep(1)

get_more_page(1,10)

</pre>

爬取knewone上的信息
爬取knewone上的信息 author = 'LEE' -- coding: utf-8 - from bs4 ...
【实战试听课】第四节：如何爬取异步加载数据
有些网页的加载方式很特别，爬取的方式也有所不同。今天我们来学习爬取异步加载的数据的方法，并且爬取 KnewOne ...
三阶段day26-爬虫介绍
爬取猫眼网站的电影信息爬取页面信息的基本思路是： 1、获取页面信息2、解析页面信息并匹配自己想要爬取的数据3、组...
Python实战计划学习笔记：week1
由于现在58同城主页改版，基本上都是转转的商品信息。在这个基础上爬取转转商品的信息。代码如下：爬取的效果图如下...
五. 项目实战：爬取matplotlib源码文件
爬取网址：https://matplotlib.org/examples/爬取信息：爬取所有例子源码爬取方式：sc...
【爬虫】-005-MongoDB数据库操作-练习
目标爬取小猪短租房源信息，暂定爬取前三页列表页爬取信息为房源的URL房源的价格将爬取的信息存入到数据库数据...
Spring Boot集成WebMagic爬取商品信息
Spring Boot集成WebMagic爬取商品信息爬取分析爬取https://search.jd.com/...
六. 项目实战：下载360图片
爬取网址：http://image.so.com/爬取信息：爬取图片爬取方式：scrapy框架存储方式：Image...
爬取某宝商品（1）
今天我们利用上次的工具selenium 的webdrive工具简单爬取某宝上商品信息目的：爬取华为手机的名称、...
二十八. 模拟登陆实战 - 爬取拉勾网招聘信息
爬取网址：https://www.lagou.com/爬取信息：工作岗位等信息爬取方式：json数据存储方式：Mo...