爬取电影并存为excel

爬取电影并存为excel

作者: 未知之眼 | 来源:发表于2018-03-13 22:56 被阅读6次

爬取电影并存为excel
Python爬虫(四) 豆瓣电影top250
python爬取猫眼电影top100榜单
利用python来爬取豆瓣电影并保存为表格文件2020-05-1
Python 学习笔记 094
scrapy爬取豆瓣电影
爬取豆瓣电影top250
Python爬取豆瓣电影TOP250
Python爬取电影信息并保存至Excel
Python 学习笔记 091

import requests
from bs4 import BeautifulSoup
import re
import pandas as pd
import time
import lxml

douban = 'https://movie.douban.com/top250'

name=[]#film name
quote=[]#film star
score=[]#film score

def parseHtml(html):
soup = BeautifulSoup(html,'lxml')
movie_list_soup = soup.find('ol', attrs={'class': 'grid_view'})
for movie_li in movie_list_soup.find_all('li'):
movie_name = movie_li.find('span', attrs={'class': 'title'}).getText()
movie_star = movie_li.find('span', attrs={'class': 'rating_num'}).getText()
movieQuote = movie_li.find('span', attrs={'class': 'inq'}).getText()
print('{0} {1} {2}'.format(movie_name, movie_star, movieQuote))
name.append(movie_name)
score.append(movie_star)
quote.append(movieQuote)

nextPage = soup.find('span', attrs={'class': 'next'}).find('a')
if nextPage:
    download(douban + '{0}'.format(nextPage['href']))
else:
    print('all is ok')

def download(url):
print(url)
content = requests.get(url).content
parseHtml(content)

download(douban)

df = pd.DataFrame({'title':name,'rate':quote,'pingyu':score}
data={'title':name,'rate':quote,'pingyu':score}
df.to_excel('foo.xlsx', sheet_name='Sheet1')

相关文章

爬取电影并存为excel
import requestsfrom bs4 import BeautifulSoupimport reimpo...
Python爬虫(四) 豆瓣电影top250
目标：爬取豆瓣电影top250，将数据保存为Excel表格！用到的第三方库有：requests Beautifu...
python爬取猫眼电影top100榜单
项目目标：使用 requests 库和正则表达式爬取猫眼电影 Top100 榜单，并保存为文件目标站点分析电影...
利用python来爬取豆瓣电影并保存为表格文件2020-05-1
大家好，我是天空之城，今天教大家利用python来爬取豆瓣电影并保存为表格文件。话不多说，上代码。
Python 学习笔记 094
本周学习内容 07 本次分享主题自动爬取网页内容并保存为TXT 06 自动爬取小说 1.简单逻辑 1.1请求网页...
scrapy爬取豆瓣电影
摘要通过scrapy框架爬取豆瓣top250电影，并保存为文件 1．引言随着网络的迅速发展，互联网成为大量信息...
爬取豆瓣电影top250
爬取豆瓣电影top250 并保存为 csv 文件这里直接把所有数据存在 data 内，再一次性写入 csv。有...
Python爬取豆瓣电影TOP250
爬取目标爬取豆瓣电影TOP250信息并简单分析爬取网址为https://movie.douban.com/to...
Python爬取电影信息并保存至Excel
在简书看过一篇文章Python爬虫入门 | 7 分类爬取豆瓣电影，解决动态加载问题，在此基础上我想完成如下3件事：...
Python 学习笔记 091
本周学习内容 04 本次分享主题 jupyter notebook学习心得 01 自动爬取网页内容并保存为TXT ...

网友评论

本文标题：爬取电影并存为excel

本文链接：https://www.haomeiwen.com/subject/ukfxqftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

python爬取豆瓣

热点阅读

python爬取豆瓣

我爱编程

关于我们|服务条款|联系我们|爬取电影并存为excel|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！