Powerbi爬取豆瓣Top250的电影

Powerbi爬取豆瓣Top250的电影

作者: 照希 | 来源:发表于2021-12-15 17:16 被阅读0次

Python学习
用23行代码爬取豆瓣音乐top250
scrapy爬取豆瓣电影
Python学习第四天
Python学习
Python爬取豆瓣电影TOP250
Powerbi爬取豆瓣Top250的电影
基于Python语言的爬虫分析
node.js一个爬虫实例
爬取豆瓣电影top250(二)

一.网页结构与URL的规律

豆瓣电影的网址为https://movie.douban.com/top250 ，第一页的网址为https://movie.douban.com/top250?start=0&filter=；
powerbi从web网址获取数据一般需要确认网址规律，即：了解从哪里抓取，抓取的网页有哪些特点，是否有统一规律。

image.png

image.png
通过观察这个网址的首页，可以看出每个页面排布着25个电影，总共10页，分页展示250部电影。切换不同页时，只有网址中间的“start=0”在变化，每一页的URL中数字呈现等差数列变化。

二.构建爬虫函数

2.1.获取一页数据

首先用豆瓣电影第一页的数据，powerbi面板选择从Web获取数据，url先填写https://movie.douban.com/top250?start=0&filter= 。

image.png
接下来导航器中会直接提取出所获取的表格。

112.png
此时获取的数据表列明缺失，需要去power query中稍微处理下。

image.png
此时，网址第一页，25部电影就已经获取下来了，接下需要在此基础上，构建参数与函数。

2.2 构建参数与函数

在power query界面的参数管理下选择新建参数，构建一个页码参数。设置成从0开始的文本即可。

113.png

在power query界面刚才生成的一张表叫表1，现在修改表1的数据源，让其url链接包含页码参数。

114.png
选择高级，此时会将整个url拆分开，将中间页码部分替换成刚才新建的参数。

115.png

接下来需要选中表1，单击右键创建名为“Top电影提取”的函数。

116.png
构建完成后，在左侧会出现以下界面。

image.png

2.3 构建页码列表

在新建空查询下面，使用List.Numbers(0,10,25)创建一个list.

117.png

右键选项到表，将这个list转换成表格，接下来可以改个列明，重点注意需要将字段格式设置成文本。

image.png
接下来在这个表里面添加列，选择用查询添加列。

119.png

完成添加列之后如下所示。

image.png
可以看出，每个页码都查询出一个table，扩展查询到的表。

121.png
点击确定即可，最终就可以得到完整的250部电影列表了。
最后结果如下。

122.png

相关文章

Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
用23行代码爬取豆瓣音乐top250
网上有各种爬取豆瓣电影top250的教程，虽然豆瓣音乐top250和豆瓣电影top250的爬取十分类似，但是我大致...
scrapy爬取豆瓣电影
scrapy爬取豆瓣电影，存储在MongoDB 本节分享用的Scrapy爬取豆瓣电影Top250的实战。本节要实...
Python学习第四天
爬取豆瓣top250电影输出结果：爬取猫眼top100 输出结果：
Python学习
python爬虫(四) python爬虫爬取豆瓣电影数据今天我们爬取一下豆瓣电影TOP250页面电影的数据，依然...
Python爬取豆瓣电影TOP250
爬取目标爬取豆瓣电影TOP250信息并简单分析爬取网址为https://movie.douban.com/to...
Powerbi爬取豆瓣Top250的电影
一.网页结构与URL的规律豆瓣电影的网址为https://movie.douban.com/top250[htt...
基于Python语言的爬虫分析
豆瓣电影TOP250分析引入相应的库爬取豆瓣电影TOP250网页分析网页源码取得电影名称、评分和评价数 ...
node.js一个爬虫实例
爬取豆瓣top250 测试
爬取豆瓣电影top250(二)
爬取豆瓣电影top250全部的页面信息不在是单一页面的爬取,但是这个页面很有规律

网友评论

本文标题：Powerbi爬取豆瓣Top250的电影

本文链接：https://www.haomeiwen.com/subject/sejpfrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Powerbi爬取豆瓣Top250的电影|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！