此系列文章用于讲解如何使用Excel或PowerBI中的Power Query功能,读取文件夹中的特定文件。
文章分为以下几篇:
一、默认功能读取修改日期最新的文件
二、一步读取修改日期最新的文件
三、一步读取文件名包含特定日期的文件
四、一步读取文件名日期最新的文件
此系列文章主要用于解决日常会持续收到更新的数据源,且每日的文件命名会产生变化,我们需要用到此数据源做报表,又不想每日打开文件复制粘贴的情况。
本文内容为:一步读取修改日期最新的文件
一、背景描述
上一篇使用了默认方法,读取文件夹中修改日期最新的文件。
好处是直接可以通过点击操作就完成数据的导入设置;坏处是自动生成的查询内容太多,如果我们连接的数据源也比较多,会造成管理困难,因此今天来看如何将查询简化为只保留1个。
image.png二、实现步骤
1、首先,仍然新建一个Excel文档。然后使用“数据→获取数据→自其他源→空白查询”,打开Power Query编辑器
image.png2、然后,在出来的PQ编辑器中,点击“主页→高级编辑器”打开M语言编辑器,然后粘贴上后面的代码(注意修改图中截图红色字体部分的内容,文件夹路径需注意第一个最后有反斜杠,后面两个没有;倒数第三行的“Item=”的对象是要获取的表格名称,Kind是表格类型),点击完成即可获得数据
image.pnglet
源= Excel.Workbook(
File.Contents(
"E:\07 数据项目汇总\项目005-PBI读取最新文件\原始数据\" & List.First(
Table.SelectRows(
Folder.Files("E:\07 数据项目汇总\项目005-PBI读取最新文件\原始数据"),
let latest = List.Max(
Folder.Files("E:\07 数据项目汇总\项目005-PBI读取最新文件\原始数据")[Date modified]) in each [Date modified] = latest)[Name])
), null, true),
导航= 源{[Item="示例数据",Kind="Sheet"]}[Data]
in
导航
3、这是获取到的数据,可以看到左侧的查询列表就很简洁,只保留了一个查询。然后我们通过“将第一行用作标题”等功能,设置正确的标题后,就可以关闭上载到Excel了。
image.png三、M语言代码的解析
PQ的界面操作,可以满足我们80%以上的日常数据处理需求;剩下的,我们可以通过调整M代码来实现(我们的界面操作也会被PQ自动转换成M代码)。
我们来看调整后的代码的解析,思路是可以通过PQ的读取文件夹功能Folder.Files。
(1)通过Folder.Files("E:\07 数据项目汇总\项目005-PBI读取最新文件\原始数据")读取文件夹的文件列表
(2)通过Table.SelectRows,配合let latest = List.Max(Folder.Files("E:\07 数据项目汇总\项目005-PBI读取最新文件\原始数据")[Date modified]) in each [Date modified] = latest 的参数,获取[[Date modified]即修改日期为最后的文件行,然后通过[Name]获取到文件名
(3)上述操作本身获取到的是一个list,所以再通过外包一层List.First函数获取到list的第一个值,即文档名
(4)组装上路径即是需要读取的文件。上述步骤获得的是当前需要的文件对象(我们给它命名为“源”),实际我们要的是文件里面的某一个表
(5)最后, 通过:导航= 源{[Item="示例数据",Kind="Sheet"]}[Data],来获取最终需要的表格。其中Item的参数就是表名(sheet的名称),如果是命名表(即Excel表中通过ctrl+T或ctrl+L创建的超级表,这个名称就是超级表的名称,可以通过名称管理器查看到表名);Kind参数,有“Sheet”和“Talbe”两个,普通表格使用“Sheet”,命名表使用“Table”。
网友评论