2.1 初识Power Query
正如1.1节中所提到的,Power Query是一款轻量级的ETL工具,也就是我们常说的用于数据获取、转换、合并和上载的工具。接下来将详细介绍什么是Power Query。Power Query是Excel中的一个查询编辑器组件,通过它可以首先导入或连接外部数据,然后对数据进行清洗、转换和合并,最后将结果上载至Excel中用于创建图表和报表,并且结果还能做到随时更新。
一般来说,使用Power Query有以下4个步骤。
1)连接
连接主要是连接对应数据源,如Excel工作簿、文本/CSV文件、文件夹数据、数据库数据、JSON文件、XLM文件、云端数据,或者其他Power Query支持的数据源。Power Query本身并不存储数据,只是连接数据源,并且可以刷新数据连接。
2)转换
转换主要是对数据的格式、布局和单位等进行转换,或者对数据进行添加、筛选、删除或修改等操作以符合使用数据的要求。转换时Power Query不会修改或影响数据源。
3)合并
合并是将来自不同途径的数据源进行合并,并将其变成一个文件的过程。例如,将多个工作簿或工作表中的数据合并到一起。
4)上载
上载是在Power Query编辑器完成查询和转换后,将数据上载至工作表中或添加到数据模型中进行建模或分析的过程。
在Excel中,Power Query的入口在“数据”选项卡下的“获取和转换数据”选项组中,当选择相应的数据来源时可以激活Power Query编辑器。而“查询和连接”选项组中的按钮则可以用来查看已上载的查询,如图2-1所示。
图2-1
需要说明的是,虽然不同版本Excel中的Power Query选项组的名称和按钮的名称有细微的差异,但是功能并没有大的差异。例如,“获取和转换数据”在有的版本中被称为“获取和转换”,“来自表格/区域”在有的版本中被称为“从表格”,等等,虽然名称不同,但是功能相同,操作方法也相同。