Excel商务智能:Power Query和Power Pivot数据清洗、建模与分析实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 初识Power Query

正如1.1节中所提到的,Power Query是一款轻量级的ETL工具,也就是我们常说的用于数据获取、转换、合并和上载的工具。接下来将详细介绍什么是Power Query。Power Query是Excel中的一个查询编辑器组件,通过它可以首先导入或连接外部数据,然后对数据进行清洗、转换和合并,最后将结果上载至Excel中用于创建图表和报表,并且结果还能做到随时更新。

一般来说,使用Power Query有以下4个步骤。

1)连接

连接主要是连接对应数据源,如Excel工作簿、文本/CSV文件、文件夹数据、数据库数据、JSON文件、XLM文件、云端数据,或者其他Power Query支持的数据源。Power Query本身并不存储数据,只是连接数据源,并且可以刷新数据连接。

2)转换

转换主要是对数据的格式、布局和单位等进行转换,或者对数据进行添加、筛选、删除或修改等操作以符合使用数据的要求。转换时Power Query不会修改或影响数据源。

3)合并

合并是将来自不同途径的数据源进行合并,并将其变成一个文件的过程。例如,将多个工作簿或工作表中的数据合并到一起。

4)上载

上载是在Power Query编辑器完成查询和转换后,将数据上载至工作表中或添加到数据模型中进行建模或分析的过程。

在Excel中,Power Query的入口在“数据”选项卡下的“获取和转换数据”选项组中,当选择相应的数据来源时可以激活Power Query编辑器。而“查询和连接”选项组中的按钮则可以用来查看已上载的查询,如图2-1所示。

图2-1

需要说明的是,虽然不同版本Excel中的Power Query选项组的名称和按钮的名称有细微的差异,但是功能并没有大的差异。例如,“获取和转换数据”在有的版本中被称为“获取和转换”,“来自表格/区域”在有的版本中被称为“从表格”,等等,虽然名称不同,但是功能相同,操作方法也相同。