《精通Power Query》肯·普尔斯【文字版_PDF电子书_雅书】

《精通Power Query》封面图片
书名:精通Power Query
作者:[加拿大]肯·普尔斯(KenPuls)
出版社:人民邮电出版社
译者:BI佐罗团队
出版日期:2023-11
页数:420
ISBN:9787115607744
9.4
豆瓣评分

当当正版

淘宝购买

京东图书

全网资源

内容简介:

本书是Power Query领域的经典之作,旨在让读者用正确而高效的方法精通Power Query。本书是两位作者多年积累的业务和IT工作经验总结,同时也是全球Power Query顶级社群的大咖经验提炼。本书从业务背景出发,在业务和IT之间做到了良好的平衡,系统化地给出了Power Query的思维框架和模式,同时按照多个企业级业务场景一一展示其实用性。

无论你是Power Query的新手还是经验丰富的ETL专家,都可以从各自的角度领略Power Query 和M语言的魅力。对于业务用户,本书给出了日常办公所涉及的大量复杂数据问题解法的直接参考,并提供了大量案例,可以直接应用。对于专业用户,本书给出了搭建大型专业数据项目的框架性流程指导及优化建议,并提供了相关案例,也可以直接复用。

作者简介:

肯·普尔斯(Ken Puls) 是加拿大特许专业会计师,微软 Excel MVP。他经营着 Excelguru 咨询公司,并通过 Skillwave培训平台教用户如何使用 Excel 和 Power BI。

米格尔·埃斯科瓦尔 (Miguel Escobar),在编写本书的时候是微软 Power BI MVP,并在巴拿马经营着一家名为 Powered Solutions 的咨询公司。在本书英文版即将出版时,米格尔收到一份令人兴奋的邀请函,即加入微软 Power Query 团队担任项目经理。

BI 佐罗团队,是基于对数据分析的爱好而形成的爱好者社区,活跃成员包括微软MVP、LVMH集团数据分析师、企业CFO等。2015年以来,经过多年发展,团队已经孵化出不同行业的数据咨询类企业,尤其在零售、快消、餐饮、汽车等行业聚集和沉淀了专业的研究成果,且已为50余家企业提供了数字化转型“开箱即用”的落地方案。团队通过“PowerBI战友联盟”的微信公众号、“BI佐罗”的小红书、B站、抖音等平台,持续为社区带来知识分享,也欢迎广大爱好者一起交流讨论。

目  录:

第0 章 导言:一场新的革命 1

0.1 数据分析师的常见场景 1

0.2 “魔法”的好处和危险 2

0.3 未来的改变 3

0.4  为什么说Power Query 有“魔力” 5

0.4.1 提取 5

0.4.2 转换 5

0.4.3 加载 6

0.5  Power Query 和产品体验的整合 7

0.5.1 Power Query 的组件 7

0.5.2 产品体验的整合 8

0.6 Power Query 的更新周期 8

0.6.1 Power Query 在线版 9

0.6.2 Microsoft 365 9

0.6.3 Excel 2016/2019/2021 9

0.6.4 Excel 2010 & 2013 9

0.6.5 Power BI 桌面版 10

0.7 如何使用本书 10

0.7.1 Microsoft 365 Excel 10

0.7.2 Power BI 桌面版 11

0.7.3 以前的Excel版本 11

0.7.4 单击“获取数据”按钮 11

0.7.5 特殊元素 12

第1 章 基础知识 13

1.1 开始之前 13

1.1.1 调整Excel默认设置 13

1.1.2  调整Power BI 桌面版默认设置 14

1.2 提取 14

1.2.1 选择数据 14

1.2.2 身份验证 15

1.2.3 预览窗口 15

1.2.4 查询处理 16

1.3 转换 17

1.3.1 编辑器 17

1.3.2 默认转换 18

1.3.3 源 18

1.3.4 将第一行用作标题 19

1.3.5 更改的类型 19

1.3.6 调整和修改转换 20

1.4 加载 22

1.4.1 设置数据类型 22

1.4.2 重命名查询 23

1.4.3 在Excel中加载查询 24

1.4.4 在Power BI 中加载查询 24

1.5 刷新查询 25

1.6 编辑查询 26

1.6.1 在Power BI 中启动查询编辑器 26

1.6.2 在Excel中启动查询编辑器 27

1.6.3 检查步骤 27

1.6.4 重新配置步骤 27

1.7 Power Query 的价值 29

第2 章 查询结构设计 31

2.1 使用多查询体系结构 31

2.1.1 对ETL进行分层 31

2.1.2 单个查询的好处 31

2.1.3 拆分查询的好处 32

2.1.4 关于“暂存”查询的 性能 32

2.2 查询的引用 34

2.2.1 创建基础查询 34

2.2.2 创建查询的引用 34

2.2.3 查询依赖关系树的可视化 37

2.2.4 使用Monkey工具查看依赖关系 38

2.3 选择查询加载目的地 38

2.3.1 在Power BI 中选择加载目的地 38

2.3.2 在Excel中选择加载目的地 39

2.3.3 更改加载目的地 41

2.4 保持查询的条理性 43

2.4.1 查询文件夹 43

2.4.2 将查询分配到文件夹 44

2.4.3 排列查询和文件夹 44

2.4.4 查询子文件夹 45

2.5 拆分现有查询 45

2.6 关于查询体系结构的最后思考 47

第3 章 数据类型与错误 49

3.1 数据类型与格式 49

3.1.1 数据格式 49

3.1.2 数据类型 49

3.1.3 如何设置数据格式 52

3.1.4 设置数据类型的顺序 53

3.1.5 数据类型的重要性 54

3.2 常见的错误类型 55

3.3 步骤级错误 56

3.3.1 数据源错误 56

3.3.2 没有找到某列 58

3.4 值错误 59

3.4.1 发现错误 60

3.4.2 无效的数据类型转换 61

3.4.3 不兼容的数据类型 63

3.5 检查查询错误 64

3.5.1 发现错误的来源 64

3.5.2 修复最初查询 65

3.5.3 删除错误查询 66

3.6 关于数据类型与错误的最后思考 66

第4 章 在Excel和Power BI间迁移查询 67

4.1 在工具之间迁移查询 67

4.1.1 Excel到Excel 68

4.1.2 Excel到Power BI 70

4.1.3 Power BI 到Excel 71

4.1.4 Power BI 到Power BI 71

4.2 导入查询 72

4.2.1 仅外部数据源 72

4.2.2 数据模型的导入 74

4.2.3 导入时复制数据 75

4.2.4 导入时保持连接 80

4.3 在工具之间迁移查询的思考 82

第5 章 从平面文件导入数据 84

5.1 了解系统如何导入数据 84

5.1.1 设置系统默认值 84

5.1.2 程序如何解析平面数据 85

5.2 导入带分隔符的文件 87

5.2.1 源数据文件 87

5.2.2 提取数据 88

5.2.3 错误的解析 88

5.2.4 使用区域设置 89

5.3 导入无分隔符的文本文件 92

5.3.1 连接到文件 92

5.3.2 清理无分隔符文件 93

5.3.3 按位置拆分列 94

5.3.4 利用查询中的错误 96

5.3.5 删除“垃圾列” 98

5.3.6 合并列 99

5.3.7 通过分隔符拆分列 99

5.3.8 修剪重复的空格 100

5.3.9 Power Query 的闪耀时刻 101

第6 章 从Excel导入数据 104

6.1 来自当前工作簿的数据 104

6.1.1 连接到表 105

6.1.2 连接到区域 106

6.1.3 连接到命名区域 108

6.1.4 连接到动态区域 110

6.1.5 连接到工作表 112

6.2 来自其他工作簿的数据 112

6.2.1 连接到文件 113

6.2.2 连接到表 114

6.2.3 连接到命名区域 115

6.2.4 连接到工作表 115

6.3 关于连接到Excel数据的最后思考 118

第7 章 常用数据转换 121

7.1 逆透视 121

7.1.1 准备数据 122

7.1.2 逆透视其他列 123

7.1.3 重新透视 124

7.1.4 应对变化 125

7.1.5 逆透视之间的区别 125

7.2 数据透视 126

7.3 拆分列 128

7.3.1 将列拆分为多列 129

7.3.2 将列拆分为多行 130

7.3.3 拆分后逆透视与拆分到行 131

7.4 筛选和排序 132

7.4.1 按特定值筛选 133

7.4.2 按上下文筛选 135

7.4.3 数据排序 137

7.5 数据分组 138

第8 章 纵向追加数据 141

8.1 基本追加 141

8.1.1 追加两个表 142

8.1.2 追加额外的表 145

8.2 追加列标题不同的数据 147

8.3 在当前文件中追加表和区域 148

8.3.1 合并表 149

8.3.2 合并区域或工作表 153

8.3.3 Excel.Current Workbook 155

8.4 关于追加查询的最后思考 155

第9 章 批量合并文件 156

9.1 示例文件背景介绍 156

9.2 过程概述 157

9.2.1 合并文件的标准流程 157

9.2.2 合并文件的通用架构 157

9.3 步骤0:连接到文件夹 159

9.3.1 连接到本地/ 网络文件夹 159

9.3.2 连接到SharePoint文件夹 160

9.3.3 连接到OneDrive for Business 162

9.3.4 连接到其他文件系统 162

9.4 步骤1:筛选文件 162

9.4.1 标准步骤 163

9.4.2 应用于示例场景 163

9.5 步骤2:合并文件 165

9.5.1 标准步骤 165

9.5.2 应用于示例场景 165

9.6 步骤3:转换示例文件 167

9.6.1 使用转换示例文件的原因 168

9.6.2 使用转换示例文件的方法 168

9.7 步骤4:通过主查询进行数据清理 171

9.7.1 修复主查询中的错误 171

9.7.2 保存文件属性 172

9.7.3 添加更多的步骤 173

9.8 更新解决方案 174

9.8.1 使用数据 175

9.8.2 添加新文件 175

9.8.3 只用最后几个文件以提升速度 176

第10 章 横向合并数据 179

10.1 合并基础知识 179

10.1.1 创建“暂存”查询 179

10.1.2 执行合并 180

10.2 连接类型 182

10.2.1 左外部连接 184

10.2.2 右外部连接 186

10.2.3 完全外部连接 187

10.2.4 内部连接 188

10.2.5 左反连接 189

10.2.6 右反连接 190

10.2.7 完全反连接 190

10.3 笛卡儿积(交叉连接) 191

10.3.1 方法 191

10.3.2 示例 192

10.3.3 意外问题 194

10.4 近似匹配 195

10.4.1 方法 195

10.4.2 示例 196

10.5 模糊匹配 198

10.5.1 基本模糊匹配 199

10.5.2 转换表 200

10.5.3 减小相似性阈值 201

10.5.4 保持模糊匹配的策略 203

第11 章 基于Web的数据源 204

11.1 连接到Web 数据文件 204

11.2 连接到HTML网页 205

11.2.1 连接到网页 206

11.2.2 自然表和建议表 206

11.2.3 使用示例添加表 207

11.3 连接到没有表的页面 209

11.4 从Web 获取数据的注意事项 212

11.4.1 收集数据的经验 213

11.4.2 数据完整性 213

11.4.3 解决方案稳定性 213

第12 章 关系数据源 214

12.1 连接到数据库 214

12.1.1 连接到数据库 214

12.1.2 管理凭据 216

12.1.3 无法连接 217

12.1.4 使用导航器 217

12.1.5 探索数据 218

12.2 查询折叠 221

12.2.1 理解查询折叠 221

12.2.2 支持查询折叠的技术 223

12.2.3 常见问题 224

12.3 数据隐私级别 225

12.3.1 声明数据隐私级别 226

12.3.2 管理数据隐私级别 227

12.3.3 隐私与性能 227

12.3.4 禁用隐私引擎 228

12.4 优化 230

第13 章 转换表格数据 233

13.1 透视 233

13.1.1 单列多行 233

13.1.2 多层行标题 237

13.1.3 多层列标题 239

13.2 逆透视 242

13.2.1 多层行标题 242

13.2.2 性能优化 248

13.2.3 重构 249

13.2.4 保留“null”值 250

13.3 分组 253

13.3.1 占总计的百分比 253

13.3.2 数据排序 254

13.3.3 分组编号 257

第14 章 条件逻辑 261

14.1 基础条件逻辑 261

14.1.1 数据集背景 261

14.1.2 连接到数据 262

14.1.3 通过用户界面创建条件逻辑 262

14.2 手动创建IF 判断 265

14.3 IFERROR函数 268

14.4 多条件判断 270

14.5 与上下行进行比较 273

14.6 示例中的列 276

第15 章 值系统 282

15.1 值类型 282

15.2 表 283

15.3 列表 284

15.3.1 语法 284

15.3.2 从头开始创建列表 284

15.3.3 将列表转换为表 286

15.3.4 从表列创建列表 287

15.3.5 创建列表的列表 288

15.4 记录 290

15.4.1 语法 290

15.4.2 从头开始创建记录 291

15.4.3 将记录转换为表 291

15.4.4 从头开始创建多个记录 292

15.4.5 将多个记录转换为表 293

15.4.6 按索引访问表记录 294

15.4.7 按条件访问表记录 295

15.4.8 从每个表行创建记录 298

15.5 值 300

15.6 二进制文件 300

15.7 错误 301

15.7.1 行级错误 301

15.7.2 步骤级错误 301

15.8 函数 302

15.9 关键词 304

15.9.1 二进制(#binary) 305

15.9.2 日期时间( #datetime) 306

15.9.3 时间(#time) 307

15.9.4 持续时间( #duration) 307

15.9.5 类型(type) 308

15.9.6 表(#table) 310

第16 章 理解M语言 314

16.1 M查询结构 314

16.1.1 查询结构 315

16.1.2 查询定义与标识符 316

16.1.3 关于通用标识符 318

16.1.4 代码注释 319

16.1.5 整体效果 320

16.2 理解查询计算 320

16.2.1 什么是延迟计算 321

16.2.2 查询计划 322

16.3 迭代器(逐行计算) 324

16.3.1 循环函数 324

16.3.2 关键词each和_ 324

16.4 其他技术 328

16.4.1 获取第一个值 328

16.4.2 错误保护 330

16.4.3 固定类型动态列表 331

16.4.4 自适应类型动态列表 334

第17 章 参数和自定义函数 338

17.1 重新创建合并文件 338

17.1.1 创建示例文件 339

17.1.2 创建示例文件参数 340

17.1.3 创建转换示例 341

17.1.4 创建转换函数 342

17.1.5 调用转换函数 342

17.1.6 更新转换函数 342

17.1.7 观察到的规律 343

17.2 使用参数构建自定义函数 344

17.2.1 创建文件路径参数 345

17.2.2 创建Timesheet转换 346

17.2.3 创建Timesheet函数 347

17.2.4 更新Timesheet查询 347

17.3 手动构建自定义函数 349

17.3.1 构建一个单一使用场景 350

17.3.2 将查询转换为函数 350

17.3.3 从另一个查询调用函数 352

17.3.4 调试自定义函数 353

17.3.5 恢复函数功能 355

17.4 动态参数表 355

17.4.1 动态文件路径问题 356

17.4.2 实现动态参数表 357

17.4.3 创建参数表 357

17.4.4 实现fnGetParameter函数功能 358

17.4.5 调用函数 359

17.5 参数表的意义 361

第18 章 处理日期时间 362

18.1 边界日期 362

18.1.1 计算边界日期 363

18.1.2 处理财政年度日期 364

18.1.3 处理364 日型 365

18.2 日期表 367

18.2.1 原子日期表 367

18.2.2 增强日期表 368

18.2.3 财政日期列 369

18.2.4 全局日期列 369

18.2.5 自定义日期表 371

18.2.6 示例说明 373

18.3 日期时间填充 374

18.3.1 日期级别填充 374

18.3.2 小时级别填充 376

18.3.3 带间隔的填充 377

18.4 按日期分摊 378

18.4.1 起止日内按日分摊 379

18.4.2 起止日内按月分摊 381

18.4.3 在开始日期后按月分摊 384

18.4.4 关于分摊 386

第19 章  查询优化 388

19.1 优化设置 388

19.1.1 全局−数据加载 388

19.1.2 全局−Power Query编辑器 388

19.1.3 全局−安全性 389

19.1.4 全局−隐私 389

19.1.5 当前工作簿−数据加载 389

19.1.6 当前工作簿−其他选项 390

19.2 使用缓存 391

19.2.1 强制计算 391

19.2.2 缓存结果 393

19.3 处理响应滞后 396

19.3.1 优化策略 397

19.3.2 体验响应滞后 397

19.3.3 重构解决方案 399

19.3.4 调整预览数据 401

19.4 处理公式防火墙 401

19.4.1 隐私级别不兼容 402

19.4.2 数据源访问 402

19.4.3 重建数据组合 402

19.4.4 连接式重构 404

19.4.5 展开式重构 406

19.4.6 传值重构 408

19.4.7 关于公式防火墙 410

第20 章 自动刷新 412

20.1 Excel自动刷新选项 412

20.2 Excel计划刷新 412

20.2.1 后台刷新 412

20.2.2 每x分钟刷新一次 413

20.2.3 打开文件时刷新数据 413

20.2.4 启用快速数据加载 413

20.3 用宏实现自动刷新 414

20.3.1 刷新单个连接 414

20.3.2 按特定顺序刷新 416

20.3.3 刷新所有查询 418

20.3.4 同步刷新的问题 418

20.4 Power BI 中的计划刷新 418

为您推荐