如何高效清洗数据?试试这款神器
在大数据时代,数据的来源具有多样性、复杂性。
针对数量庞大、渠道及格式多样的数据,数据清洗就成为刚需。
在数据分析中,数据清洗实际上是十分繁重且关键的一步。
Power Query 作为数据清洗的工具,能将这些多源的数据集中并统一转换成所需要的格式,为数据分析创造前提条件。
此外,Power Query 还能使办公自动化更进一步,与常用办公软件 Excel 无缝衔接,使日常的重复工作实现自动化,得到高效并准确的处理结果,不仅可以为企业节省人力成本,还可以为个人节省时间。
在未使用 Power Query 之前,《Power Query 实战:Excel 智能化数据清洗神器应用精讲》一书的作者常用的是 Excel 中的函数,但是自从使用了 Power Query,很多在 Excel 中看似困难的操作只需要进行简单的处理即可完成,甚至都不需要自己编写函数,直接在操作界面中操作即可。
对于没有编程经验的人来说,使用 Power Query 的关键就是搞清楚数据的格式,如果理解了这一点,那么在使用函数的过程中会容易很多。
本书特色
Power Query 中的函数多达几百个,选择案例中介绍的那些常用的函数并熟练运用,基本上可以解决工作中遇到的大部分问题。
本书不仅说明了操作过程,还帮助读者拓展思路,使读者能够举一反三地来解决问题;同时,通过丰富的案例对函数的计算过程进行详细解释,使读者能够更好地理解函数的计算过程,更清楚函数的计算逻辑。
本书读者对象
经常使用 Excel 的办公人员
经常需要整合各个渠道数据的人员
经常需要生成不同报表的统计人员
企业运营管理及分析人员
做市场分析的统计人员
其他对数据整理及分析感兴趣的人员
本书内容
第 1 章:主要介绍 Power Query 的一些基本概念,如 Power Query 的作用、打开方式、主界面功能、数据类型、函数概况、基础语法、数据的引用方式等。
第 2 章:介绍 Power Query 中从多种数据源导入数据的方法,如从 Excel 工作簿、工作表、表格、文本文件、文件夹、MySQL 数据库、Web 页面及其他数据源导入数据。
第 3 章:以自制文件管理器作为案例,通过数据的获取、提取、判断和筛选等方式来熟悉一些基本操作,最后利用批处理文件来批量移动、复制、删除和重命名文件。
第 4 章:对比 Excel 中的条件计算公式,了解 Power Query 中的数据自动化清洗计算功能。
第 5 章:对比 Excel 中的数据去重及数据匹配功能,了解 Power Query 中 VLOOKUP 匹配函数的实现方法。
第 6 章:对比 Excel 中提取文本中数据的方法,了解 Power Query 中功能更强大的提取方式,包括提取任意数字、英文、符号及指定国家语言字符等。
第 7 章:对比 Excel 中的绝对引用和相对引用,了解在 Power Query 中实现相对引用、绝对引用和混合引用的方法。
第 8 章:以电商平台批量上传产品数据表作为案例,通过分析目标表格式,介绍如何使用 Power Query 对源数据表格进行清洗并达到目标表格式的要求,以及如何处理标题内容和列的顺序不符合要求的表格。
第 9 章:以库存的断码缺货及补货作为案例,通过 Power Query 对数据进行清洗,使其能自动显示断码缺货的情况及补货的需求。
第 10 章:对比 Excel 中的“分列”功能,Power Query 中“拆分列”功能的规则具有多样性,不仅可以按分隔符、按字符数、按位置来拆分列,还可以按照既有规则转换拆分列,以及自定义规则转换拆分列(如中文转英文、英文转数字等)。
第 11 章:使用 Power Query 对合并单元格的数据进行处理,使其成为可用于分析的数据,包括列标题的合并、行标题的合并、数据值的合并等。
第 12 章:主要介绍 Power Query 中时间类函数的应用、日期及时间类函数的主要分类、日期格式的互相转换等,以排班表和账期计算作为案例来充分展示时间类函数的应用。
第 13 章:主要介绍如何提取带有 table 标签的网页数据,如何对 JSON 格式的数据进行清洗,以及如何提取代码中的指定数据。
第 14 章:主要介绍 Power Query 中的函数概念、自定义函数的备注,以及自定义函数实战。
第 15 章:使用 Power Query 进行人工智能开发,通过解读开放文档中的说明,连接开放的 API,使数据处理更加智能化。
限时五折优惠,快快扫码抢购吧!
每日抽奖
奖品《学习的学问》
评论