数据分析中应该掌握的五个数学概念
前言
日常数据分析过程中,常常会涉及到数字类,表格类资料的处理。此类资料中的数学术语和概念较多,基础较薄弱的同学可能难以理解,本文主要就资料分析中应该掌握的概念进行通俗讲解。期待大家能有所收获。
一. 同比/环比
如果要挑选一个最容易混淆的概念,我个人首选是这个。很多同学在新闻报道中都有听到过这类的词语,如“2020 年 3 月全国肉及肉制品出口为 139641 万元,环比增加 22.8%,同比增加 21.5%“,如“2020 年一季度河南省粮食总产量为 10054 万吨,同比增长 5.7%,环比增长 4.6%”。我们自己在做相关数据分析时,也经常会使用到类似表达,如“2021 年 7 月销量为 8000 件,同比增加 X%,环比增加 X%"。因此如果我们对同比和环比的概念混淆了,对应的表达结果可能就大相径庭。
同比增长,即现在这个时期与紧前一个周期中的相同时期相比的增长。比如:今年 2 月与去年 2 月相比的增长就是同比增长。
环比增长,即现在这个时期与紧前一个时期相比的增长。如:今年 2 月与今年 1 月相比的增长就是环比增长。
如何记牢这个概念呢?
从名词上理解
环比:环比“环”也,环就是圈,环比就是和周围的临近的相比。
同比:同比“同”也,取相同之意,同比就是往年同期相比。
通过英文来理解
环比是由 month-on-month 翻译过来的。
同比是由 year-on-year 翻译过来的。
通过图表加强记忆
二. 倍数和翻番
倍数是两个有联系指标的对比。如 2017 年,日本专利局受理了 318479 件发明专利申请,美国专利局受理了 606956 件发明专利申请。则 2017 年美国专利局受理的发明专利申请是日本的 606956/318479 = 1.9 倍。
翻番指数量加倍。翻一番为原来的 2 倍;翻两番为原来的 4 倍;依此类推,翻 n 番为原来的 2^n 倍。这个概念对于喜欢打麻将或者斗地主的人应该比较熟悉。
需要注意的是:
倍数,只能用于数字的增加,不能用于数字的减少。可以说“增长多少倍“,扩大多少倍”,“提高多少倍”,但一般不说“降低多少倍”,“缩小多少倍”,“减少多少倍”。
运用倍数时,还要注意用词的准确,如“增加了两倍”即原来是 n,现在是 3n。“增加到两倍”,即原来是 n,现在是 2n。这里的“了”和“到”不能缺少,也不能互换。
运用倍数时,且需要注意“超过 N 倍”和“是 xx 的 N 倍”两种说法的区别。超过 N 倍,说明是基数的 N+1 倍。
可以参考一道公务员行测考题加深理解:
2013 年中部六省城镇单位就业人员平均工资的算术平均值与 2001 年相比,( )。
A. 增长了 32583 元
B. 翻了两番
C. 增长了 5 倍以上
D. 增长了 4.1 倍
解析:2013 年六省平均值为:(38301+40407+43890+47806+42726+42473)/6=42600.5。2001 年六省平均值为:(7916+8122+8519+7908+9603+8026)/6= 8349。
则 2013 年六省平均值相比较 2001 年而言,增加(增长)到 42600/8349 = 5.1 倍 ,增加(增长)了 4.1 倍,增长了 42600.5-8349= 34251 元,翻了 2 番多。
三. 增长量和增长率
增长量:绝对量,有单位(增长或增加+单位),一般用最多,最少来形容。
增长率:相对量,无单位(百分数),一般用最快最慢来形容。
增长率=增长速度(增速)=增长幅度(增幅)
在一些“最值”表述中,经常出现“增加(长)最多”和“增加(长)最快”,我们需要注意,前者比较的是增长量,而后者则比较的是增长率。
四. 百分数和百分点
百分数是量 A 占量 B 的百分比例:A÷B×100%,在数学中用“%”来表示,在文章中一般都写作“百分之多少”。百分数与倍数不同,它既可以表示数量的增加,也可以表示数量的减少。
百分点是指不同时期以百分数形式表示的相对指标(如:速度、指数、构成等)的变动幅度。和百分数类似,但是百分点不带百分号。
需要注意:
1.注意概念的精确。如“比过去增长 20%”,即过去为 100,现在是“120”;“比过去降低 20%”,即过去是 100,现在是“80”;“降低到原来的 20%”,即原来是 100,现在是“20”。
2.运用百分数时,还要注意有些数最多只能达到 100%,如产品合格率,种子发芽率等;有些百分数只能小于 100%,如粮食出粉率等;有些百分数却可以超过 100%,如产品产量计划完成情况等。
3.“占”、“超”、“为”、“增”的用法,“占计划百分之几”指完成计划的百分之几;“超计划的百分之几”,就应该扣除原来的基数(-100%);“为去年的百分之几”就是等于或相当于去年的百分之几;“比去年增长百分之几”应扣掉原有的基数(-100%)。
4.举例我国国内生产总值中,第一产业占的比重由 1992 年的 21.8%下降到 1993 年的 18.2%。则我们可以说:国内生产总值中,第一产业占的比重,1993 年比 1992 年下降 3.6 个百分点(18.2-21.8=-3.6);但不能说下降 3.6%。
五. 年均增长
年均增量表示的是 N 年间增量的绝对平均值。年均增量=(B-A)/n,注意初始值为 A,第(n+1)年为 B。如计算 2011 年-2015 年这五年的数据变化,需要注意 n = N-1 = 2015-2011 =4。
则年均增量 = (2015 年的数据量-2011 年的数据量)/(2015-2011)。
年均增长率表示的是 N 年间的年平均增速,因为涉及平方与开方,计算较复杂一点。
公式为:(1+r)^n=B /A。
如计算 2011 年-2015 年这五年的数据变化情况,则 r = (B/A)四次方根 - 1
版权声明: 本文为 InfoQ 作者【好奇分析】的原创文章。
原文链接:【http://xie.infoq.cn/article/d823f99ae8c89822fa004a062】。文章转载请联系作者。
评论