2021 年了,数据分析还吃香么?
00|背景
笔者近期因为个人原因,萌生了更换工作的念头。在仔细盘点了自己的技能树后,发现除了一些服务软技能外,数据分析可能是笔者日常使用较多的场景了,因此打算对目前市场上的数据分析的岗位要求和现状进行一轮分析,以期待能指导自己进行下一轮职业选择。
01|结论
如果各位看官时间不多,可以先看分析结论。
上海地域需求最旺盛,如果想要更快的入职且没有地域倾向的话,可以按照“上海>广州>深圳>北京>杭州>武汉>成都>南京>苏州>重庆”的地域排序进行考虑。
北京地域给出的薪资最高,如果想要挣得更多且没有地域倾向的话,可以按照“北京>上海>深圳>杭州>无锡>南京>广州>苏州>长沙>重庆”的地域排序进行考虑。
市场对学历和行业经验都较为看重,尤其是事业单位和国企。其中事业单位对本科及以上学历的要求高达 100% ,国企对本科及以上学历的要求也超过 90%。如果个人学历一般的话,建议考虑民营公司。
市场上能给出 50w 以上薪资的单位非常少,占比仅 1.4%。该类单位主要分布在互联网大厂,如头条,腾讯,美团等。且类似单位对招聘人才的工作经验的要求一般是 5-7 年。
数据说明:
本文所有分析结果均隐含条件“数据分析岗位”,后面章节不再赘述。
本文的分析样本取样自前程无忧网站 11 月仍旧发布的招聘信息。因网站招聘信息可能存在客观失真情况,已对相关数据进行清洗。
本文内容仅涉及对单个网站数据分析类岗位的招聘现状分析,不涉及趋势分析及未来预测。
02|数据分析的现状
随着大数据技术的发展,数据在公司的日常运营和决策中的地位也越发重要。相应的,市场上也逐渐出现了各式各样的数据分析类的工作。如偏向底层数据技术的算法工程师,数据仓库工程师,数据挖掘工程师。偏向业务场景的数据分析师,数据产品经理,用户增长师等。从本质上来说,数据分析是一项技能,人人可以学,人人可以用。但是在企业实际运转过程中,会因为企业目标的不同而构建不同的数据团队,拆分不同的数据职能。理想情况下清晰的岗位划分,在真实的业务环境中,可能会存在较大的偏差。因此本文不对数据岗位做进一步拆分,主要就数据分析的这个大类的招聘情况做简要分析。
03|数据分析的市场
鉴于上文对数据分析的现状说明,下文将详细展开数据分析的市场情况分析。
数据来源:
本文选择 前程无忧 作为职位需求数据来源,选择招聘职位信息中包括“数据”,“分析”,“挖掘”,“增长”等字段,选择截止到 2021 年 11 月 11 日仍旧活跃的招聘信息作为筛选条件获得原始数据。
对原始数据进行剔重,清洗,过滤后得到的目标分析数据共计 9600+,下文内容主要就清洗后的数据展开。
因招聘数据中薪资一般以区间的方式呈现,如“5-10 万/月”,“60-80 万/年”等,本文将区间薪资数据拆分并进行平均化处理,最终统一以平均年薪展开。如“5-10 万/月”的平均年薪为 90 万/年。
本文统计的薪资为招聘界面显示的基本薪资。一般大公司会有奖金激励+股权激励等额外福利,实际最终的年总包可能远超基本薪资年包。
数据结论:
从图 1|不同城市职位需求数分布情况 可以看出,“北上广深”作为老牌的一线城市,确实有着无与伦比的综合实力和竞争力,整体职位需求数占全部地域的一半以上。新一线城市如“杭州”,“武汉”,“南京”,“成都”等地域也基本符合我们对其竞争力的认知。
从图 2|职位需求数 Top10 城市及薪资分布 可以看出,职位需求数最高的城市是上海,处于第二梯队的是广州,深圳,北京。职位需求数据和对应的平均薪资呈现非线性关系。
从图 3|平均薪资 Top10 城市及职位需求数情况 可以看出,平均薪资最高的城市是北京,处于第二梯队的是广州,深圳,杭州,第三梯队的是无锡,南京,广州等。
对比各地域的平均年薪和中位数年薪,可以发现二者呈现相关性趋势。另外平均年薪均大于中位数年薪,可推测存在超大年薪影响的情况,拉高了整体的年薪均值。
从图 4|不同学历及工作经验人员的职位需求数分布 和 图 5|不同公司的不同学历人员需求分布 可以看出,市场上对学历的要求仍旧较高,本科及以上学历要求占比 73%,其中事业单位对学历要求最高,本科及以上学历要求占比 100% ,硕士及以上学历要求占比 68%。以本科学历需求人员来看,行业经验同样重要,1 年以上经验占比 76%。
从图 6|不同类型及规模公司的职位需求数分布 可以看出,不同类型的公司对数据分析类人才的需求情况不一样。就最终的需求数而言,民营企业占比最高,且民营企业中 50-500 人规模的公司占比最多。
取平均薪资大于 50w 的职位进行分析,一般需要 5-7 年工作经验,其大部分来自于民营公司。
04|认知验证
随着对数据分析岗位的市场现状的逐步说明,忽然脑壳中冒出来一个想法,我们一般意义上认为的地域是薪资的一个重要参考因素是否有统计学的意义,即需要验证仅地域不一致的情况下,薪资数据是否有显著性差异。下文主要对该部分的认知的验证展开。
基本概念:显著性差异是一个统计学名词。它是统计学上对数据差异性的评价。通常情况下,只有当实验结果达到 0.05 水平或者 0.01 水平,才可以说数据之间具备了差异显著或者极显著。
假设命题:在学历,工作经验年限等因素一致的情况,不同地域的人员薪资存在差异。
数据来源:分别取“广州”和“深圳”两个非常接近的一线城市的具有相同"本科"学历,“3-4 年工作经验”的招聘数据进行分析。
分析过程:
分析结果:
从上图可以发现,针对随机抽取的 238 组数据看,其中 F 大于 F crit,且 P-value 大于 0.01,小于 0.05。说明两组数据在 a=0.05 的水平上,存在显著差异,即不同地域同类型人员的薪资确实会因地域不同而存在差异,即使是广州和深圳这两个同是第一梯队的地域。
05|工具说明
工具版本说明:
python 3.9 (编译环境 Sublime Text3),excel 2020, mysql 8.0
文章用时分布:
总用时 5 天,其中 python 及 mysql 环境准备 1 天,爬虫准备 2 天(编程基础太薄弱), 数据分析及文档编写 2 天。
参考文章:
基于网络招聘信息的分析与挖掘:https://wenku.baidu.com/view/79f0479d1b37f111f18583d049649b6648d70991.html
python 安装参考指导:
https://www.cnblogs.com/mini-monkey/p/11544259.html
Sublime Text3 配置 python3 环境
https://blog.csdn.net/samenmoer/article/details/89740271
python 爬虫:
版权声明: 本文为 InfoQ 作者【好奇分析】的原创文章。
原文链接:【http://xie.infoq.cn/article/9cb82e39696374575853a5f5a】。文章转载请联系作者。
评论