数据科学家是不是特有前途的职业?
人工智能和大数据热起来。无数培训班开始靠讲 Python、机器学习等课大赚其钱,大学里的那些稍沾点边的商科专业都开始设立建模预测的课程。在企业里收到的简历也是越来越多地号称耍过神经网络、深度学习,经历过 N 多建模预测的项目。未来的职场,看起来会有满世界的数据科学家。
从需求端角度上看确实有这种趋势。数据慢慢积累上来了,人工智能概念也在迅速普及,人们都开始有了这种意识,都想利用积累的数据做些分析预测之类的事情,这类业务就逐步变得很多,自然对从业人员的需求就变多了,而现在总体来讲数据科学家又少又贵还是个常态,有点 AI 技能的找个工作都不难,老板还天天担心你跑掉。
但是,数据科学家作为一种职业,长远一点看却未必很有前途。
为啥?
因为还有一个领域也开始被人工智能带得热门起来了,就是自动机器学习软件。
比如这个,国内知名数据软件公司润乾出品的易明建模 YModel,地道国货,还完全免费,去润乾官网就可以下载。来感受一下:
只要把数据准备好丢进去,几分钟就能建好模型用于预测了,过程中基本不需要懂数据挖掘的人介入,也就是最后看效果时需要了解一些模型评价的指标就可以。麻烦的事都是数据准备,这是自动化软件不会做的事,但也和数据科学家擅长的事不搭界。
这只是其中比较轻量级的一款,还有更多能自动做机器学习的软件,包括 google 等大牌厂商都在加入这个阵营。
如果你没有认真学习这些建模算法的原理,只是在培训班和速成课里学过些概念和操作,那你还不见得做得过这玩意儿。
在实践这个易明建模软件的过程中发生过 N 回这种情况,程序写得很溜的 IT 专业同学,使用 Python 开源包建出来的预测模型,准确率就是赶不上它。其实易明建模也是用 Python 开源包做的,大家用的是同一套基础东西。但是,只懂 IT 的同学常常没有认真系统地学过这些模型算法的原理,不知道数据该怎么做预处理、什么情况该做纠偏了、补缺失值时该用啥规则;也不知道这几十种算法哪种各有啥特点、适合啥场景、又该填什么样的参数。要认真系统地学习人工智能算法原理,大体相当于读半个统计专业的博士,几个月的速成培训班是搞不定的。
而易明建模中却固化了统计专家数十年的经验,这样只擅长 IT 技能的数据挖掘入门级选手当然就做不过了。而且,不仅准确率更好,工作效率也差很多啊,这玩意儿跑个三分钟就能出模型,人工来做怎么也得搞上几天吧;更关键的是,这个软件还不要钱,还能没日没夜地干活,而一个数据科学家的工资得多少?你说未来的老板们面对这种情况会怎么想?
结果,粗略学过机器学习知识的普通型数据科学家,还不如那些有行业经验的从业人员更管用。丰富的业务经验还能把数据准备得更好,从而也能让模型做得更精准。自动化建模软件也只能解决人工智能的技术问题,没办法自动发现业务知识,所以即使有自动化软件也需要好的业务知识配合才能建出好模型。
未来的职场,大概率不会是满世界的数据科学家,而是满世界的自动人工智能软件加行业业务专家。
打个比方,就像现在医院里做化验。以前,需要相当技能的人员才搞得了,也只有高级医院才配得起,这些人也很吃香;后来呢,后来自动化仪器来了,是个人都会做了,是个医院也都能做了。
这么一说,是不是感到危机重重?数据科学家这职业是不是彻底凉凉了?
那当然也不是。
像易明建模这样的自动化 AI 软件也是要人去做的,这更需要优秀的数据科学家才做得出来了。而且,软件也没那么智能,总有搞不定的情况,这时候仍然需要精通算法原理的数据科学家才能搞定。不过,精通算法原理是前提,否则,软件搞不定的事你也搞不定。
只是,成为这种人的难度当然很大,而且这种人的需求量也不会很大,大部分常规的数据科学事务都会被自动化的软件替代掉。
数据科学家这个职业很有前途,但仅限于下过苦功 N 年寒窗的顶尖高手。街上培训班或者大学里速成班里涮一下出来的,那还是省省吧。
易明智能建模资料
版权声明: 本文为 InfoQ 作者【🧸漫月柒七】的原创文章。
原文链接:【http://xie.infoq.cn/article/8f1ee2760b4be318b2c919b5c】。文章转载请联系作者。
评论