AI 浪潮下的认知重构:从一个数据老兵的转型思考

2023 年 1 月,我自己第一次接触 ChatGPT。
说实话,当时的心情挺复杂的。做了 20 多年数据,从传统数仓到大数据平台、中台、数据分析商分等。自认为在这个领域还算个"老司机"。结果呢?一个 AI 工具,几秒钟就能写出比我优化了好几遍的 SQL 还要简洁的代码。
那一刻,我突然意识到:游戏规则变了。
从数据到 AI,我经历了什么
初次邂逅:带着探索者的心态
刚开始接触 GPT 时,我的心态可以用三个词概括:无目的、好奇、贪婪。
被拉入不同的 GPT 的群,试着用它当写作助手,效率确实高得吓人。但更让我震撼的是,当我把股市新闻数据喂给它做分析时,训练出的模型效果堪比 3-5 年经验的分析师。这是 23 年 4-7 月份干的事情。复盘的结果惊艳到我与各位群友。
这 TM 的...我这 20 年算是白干了?
深入探索:从工具到伙伴
3 月份开始,我不满足于简单使用,开始本地搭建模型、调用 API 做联合训练。到了 4 月,用 AutoGPT 做控制,在金融分析复盘上的效果让前同事都想拉我一起创业。
慢慢地,大模型从一个工具变成了我的工作伙伴:
写脚本和正则表达式
从图像、视频中提取数据
营销场景 Prompt 的尝试
多语言翻译、文章精简
PPT 思路整理、创意头脑风暴
朋友说我的工作效率真高,很多内容产出很快。其实他们不知道,我已经离不开这个"小助手"了。
传统的一切都在崩塌,真的
编程?70%的工作 AI 都能干
看看我们数据工程师的日常:
写 SQL(15%工作量)- AI 能写
数据迁移(10%)- 大部分可自动化
数据采集(10%)- 重复性极高
离线数据处理(10%)- 标准化流程
算下来,日常工作中 70%是重复劳动,80%需要跟文本打交道。这些,AI 都能搞定。
更扎心的是,当我用大模型做数据建模时,从业务分析到多维模型设计,它能像个资深架构师一样跟我对话,提出的问题比很多初级工程师还要专业。
数据分析师,你还好吗?
作为在数据领域摸爬滚打这么多年的人,我必须说:数据分析师这个岗位正在经历巨变。
以前的数据分析师:
门槛很低(会 SQL 就行)
存在感很低(经常被优化)
天花板很低(很难往上走)
现在呢?AI 让门槛更低了,但也让天花板更高了。为啥?因为当基础工作都能被 AI 搞定时,真正的价值在于:
知道该问什么问题
能判断 AI 的答案对不对
会把业务问题翻译成数据问题
懂得在合适的场景用合适的方法
教育?别逗了
我朋友的孩子还在背古诗词。我就想问:AI 随便一搜就有的东西,背它干嘛?
当然,我也不是说完全不用学。只是现在这种填鸭式教育,在 AI 时代真的还有用吗?知识获取成本已经接近零了,还在比谁记得多?
认知结构:你唯一的护城河
知识 vs 认知结构
打个比方:
知识就像手机里的 APP,随时可以装卸
认知结构就像操作系统,决定你怎么用这些 APP
再具体点:
会写 SQL 是知识,知道什么时候用 SQL 什么时候用 NoSQL 是认知结构
会用 Transformer 模型是知识,理解为什么这个场景要用 Transformer 是认知结构
说白了,AI 可以告诉你所有的"是什么",但"为什么"和"怎么用",还得靠你自己的认知结构。
为啥 AI 搞不定认知结构?
因为认知结构太个性化了。
我在传统制造业待过,在阿里待过,现在自己创业。这些经历让我形成了独特的判断标准。比如做数据平台,是选"大而全"还是"小而美"?AI 可以列出两种方案的优缺点,但最终选哪个,得基于你的价值判断。
现实工作哪有那么多标准答案?预算不够、时间太紧、老板想法一天三变...在这种环境下做决策,需要的不是教科书上的理论,而是"差不多就行"的智慧。
用未来的眼光看现在
这是我最近悟出来的:别老想着你会什么,想想未来需要什么。
未来大概率是这样的
根据我的观察和思考:
AI 助手会比手机还普及
大部分执行性工作会被自动化
人类主要做"拿主意"的事
如果真是这样,什么能力会值钱?
我觉得是这些:
会质疑(AI 说的不一定对)
会连接(把不相关的东西联系起来)
会判断(知道什么时候该信 AI)
会创造(哪怕是微创新)
一个真实的例子
上个月,公司要做用户行为分析。年轻同事直接问 AI 怎么做,AI 给了个标准流程,看着挺专业。
我就问了几个问题:
咱们用户都是谁?
分析了要干嘛?
数据靠谱吗?
老板到底想看啥?
这些问题 AI 答不了,因为它不知道我们的具体情况。最后我们搞了个完全不一样的方案,简单粗暴但管用。
这就是认知结构的价值:在标准答案之外,找到最适合的解决方案。
当大模型遇上大数据
作为一个数据老兵,我必须聊聊这个。
ETL 的未来在哪?
传统 ETL 工作,70%是重复劳动。写 SQL、数据清洗、模型调整...这些 AI 都能干。
但问题是:为什么数据处理过程不能完全交给大模型?
因为:
数据质量问题千奇百怪
业务逻辑经常变
性能优化需要经验
故障排查需要直觉
所以,ETL 工程师不会消失,但会从"搬砖工"变成"指挥官"。
数据建模的新玩法
之前我尝试用大模型辅助数据建模,效果出奇的好。
比如构建一个数据仓库模型:
让 AI 扮演资深架构师,检查我的设计
让它从业务角度提出质疑
自动生成实体关系图
快速构建多维模型
以前需要一个团队干一个月的活,现在一个人配合 AI,一周就能出初稿。
基于 AI 大模型的原生产品
说完辅助,咱们聊聊更猛的——直接基于大模型做的原生产品。
最近我们搞了个一套智能分析系统,这玩意儿让我真正见识到了什么叫"降维打击"。
传统复杂的应标书啥样?
l 投标文件几千页,看到眼花
l 评标专家一坐一整天
现在呢?利用大模型技术+大数据技术双引擎重构了整个流程:
l 基于 200 多条规则库和上万个历史案例训练出来的。合规性检查、条款完整性、甚至反围标条款,全部自动搞定。
l 以前人工清标,十几个人对着 Excel 表格一项项核对,并且需要再几千页的复杂 pdf 文章中提取查找。现在?大模型几分钟搞定。不只是简单的数据比对,而是真正理解标书内容,能识别出"换个说法"的相同内容,甚至能发现逻辑矛盾。可以细化到一堆表格零件细节做分析。
l 最骚的是什么?几十套大数据分控模型。通过分析投标文件的写作风格、用词习惯、甚至标点符号使用,能识别出是不是同一个人写的多份标书。有次真的抓出来三家公司的标书是一个人写的,现场打脸。
效果怎么样?
l 招标准备时间从 2 周缩短到 2 天
l 评标效率提升 10 倍
l 串标围标识别准确率达到 85%
l 最关键的:争议减少了 70%(因为 AI 的判断有据可查)
说实话,刚开始我也担心,这么重要的事交给 AI 靠谱吗?但用下来发现,AI 不是要替代人的判断,而是把人从繁琐的事务中解放出来,专注于真正需要经验和智慧的决策。
这就是我理解的 AI 原生产品:不是简单地用 AI 优化某个环节,而是用 AI 的思维重新设计整个业务流程。当你这么做的时候,效率提升就不是 10%、20%的问题,而是数量级的飞跃。
写在最后
这几年多的 AI 之旅,改变最大的不是我的技能,而是思维方式。
以前总想着学更多知识,现在明白了:在 AI 时代,重要的不是你知道多少,而是你能创造什么。
记住几点:
AI 是工具,别怕它
知识会过时,思维方式不会
不是啥都要学,学有用的
从未来看现在,别纠结过去
最后想说,作为一个从数据仓库时代走过来的"老人",我见证了太多技术变革。但这次不一样,AI 不是在优化我们的工作,而是在重新定义工作本身。
路还长,慢慢走。但方向要对。
对了,如果你也在思考这些问题,欢迎一起聊聊。毕竟在这个时代,谁也不敢说自己看清了未来。
(这篇文章有些观点可能过两年就被打脸,但 who cares,当下的思考才是最真实的)
版权声明: 本文为 InfoQ 作者【松子(李博源)】的原创文章。
原文链接:【http://xie.infoq.cn/article/075affc717dad6a9c1f20821e】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论