写点什么

AI 浪潮下的认知重构:从一个数据老兵的转型思考

  • 2025-06-04
    北京
  • 本文字数:2859 字

    阅读完需:约 9 分钟

AI浪潮下的认知重构:从一个数据老兵的转型思考

2023 年 1 月,我自己第一次接触 ChatGPT。

说实话,当时的心情挺复杂的。做了 20 多年数据,从传统数仓到大数据平台、中台、数据分析商分等。自认为在这个领域还算个"老司机"。结果呢?一个 AI 工具,几秒钟就能写出比我优化了好几遍的 SQL 还要简洁的代码。

那一刻,我突然意识到:游戏规则变了。

从数据到 AI,我经历了什么

初次邂逅:带着探索者的心态

刚开始接触 GPT 时,我的心态可以用三个词概括:无目的、好奇、贪婪。

被拉入不同的 GPT 的群,试着用它当写作助手,效率确实高得吓人。但更让我震撼的是,当我把股市新闻数据喂给它做分析时,训练出的模型效果堪比 3-5 年经验的分析师。这是 23 年 4-7 月份干的事情。复盘的结果惊艳到我与各位群友。

这 TM 的...我这 20 年算是白干了?

深入探索:从工具到伙伴

3 月份开始,我不满足于简单使用,开始本地搭建模型、调用 API 做联合训练。到了 4 月,用 AutoGPT 做控制,在金融分析复盘上的效果让前同事都想拉我一起创业。

慢慢地,大模型从一个工具变成了我的工作伙伴:

  • 写脚本和正则表达式

  • 从图像、视频中提取数据

  • 营销场景 Prompt 的尝试

  • 多语言翻译、文章精简

  • PPT 思路整理、创意头脑风暴

朋友说我的工作效率真高,很多内容产出很快。其实他们不知道,我已经离不开这个"小助手"了。

传统的一切都在崩塌,真的

编程?70%的工作 AI 都能干

看看我们数据工程师的日常:

  • 写 SQL(15%工作量)- AI 能写

  • 数据迁移(10%)- 大部分可自动化

  • 数据采集(10%)- 重复性极高

  • 离线数据处理(10%)- 标准化流程

算下来,日常工作中 70%是重复劳动,80%需要跟文本打交道。这些,AI 都能搞定。

更扎心的是,当我用大模型做数据建模时,从业务分析到多维模型设计,它能像个资深架构师一样跟我对话,提出的问题比很多初级工程师还要专业。

数据分析师,你还好吗?

作为在数据领域摸爬滚打这么多年的人,我必须说:数据分析师这个岗位正在经历巨变。

以前的数据分析师:

  • 门槛很低(会 SQL 就行)

  • 存在感很低(经常被优化)

  • 天花板很低(很难往上走)

现在呢?AI 让门槛更低了,但也让天花板更高了。为啥?因为当基础工作都能被 AI 搞定时,真正的价值在于:

  • 知道该问什么问题

  • 能判断 AI 的答案对不对

  • 会把业务问题翻译成数据问题

  • 懂得在合适的场景用合适的方法

教育?别逗了

我朋友的孩子还在背古诗词。我就想问:AI 随便一搜就有的东西,背它干嘛?

当然,我也不是说完全不用学。只是现在这种填鸭式教育,在 AI 时代真的还有用吗?知识获取成本已经接近零了,还在比谁记得多?

认知结构:你唯一的护城河

知识 vs 认知结构

打个比方:

  • 知识就像手机里的 APP,随时可以装卸

  • 认知结构就像操作系统,决定你怎么用这些 APP

再具体点:

  • 会写 SQL 是知识,知道什么时候用 SQL 什么时候用 NoSQL 是认知结构

  • 会用 Transformer 模型是知识,理解为什么这个场景要用 Transformer 是认知结构

说白了,AI 可以告诉你所有的"是什么",但"为什么"和"怎么用",还得靠你自己的认知结构。

为啥 AI 搞不定认知结构?

因为认知结构太个性化了。

我在传统制造业待过,在阿里待过,现在自己创业。这些经历让我形成了独特的判断标准。比如做数据平台,是选"大而全"还是"小而美"?AI 可以列出两种方案的优缺点,但最终选哪个,得基于你的价值判断。

现实工作哪有那么多标准答案?预算不够、时间太紧、老板想法一天三变...在这种环境下做决策,需要的不是教科书上的理论,而是"差不多就行"的智慧。

用未来的眼光看现在

这是我最近悟出来的:别老想着你会什么,想想未来需要什么。

未来大概率是这样的

根据我的观察和思考:

  • AI 助手会比手机还普及

  • 大部分执行性工作会被自动化

  • 人类主要做"拿主意"的事

如果真是这样,什么能力会值钱?

我觉得是这些:

  • 会质疑(AI 说的不一定对)

  • 会连接(把不相关的东西联系起来)

  • 会判断(知道什么时候该信 AI)

  • 会创造(哪怕是微创新)

一个真实的例子

上个月,公司要做用户行为分析。年轻同事直接问 AI 怎么做,AI 给了个标准流程,看着挺专业。

我就问了几个问题:

  • 咱们用户都是谁?

  • 分析了要干嘛?

  • 数据靠谱吗?

  • 老板到底想看啥?

这些问题 AI 答不了,因为它不知道我们的具体情况。最后我们搞了个完全不一样的方案,简单粗暴但管用。

这就是认知结构的价值:在标准答案之外,找到最适合的解决方案。

当大模型遇上大数据

作为一个数据老兵,我必须聊聊这个。

ETL 的未来在哪?

传统 ETL 工作,70%是重复劳动。写 SQL、数据清洗、模型调整...这些 AI 都能干。

但问题是:为什么数据处理过程不能完全交给大模型?

因为:

  • 数据质量问题千奇百怪

  • 业务逻辑经常变

  • 性能优化需要经验

  • 故障排查需要直觉

所以,ETL 工程师不会消失,但会从"搬砖工"变成"指挥官"。

数据建模的新玩法

之前我尝试用大模型辅助数据建模,效果出奇的好。

比如构建一个数据仓库模型:

  1. 让 AI 扮演资深架构师,检查我的设计

  2. 让它从业务角度提出质疑

  3. 自动生成实体关系图

  4. 快速构建多维模型

以前需要一个团队干一个月的活,现在一个人配合 AI,一周就能出初稿。

基于 AI 大模型的原生产品

说完辅助,咱们聊聊更猛的——直接基于大模型做的原生产品。

最近我们搞了个一套智能分析系统,这玩意儿让我真正见识到了什么叫"降维打击"。

传统复杂的应标书啥样?

l  投标文件几千页,看到眼花

l  评标专家一坐一整天

现在呢?利用大模型技术+大数据技术双引擎重构了整个流程:

l  基于 200 多条规则库和上万个历史案例训练出来的。合规性检查、条款完整性、甚至反围标条款,全部自动搞定。

l  以前人工清标,十几个人对着 Excel 表格一项项核对,并且需要再几千页的复杂 pdf 文章中提取查找。现在?大模型几分钟搞定。不只是简单的数据比对,而是真正理解标书内容,能识别出"换个说法"的相同内容,甚至能发现逻辑矛盾。可以细化到一堆表格零件细节做分析。 

l  最骚的是什么?几十套大数据分控模型。通过分析投标文件的写作风格、用词习惯、甚至标点符号使用,能识别出是不是同一个人写的多份标书。有次真的抓出来三家公司的标书是一个人写的,现场打脸。

效果怎么样?

l  招标准备时间从 2 周缩短到 2 天

l  评标效率提升 10 倍

l  串标围标识别准确率达到 85%

l  最关键的:争议减少了 70%(因为 AI 的判断有据可查)

说实话,刚开始我也担心,这么重要的事交给 AI 靠谱吗?但用下来发现,AI 不是要替代人的判断,而是把人从繁琐的事务中解放出来,专注于真正需要经验和智慧的决策。

这就是我理解的 AI 原生产品:不是简单地用 AI 优化某个环节,而是用 AI 的思维重新设计整个业务流程。当你这么做的时候,效率提升就不是 10%、20%的问题,而是数量级的飞跃。

写在最后

这几年多的 AI 之旅,改变最大的不是我的技能,而是思维方式。

以前总想着学更多知识,现在明白了:在 AI 时代,重要的不是你知道多少,而是你能创造什么。

记住几点:

  • AI 是工具,别怕它

  • 知识会过时,思维方式不会

  • 不是啥都要学,学有用的

  • 从未来看现在,别纠结过去

最后想说,作为一个从数据仓库时代走过来的"老人",我见证了太多技术变革。但这次不一样,AI 不是在优化我们的工作,而是在重新定义工作本身。

路还长,慢慢走。但方向要对。

对了,如果你也在思考这些问题,欢迎一起聊聊。毕竟在这个时代,谁也不敢说自己看清了未来。

(这篇文章有些观点可能过两年就被打脸,但 who cares,当下的思考才是最真实的)

 

发布于: 刚刚阅读数: 3
用户头像

还未添加个人签名 2018-10-30 加入

公众号:松子聊数据

评论

发布
暂无评论
AI浪潮下的认知重构:从一个数据老兵的转型思考_职场_松子(李博源)_InfoQ写作社区