DeepSeek 太火，但老板们别慌，这里有份 AI 项目开展手册

作者：快乐非自愿限量之名

2025-02-07
福建
本文字数：4219 字
阅读完需：约 14 分钟

这两天有老板陆续在咨询：到底应该如何基于 DeepSeek 开展 AI 项目？

抛开一些偏细节、偏敏感的付费内容，其实有一套方法论倒是可以分享。

第一，也是最重要一点：目标是什么？

AI 产品的目标是什么？

据群里的粉丝反馈，开工第一天几乎所有的老板都在讨论 AI、讨论 DeepSeek。

并有多个 CEO 表示：后续业务开展，全面拥抱 AI，并期待实现行业应用的领先！

说实话，这个味道很熟悉，基本又回到了两年前 ChatGPT 刚诞生的情况，很多公司出于焦虑或者想要抢占行业注意力，都做好了准备 All In AI，但这里我要泼一点冷水：你的急迫可能导致巨大损失！

一、DeepSeek 并没有领先于 GPT

首先，所有人必须认识到的一个事实是：虽然 DeepSeek 非常优秀，但他并没有领先于 GPT！

换句话说，之前各位可以根据 GPT 的 API 调用完成的功能，如果基座模型换成 DeepSeek 后，他的表现可能还会差点。

DeepSeek 真正的价值在于两点：

第一、合规性，他是国内的开源模型，并且能力优秀，这可以为医疗、金融等相对敏感的行业松绑，他们有更优的基座模型选择了。

而由于基座模型的进化可能带来的价值是：实现路径的大幅成本降低！这可以节约不少钱。

第二、可以私有化部署，并且训练的成本极低！

常规的 AI 产品基础技术架构事实上只有两条：API、API+知识图谱。

之前多数人认为预训练+微调是错误的技术选择，其核心是高昂的成本。

现在基于 DeepSeek 的微调貌似成本也不高，这会导致新的技术路径产生，而 API、API+知识图谱、基于微调的 AI 产品三者之间差异是什么，到底如何选择，很多人是模糊的。

二、可以兴奋但别焦虑

老板们逐渐相信 AI 会重塑所有，于是他们会想用 AI 的方式将公司产品重塑一次。

这会引发第一轮的焦虑，因为没有可以抄的对象，多数人是不知道怎么做的！所以多公司现在是既迷茫又兴奋：

兴奋的点在于，行业洗牌的机会来了，抓住了就是下一个头部；
迷茫的点在于，那是真的不知道该怎么做；

首先是 AI 对于自己的产品意义是什么，比如是产品用上 AI 的能力，还是用 AI 能力去重塑产品，不清楚；

其次是 AI 能力的边界在哪里，比如数据对于大模型幻觉的意义是什么，是否要投入大量资源去整理数据，不敢赌；

然后是具体的技术路径是什么，比如是 API 还是微调，不明白；

其实这里有个判断依据：在 DeepSeek 出现前，GPT 的表现已经足够优秀，如果你们公司在之前没出太多创新，今年也很难马上做出什么。

这里的原因是 AI 产品的非对称性。

三、非对称性

无论是 GPT 还是 DeepSeek，他们都太强大了，基于他们做出来的 AI 产品容易让我们产生一个幻觉：我们公司的 AI 太强大了！

醒醒吧，这是幻觉！AI 很容易产出一个 demo，但很难得到一个应用！

大白话是：业务判断 AI 产品能不能用的标志是能不能完全接管业务，如果不能就是玩具！

对于 AI 应用，你可以用一周时间完成一个 demo；但半年后，实现的产品效果依旧不能超越这个 demo！

这里非对称性也就出来了，花费 10%的资源可以得到一个 70 分的 demo；想要将 70 分推到 90 分，可能你需要 1000%的资源！

入门简单，精通难！大模型是很容易造成老板/产品/技术错误判断的存在，如果轻易承诺，肯定会坑了自己。

所以，想要 AI 在应用上表现出现，必须要有耐性！

四、耐心很重要

做 AI 项目，耐心是很很重要的，简单来说：你认为 Prompt 提示词困难吗？

Prompt 不是有手就行嘛，谁会中文还不会写点提示词，但 Prompt 其实很难：

首先，写出稳定输出的 Prompt 很难；
其次，在不同场景中 Prompt 要稳定输出更难；
最后，要与优质数据配合并且要稳定输出的 Prompt 很难；

这对我们的启示是什么呢？这对我们的要求是有耐心、有定力，不要因为今天产品表现得好而过分开心，也不要因为明天产品表现的弱智而过分焦虑。

保持平常心，去面对，去调整，因为提示词调优只是 AI 产品过程中最简单的部分，寻找正确的路径，试验正确的路径，才是其中的难点...

对于一般公司，AI 项目的成败取决于技术团队工程能力的强弱，以及对相关领域的认知！

所以好的程序员跨界去深入学习某行业知识，再转做产品经理会变得十分吃香。

其次，在基座模型能力上来后，大家都是在 70 分水准的基线上竞争，如何通过自身的优势快速达到 90 分会成为占领高地的关键。

不急不躁

有了以上认知后，我们会达成一个共识：我们离成熟的 AI 应用诞生还有一段时间（1-2 年），而就算已经有爆款产品出现，也不要慌张，产品层面的进步是最容易赶上的。他不会比 DeepSeek 比肩 GPT 更难！

所以，我们最应该想清楚两个问题：

目标是什么；
目标对 AI 能力的要求是什么；

如果 GPT 的能力值是 100 分（大学生水平），也许你的产品其实只需要 70 分（初中生水平）就够了呢？

在目标清晰后，就应该坚定的执行在这个窗口期（1-2 年）将配套设施打磨好，而不是急于推出产品去吸引注意力。

在这个基础上，我们再来探讨如何做技术选型。

技术选型

出于敏感性考虑，这块我会去除大量细节，请各位海涵

基础技术选型

最基础的技术选择无非三块，提示词、RAG 和微调，其优劣如表格所述：

产品实现路径

PS，这里涉及敏感信息，我做简要说明即可

其实，基础技术选型问题不值一提，他们既可以混用又可以不停转换，我们实际做开发过程中大概率三条路径都会用，所以这里的重点不是基础技术的选择而是产品实现路径的思考。

这里的核心为：模型只是一个 API 调用工具，工程实现是核心。

实际实现时候需要考虑几个点：

单纯基于大模型当前 AI 产品能达到的极限是什么，问题是什么；
基于 AI 产品的行业 KnowHow 是什么；
要打破 AI 产品的极限，需要的优质数据（数据+工程规则）是什么；
如何用工程的能力组织这套 AI 架构，实现数据、工程自迭代，最终形成飞轮系统；

具体来说：大模型的工作模式是输入输出：输入 -> Prompt -> 输出。

所有的工程能力全部会体现在这个 Prompt，所谓 Prompt 就是我们对规则理解的文字化。

比如要做的是 AI 律师，这里的 Prompt 就是某著名律师这 10 多年的经验。

这个经验是理解用户问什么，然后给予他正确的法律反馈，如何给予用户正确的反馈，这就是该合伙人需要给技术工程的优质数据，也就是 AI 律师需要的输入输出规则。

而这里的“优质数据又是如何形成的呢？”答案是基于 10 几年律师问答的总结整理，他需要深刻理解关于输入输出五个部分：

大量输入(输入材料的相关性)；
输入正确(输入材料的正确性)
输入可理解（输入材料的多样性，泛化相关思考）
输出假设和及时反馈(强化学习的关键)
检索强化(如果有知识图谱，可能会用到的)

但大模型是一个新生事物，他所需要的优质数据/规则数据在以往时代大概率没有系统性的、完整性的存在。

因此，很多 AI 产品的推出都会有一个优质数据准备的阶段，在这个时间窗口下，对所有人都是一个机会，所以各位老板真的不用急。

只要将“优质数据”（数据+规则）是什么搞清楚，产品的实现路径自然而然就出来了。

而后的问题就是工程侧如何将这一切循环优化起来，形成一套飞轮系统，一旦飞轮系统形成，跟其他公司的差距就拉开了。

飞轮系统

就个人认知，想要延伸基座模型的能力只有两个做法：

第一是构建一套自己的行业知识库（知识图谱）。每次输入前将相关信息带上，如图所示：

第二是基于“行业知识库”形成多套微调数据，去训练模型。每次输入输出会变成这样：

第一套架构复杂起来会形成一个庞大的知识图谱、第二套其实就是 MoE 架构的雏形。

两套系统看似不同，其核心其实类似，都包括两点：

路由规则的优化；
专家模型如何优化；

所以在基础架构搭建完成后，真正困难的是工程控制：如何用海量优质增量数据去优化模型本身，这就是所谓飞轮系统。

其实这里的核心是：优质数据哪里来？，他包括：

初期数据哪里来？
中期哪里来？
后期哪里来？

初中期的数据与规则

首先，第一批少量优质数据的整理多半需要跨领域融合，比如律师+技术。

只不过，如果以律师+程序员的方式要产出数据成本是很高的，因为好的律师会很高傲；他很难配合程序员的工作，而程序员要达到律师行业的 KnowHow 是需要大量的时间的。

所以，程序员或者产品必须主动上前，软磨硬泡把核心规则与样例数据搞到手，而后必须有其他手段去处理这种矛盾，这里的核心有二：

程序员群体必须有基本 KnowHow；
对行业专家（律师、医生）的使用方式要变；

KnowHow 在这个合作模式喜爱要分为三个部分：

第一是知道怎么做——程序员必须会；
第二是知道找谁做——遇到规则问题程序员需求助领域专家；
第三是知道好不好，这里的核心是评价——让领域专家对应用打分；

经过一轮磨合，这对于程序员是比较轻松的，最终形成的合作模式是：AI 产出数据，行业专家评价效果，根据效果优化数据，最终形成数据集+规则。

数据反馈回路

AI 应用的优化依赖于数据反馈回路，即通过建立一个自我增强的飞轮系统，实现持续的自我优化。

以 DeepSeek R1 为例，初期通过少量专家标注数据启动，但关键在于后续的数据再生和强化学习。

机器通过自我探索和反复调整，逐步减少偏差，提升准确性，形成一个有效的反馈回路。

这种方式与传统监督学习不同，后者依赖人工标注数据的直接关系，而强化学习通过自主学习和数据再生，不断调整策略。

成功的飞轮系统不仅依赖专家数据，还需大量高质量数据的自动生成和修正。

技术与行业专家的合作，是推动飞轮系统有效运转的关键。然而，数据偏差和结果偏离可能是挑战，需要依赖飞轮系统的自我校正来精准化数据和反馈。

AI 应用的飞轮系统需要耐心，因为优化过程是渐进的。关键在于建立持续的反馈机制和自我修正能力，推动数据的有效利用，进而提升系统的长期表现。

结语

今天，我们对如何开展 AI 项目的思路有做了一些简单探讨。

从明确目标出发，选择适合的技术路径，到构建 AI 产品的飞轮系统，每个环节都需要不停试错。

AI 的应用和技术实现往往伴随挑战，尤其是在数据准备和工程实现方面。

构建飞轮系统、优化数据反馈回路，以及与行业专家的深度合作，这些都不是短期内能够轻松解决的问题。

虽然初期可能会面临一定的技术复杂性和高昂的成本，但这些投入和耐心，最终将为企业带来可持续的竞争优势。

文章中提到的技术选型和路径选择，可能给一些读者带来些许迷惑。

我们在此强调，AI 项目并不是一蹴而就的，选择合适的技术和实现路径，取决于具体的业务需求和行业特点。

对于没有经验的企业来说，首先要清晰定义目标，再根据目标选择合适的技术，而不是一味追求“最先进”的解决方案。对技术路径的选择应当具备灵活性，随着项目进展及时调整。

总之，AI 技术的应用和开发不仅需要深厚的技术储备，更需要扎实的行业知识和耐心。企业应理性看待 AI 应用，避免过度焦虑，逐步推动项目实施，才能确保在未来的竞争中占据有利位置。

文章转载自：叶小钗
原文链接：https://www.cnblogs.com/yexiaochai/p/18700942
体验地址：http://www.jnpfsoft.com/?from=001YH

发布于: 刚刚阅读数: 5

快乐非自愿限量之名

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

发布

暂无评论

创作场景