写点什么

意十足!京东 JoyAgent 智能体确实是产品级开源!

  • 2025-07-30
    北京
  • 本文字数:3596 字

    阅读完需:约 12 分钟

这几天被京东智能体 JoyAgent 开源的朋友圈消息刷屏了,“行业首个/100%开源/产品级/企业级智能体”这几个关键词吸引到了我,标题党且信一半,个中究竟还是要去社区看看,马上也想到了宇宙厂的 coze,特意搜了下,果不其然,字节 coze 也宣布了开源,时间赶一起了,这是啥玩法,这哥俩也有默契么?


Anyway,大厂的同频工作和 PR 通常代表了行业在某个方向有较大程度的共识,值得花点时间研究下,本篇先重点看下京东 JoyAgent 的开源情况。

一、首先为什么开源?

个人认为这是大厂主动给中小团队透出的机会,就这个问题和京东字节的朋友都聊了下。


京东的商业模式决定了它的技术产品首先是为自营和生态业务服务的,核心在于为主营业务降本增效,如果内部验证有效就开源出来做大行业影响力,比如跨端前端开源框架 Taro,做的很不错,git 上有 36K+星,外部核心贡献者还有腾讯、字节、阿里和小红书等国内其他大厂的前端团队,整体来说项目很纯粹,符合开源精神,一起做好产品利好你我他。


字节的商业模式则决定了它想做的一定是平台,扣子空间 4 月刚发布时即定位的智能体应用市场,要做大应用市场就要吸引大量开发者来构建应用生态,平台后续的转商模式一是基于数据和规则的制定来分发这些应用,二是基于内外部工具的开发和引入做工具收费和分成,此外说不定还有机会激活下公有云的销售,不过他们应该已经发现真正的严肃开发者很难放心把业务都架在他们那,闭源模式下价值很难做厚。

二、智能体创业机会

从创业者的角度来看,垂直智能体很可能就是中小公司和个人开发者中短期参与 AI 市场的最好机会,最主要的原因就是细分领域太多了,大厂未必看得上也未必干的好!也许 GPT5 这种超级大模型会将很多垂类能力打到 70-80 分的水平(持续关注),但它的资源也是有限的,肯定也不会有卷死所有垂类机会的想法,小团队和超级个体的生存空间就在这里,这点咱们的认知必须得清楚。


ok,言归正传,2025 是 Agent 的元年,这一波进入市场正当其时,大厂开源是大好事,他们投入 3 个月够咱们折腾一年多,能直接拿来用有何不可,不过在此之前还是要先看看他们诚意如何。

三、开源到什么程度?

1、先确认否真开源,或者说开源到什么程度


开源项目选型最重要的就是三点,完整公开的代码+明确的开源协议+持续更新维护,这三点缺一不可!市场上“伪开源”项目很多,要么就开源下 SDK 要么就只开源个框架,需要大量的二次开发,要么就是一做部署就发现还是要钱(好好看协议),真的无语,这一点很重要,注意避雷。


2、JoyAgent 的自我介绍


社区地址:https://github.com/jd-opensource/joyagent-jdgenie,关于开源的文字介绍如下。



另外有点意思有点勇!项目组把主要友商直接拉出来对比了😂,仔细看了下,上墙的这几个主要 Agent 小编大都深入使用并尝试过部署,除了 Coze 这两天加开了 FlowGram 工作流以外,其他信息还大都符合事实。



3、产品完成度情况


社区文档里多次强调【端到端】,所谓端到端就是部署后即完整可用,前端、后端、框架、引擎和和核心子智能体都有。花了一个多小时完成了本地部署,完成度确实不错,部署完即可用!回头详细写下部署过程。如果大家暂无时间部署,项目组还提供了一个 web 体验版本可申请体验。


体验地址:https://joyagent-genie.jdcloud.com(用京东账号登录,输入邮箱申请即可)


主界面如下,标准的对话框界面,提供了网页、文档、PPT 和表格 4 个输出模式(内置的子智能体)。



有点惊喜,小编之前多次尝试找开源的 PPT 智能体,全网翻了两遍,还别说,有些时候大家以为一定有的东西其实真没有,这次算是找到了,马上做了多次测试,效果基本满意,马上让团队同学申请二开共建(我们主要是内部使用暂未考虑商业场景,有感兴趣的朋友请联系我)。

四、产品性能与设计要点

影响智能体表现的重要因素包括模型能力、规划与执行机制、上下文、多智能体调度及工具链的集成能力等,综合性能表现为各环节准确率乘积,任何一个环节拉跨都会影响整体表现。


1、GAIA 的得分情况(智能体技术风向标,可参考性高)


Test 集效果 65.12%,第 5!只落后 Claude、Genini 和 GPT 几个大佬的闭源产品,没得说确实优秀!



2、核心设计要点(小编已加入开发者交流群并与两位项目组核心开发者做了较深入的交流)。



(1)任务层架构设计:Multi-level and Multi-pattern Thinking


采用【计划-执行】的双层任务架构,在 Work Level 层,基于深度推理分析 query 识别核心需求,将复杂问题分解为独立可执行的子任务;在 Task-level 层,通过 Reason Act 模式来操作 Task,有序执行和完成任务目标。


架构层既要满足复杂推理的需求,也要避免因过度拆解产生的资源消耗陷阱,JoyAgent 这种双层设计与行业顶流产品 Gemini-CLI、Cusor 的设计相似,可以认为是目前 90 分以上水准的做法。


(2)上下文记忆管理:Cross Task Workflow Memory


即跨任务的工作流记忆,这层应该是项目的核心创新,官方的 PR 也做了重点宣传,这里展开说下个人理解。JoyAgent 采用了【文件系统+Memory】双重混合的上下文管理系统,设计思路是全局任务通过文件系统管理,支持跨任务共享,历史会话基于内存管理,做任务级的隔离。好处显而易见, 对于相似任务可快速复用分析框架,大幅降低资源消耗,对于关联任务可通过上下文注入,显著提升作业效率。


  • 哪些场景/工具会生成文件?


具备任务全局属性的结果,比调用工具生成、代码执行和任务最终报告的生成等。



tips:在工具层面,目前主要是 Filetool、CodeInterpreter、ReportTool、DeepResearch 这几个会保存文件,其他 tool 都只做内存管理。


  • 文件如何被存储?


实际文件内容存储于 OSS,AgentContext 只存储元数据(通过 Sqlite 实现)。


// CodeInterpreter工具产生文件File file = File.builder()    .fileName(fileInfo.getFileName())    .ossUrl(fileInfo.getOssUrl())           // 实际文件存储在OSS    .description(fileInfo.getFileName())    .isInternalFile(false)    .build();agentContext.getProductFiles().add(file);   // 只存储文件引用元数据
复制代码


  • 文件如何被引用?


上下文注入机制,即格式化后的文件信息注入 Prompt,实现跨任务共享。


// 将文件信息格式化后注入PromptString filesStr = FileUtil.formatFileInfo(context.getProductFiles(), true);setSystemPrompt(getSystemPromptSnapshot().replace("{{files}}", filesStr));
// formatFileInfo生成的是文件列表描述,不是文件内容"fileName:report.html fileDesc:数据分析报告 fileUrl:https://oss.xxx/report.html"
复制代码


(3)工具的组合优化:Tool Evolution Via Atom Tools


项目组给出个工具升级为数字员工的定义,即可结合某一具体任务分析,为工具赋予一个专业化数字员工角色,从而让具体工具具备上下文感知和角色适应能力,实现逻辑如下,


  • 工具拆解。将已有工具功能(如 Excel 解析器、PPT 生成器)拆解为可复用的原子操作单元(如文件读取、表格解析、图表渲染),拆解过程结合大模型理解工具语义,形成原子工具知识库。

  • 工具重组。当遇到任务(如"智能体市场分析报告")时,Agent 分析所需能力触发重组并赋予专家角色,基于强化学习算法,将原子工具(数据抓取+可视化+文档生成)组合为新工具链并预验证有效性。

  • 反馈强化‌。新工具组合执行后基于实际效果数据继续优化原子工具的组合策略‌,成功验证的工具自动注册至共享库供后续其他同类任务调用,如此工具库将随使用不断完善,实现“自我进化”。


设计思路很新颖,具体成效与高并发 DAG 执行引擎能力密切相关。


// 高并发DAG执行引擎public Map<String, String> executeTools(List<ToolCall> commands) {    CountDownLatch taskCount = ThreadUtil.getCountDownLatch(commands.size());    // 并发执行工具,提升效率    for (ToolCall tooCall : commands) {        ThreadUtil.execute(() -> {            String toolResult = executeTool(tooCall);            result.put(tooCall.getId(), toolResult);        });    }}
复制代码


(4)关于模型与搜索


  • 模型训练。基于 deepseekv3、GPT4.1 和京东自研大模型训练,混合架构明显,融合大小型模型的优势,实现复杂任务的高效推理与执行。‌

  • 深度搜索。支持 4 个引擎(bing/ina/sogou/serp)并发搜索,每个引擎支持 5 次并发查询并返回 10 个结果,基于内容质量动态决定是否需要更多搜索。


tips,模型与搜索是重要性能和成本项,需要在部署后结合实际业务场景重点做策略选择和训练优化,官方实践也只能作为参考。

五、关于开源协议

标准的 Apache License 2.0‌开源协议,允许用户自由使用、修改和分发代码,包括商业用途。另外仔细看看了下贡献者协议,规范标准,过往东哥家的开源产品也都纯粹,没有黑历史,放心用吧。‌


总结下:JoyAgent 开源确实有诚意,完成度高,性能在线,且可商用!希望项目能持续维护和升级(几天时间 git 上就有 1500 星了,项目组应该会有动力持续搞,内部至少是个绩效 A 级的项目),有需求的朋友们非常值得一试!


下一篇讲讲部署过程及一些二开的想法。

发布于: 刚刚阅读数: 3
用户头像

拥抱技术,与开发者携手创造未来! 2018-11-20 加入

我们将持续为人工智能、大数据、云计算、物联网等相关领域的开发者,提供技术干货、行业技术内容、技术落地实践等文章内容。京东云开发者社区官方网站【https://developer.jdcloud.com/】,欢迎大家来玩

评论

发布
暂无评论
意十足!京东JoyAgent智能体确实是产品级开源!_京东科技开发者_InfoQ写作社区