探讨大模型前沿技术与商业化落地 |【奇绩潜空间】第 3 季开始报名
关注奇绩的小伙伴,奇绩潜空间第三季活动开始报名,第一期活动时间为 7 月 27 日。
奇绩创坛关注最前沿的大模型技术趋势和商业化落地实践,我们定期邀请 GenAI 时代冲得最快的一批创业者 / 科研学者 ,来【奇绩潜空间】分享产品探索和商业化落地实践。
继第二季姚顺雨、吕骋、尤洋、蔡天乐四位嘉宾的分享后,本季我们邀请到 MiniMax 创始人兼 CEO 闫俊杰、Luma AI 首席科学家宋佳铭、卡内基梅隆大学助理教授陈贝迪、寒武纪 1 号开源多模态大模型探索者童晟邦,继续为大家带来闭门分享。
【第 1 期嘉宾介绍】宋佳铭 - Luma AI 首席科学家,斯坦福大学计算机科学博士、博士后。曾任职英伟达(DIR)小组科学家 ,创建了最早的扩散模型加速算法,该算法广泛用于最近的生成式 AI 系统,包括 DALL-E 2、Imagen、Stable Diffusion 和 ERNIE-ViLG 2.0。他分享的主题是 Dream Machine:从视频理解 3D。
【第 2 期嘉宾介绍】陈贝迪 - 卡内基梅隆大学助理教授,斯坦福大学人工智能博士后学者,前 Meta AI 研究科学家。致力于在现代硬件上设计和优化算法和模型,以加速大型机器学习系统。她将为我们带来关于 Efficient Long-context generation 的分享。
【第 3 期嘉宾介绍】童晟邦 - 纽约大学博士,师从 Yann LeCun 教授和 Saining Xie 教授,是伯克利人工智能实验室(BAIR)的研究员, 目前在 Meta 暑期实习中,近期获得 OpenAI 超对齐奖学金。他将和大家探讨视觉在多模态大模型中扮演的角色。
【第 4 期嘉宾介绍】闫俊杰 - MiniMax 创始人兼 CEO,是中国第一梯队的大模型创业者,目前 MiniMax 估值超 25 亿美元。他将与我们聊聊 Intelligence with everyone :对 AGI 0-1 的探索与实践。
为更好的帮助来到线下的创业者交流,我们全新升级了【Cofounder Matching】环节,在本期你可以抢先体验到奇绩校友「右脑科技」视频生成最新成果,并与 GenAI 时代最有活力的创业者和研究者面对面交流(往期参与者大多是来自 BAT、字节、京东、美团等大厂的算法工程师、架构师、AI 产品经理、创新战略部经理及大模型创业者们),你将有机会找到志同道合、有共同创业梦想的小伙伴。
报名通道已开启,点击链接报名。
【奇绩潜空间】第二季内容回顾
【内容回顾】姚顺雨 - 普林斯顿计算机系博士,ReAct 、思维树框架提出者, Agent 智能领域最早探索者之一。潜空间第 2 季第 1 期嘉宾
关键词:Agent
姚顺雨分享了 Agent 智能领域的多个关键议题,从技术发展、挑战、应用场景到与大模型的结合,以及科研成果的商业化,深化了对 Agent 技术实际应用和未来趋势及挑战的理解。
【观点节选】
“大模型和 Agent 是相辅相成的,有些人认为我们要更关注 Agent 的层面,有些人认为模型发展好了可以解决所有问题,这是行业内的一个深层的辩论。现在面临的另一个本质问题是如何解决数据挑战,以及如何解决落地场景挑战。在这样的情况下,如何找到一个既符合短期内模型的能力约束,又能落地,又能获取数据的场景是非常值得关注的,需要大家共同尝试。”
“好的研究项目需要一个简单清晰的想法,而创业则要解决一个个实际问题。你需要做很多零碎工作,但最重要的是让方案跑起来,给客户做出来有用的东西。研究和创业相通的点在于都要思考你的客户是谁,如何为他们产生价值。例如你要研究一个评测工具,就要思考谁会用这个工具,怎样让大家能轻松使用,它能为用户带来哪些好处。但创业时,你要做一百万件很脏的事情,这是很大的区别。”
【内容回顾】吕骋 - Rabbit-R1 创始人 潜空间第 2 季第 2 期嘉宾
关键词:AI 硬件
吕骋分享了他关于 Rabbit-R1 的设计理念及 AI 硬件的独特洞察与理解,既探讨了 LAM 、神经符号网络等技术性的进展,也分享了个人真实创业经历,与现场观众深入浅出地谈论行业的前瞻性思考。
【观点节选】
创业者唯独不要在商业模式上做创新,要使用已经验证过的赚钱模式,在商业模式上做创新的风险是极高的。
因为我们太小了,不用臆想自己已经在和巨头同台竞争,这是早期创业者常有的幻觉。创业者需要考虑的是怎样活下来,而不是如何去打败巨头。当然巨头都是从草根做起,但我们一开始还是要做好自己的事情。
AI 硬件一定是特别热的赛道,取胜的关键是软件层面的革新和突破。因为大家底层模型的能力水平相似,所以要做到差异化竞争,不同形态的 AI 硬件是很好的思考角度。如果你的软件在特定场景下更好用,用户就会为它买单。
【内容回顾】尤洋 - 潞晨科技 Open-Sora 创始人兼董事长。潜空间第 2 季第 3 期嘉宾
关键词:视频生成
尤洋分享了 Open-Sora 项目的技术细节和未来规划,以及潞晨科技在商业化方面的尝试和策略,和大家讨论了视频生成领域的技术挑战、训练策略、市场定位和竞争环境。
【观点节选】
首先我们的定位肯定是不会和大厂直接竞争的。我们的初衷是为有视频生成和模型部署需求的中小型企业服务,当然,如果我们发展速度比较快,视频质量很高的话也可以把它做成一个服务。但在策略上肯定不能盲目的跟大厂直接竞争。
虽然大厂可能有更多的算力资源,但实际上目前我们用不到那么多。所以对创业公司来说,现在也有一些潜在机会——找到 Scaling Law 的正确方向。
出海现在是比较野蛮生长的一个阶段,并不是因为它的发展速度很快,而是还没有找到一个高效统一的策略让 AI 出海企业去模仿,也没有成熟成功的范式去借鉴。如何去竞争,哪一部分市场没有被触达,哪些是空白机遇点,这些事目前我们都还没调查清楚。如果做 AI 出海,能不能在产品上有吸引力,不被 ChatGPT 吃掉,是值得思考的。
【内容回顾】蔡天乐 - 普林斯顿“小天才”,Medusa 推理优化论文作者,MyShell 模型核心贡献者、创业者咨询师、天使投资人。潜空间第 2 季第 4 期嘉宾
关键词:AI 推理
蔡天乐在分享中强调了系统性思维在大模型时代中的重要性,介绍了 Medusa 模型以及突破大模型在数学能力方面局限性的有效路径,他认为硬件与模型的协同需要结合具体应用场景进行优化,以应对推理效率的挑战。
【观点节选】
在模型和底层硬件愈加同质化的当下,要结合具体的应用场景才能做到推理层面的差异化。例如云端和端侧的场景需求就不同,对延时、吞吐的指标各有要求,这里就有较大的优化和差异化的空间。但只看模型推理服务商层面,技术的成本和效率很容易收敛到接近的水平。
端侧模型是非常重要的发展方向。未来可能会是偏混合模式的架构。端侧有两大好处,一是降低成本,利用用户自己的设备推理;二是保护隐私。
苹果发布的 Apple Intelligence 就是一个好例子,他们也是一套混合模式的模型,在手机上有一个小模型,同时也有一个云端模型,只有任务难度到达一定程度时才会调用云端模型,和我们的 Tool Maker 思想类似。未来模型层面可能出现类似人类社会分工的模式,有比较便宜的小模型,也有比较强的大模型。
感兴趣的小伙伴,欢迎扫描上方二维码或点击【阅读原文】报名参与。
- 全文完 -
版权声明: 本文为 InfoQ 作者【奇绩创坛】的原创文章。
原文链接:【http://xie.infoq.cn/article/cf71816f57527441d16525a21】。文章转载请联系作者。
评论