小米交卷大模型,全新小爱同学实测来了
本文源自:量子位
果然只有雷军和小米,能抢走风口上大模型的热度。
在雷军的年度演讲分享中,讲武大求学经历,分享学霸 4 年大学 2 年完课经验;讲被《硅谷之火》点燃,勤奋练习写最好的代码,开启第一次创业的往事;最后加入金山、创办小米,一路坚持梦想、实现梦想、不断成长的知行合一……
于是雷军超燃演讲刷屏之下,自家大模型前脚刷新的纪录、引发的热议,都被盖过了。
不仅如此,发布会上一系列小米技术的最新进展,也被盖过了——但再回头来看,其实都很重要很值得关注,比如 AI 大模型装进手机、小爱同学的大模型升级、仿生四足机器人新落地……
以及雷军还亲自公布了小米的科技战略、AI 公式,AI 即将对小米展开的全方位刷新。
这也是为什么小米的这波 AI 新进展值得详谈。
我们先从四两拨千斤的小米大模型说起。
AI 全面赋能,把大模型塞进手机
小米自研大模型 MiLM,在雷军演讲前一日就现身 GitHub,也卷也不卷。
不卷在规模,主打 6B、1.3B(64 亿参数,13 亿参数)版本,妥妥的轻量级选手。
卷在了性能,把更小巧的 1.3B 参数版本塞进手机,做到在很多场景上可以媲美云端大模型效果。
小米大模型团队由栾剑带队,向小米集团技术委员会 AI 实验室主任王斌博士汇报。从今年 4 月开始研发,短短 4 个月时间已经交卷。
成绩如何,先上评测结果:
6B 参数版本,在 C-EVAL 权威榜单上取得同参数量级排名第一,CMMLU 中文向大模型取得排名第一。
具体来说,C-EVAL 数据集是一个全面的中文基础模型评测数据集,涵盖了 52 个学科和四个难度的级别。
CMMLU 数据集是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU 涵盖了从基础学科到高级专业水平的 67 个主题。
自去年 11 月 ChatGPT 来袭,最先行动起来的多是云计算公司如微软谷歌亚马逊。
但随着技术进一步成熟,端侧大模型成为行业下一个发力点,苹果方面已有传闻,而小米抢先跑进第一梯队。
把大模型塞到手机里,好处在哪?
首先,本地运行不用担心信号差、飞机无网络等情况,且响应速度更快。
同时,用户隐私更有保障,也便于提供更个性化的服务。
总结一下就是:随时随地享受 AI 带来的先进生产力。
与此同时,量子位也获得了新版小爱同学邀测资格。
还是那个熟悉的声音,不过在大模型加持下,小爱同学真的可以说进化成智能助手了 。
先按能力推荐,解释一下最近很火的超导概念,不成问题。
还记得当初难倒一众国内外大模型的弱智吧难题“我爸妈结婚为什么不邀请我”吗?
小爱同学表示根本不上这个当好吧。
如果一时不知道小爱大模型还有什么玩法,也可以来到探索专区找找灵感。
从这里也可以看出,小爱大模型还与系统做了一定程度的融合。
比如在小米金牌客服模式,刚刚上新没几天的旗舰折叠手机也介绍的头头是道,并能一键跳转去商城。
据小米透露,小米搞大模型就是瞄准系统级能力,或许未来整个手机操作系统都会像这样进化成“智能操作系统”也说不定。
但手机大模型并不是小米 AI 唯一的发力方向,这次一起亮相的机器狗二代铁蛋就藏着不少 AI 秘密。
为什么二代铁蛋能比一代体型更小、运动能力更强呢?
背后小米自研的 CyberGear 力控微电机,就是通过 AI 算法模拟,让电机在性能优化的同时,还轻了 20%。
行为方面为了更加仿生,小米也基于真狗的动作,在小米机器人强化学习平台,模拟了 3 万只机器狗进行并行训练。
AI 技术像这样离开纯虚拟环境,来到手机、机器狗,未来到更多智能家居设备上,不单纯是一种“赋能”,还能发现新的创新优化方向。
过去我们就曾看到,小爱同学语音交互技术用在机器狗上,就与手机、音箱的环境大不一样。
机器狗自身会移动,也常出现在室外噪音较大的环境,给语音识别和降噪算法提出了更高的要求,反过来推动了算法的进化。
语言大模型、多模态大模型将来同样会遇到类似的情况,最终把新应用场景需要的特性内化到模型本身。
这也就是学术界也在探索的具身智能,大模型之后最重要的新方向之一了。
我们可以看到,今年小米发布会除了新机型之外,AI 的比重明显更高了。
对于背后更深层次的思考,雷军从一个公式开始讲起。
小米的科技战略,为什么有 AI 次方?
在小米给出的(软件×硬件)ᴬᴵ 公式里暗含了一层意思:
AI 是最为关键的变量,它能带来指数级的改变。
这也更进一步体现出小米对于 AI 的重视。
而背后原因不难理解,结合 AI 趋势本身的发展以及小米所处终端市场的动向,便能找到答案。
先来看 AI 领域内。
大模型趋势之所以轰轰烈烈,是因为它给技术底层、行业应用都带来深刻影响。
一方面,ChatGPT 腾空出世验证了当模型规模突破一定量级后,会出现智能涌现的现象。这种特性让大模型具备“举一反三”的能力,更进一步让 AI 应用规模化落地成为可能。
同时 ChatGPT、Stable Diffusion 也推动 AI 向生成式方向发展。当 AI 具备更丰富的创造力后,人机交互方式也会因此发生改变。最直观的体现便是当智能助手接入大模型后,能推动人机交互向更加自然便捷的语言沟通方式发展。
另一方面,ChatGPT 引发全球全社会热议,让 AI 概念迅速破壁,走进千行百业和普罗大众认知中,这使得 AI 应用落地及商业化脚步加快。
业内普遍认为,在基础大模型之上搭建的行业大模型,将会成为未来大模型市场中的主要构成,也是带动实际应用的主力之一。
大模型侧,厂商们在过去半年来都在积极推动和产业界合作;垂直领域内,也有以大模型为底层技术的玩家开始展露头角,如 InflectionAI—一个主打感情陪伴的聊天机器人公司估值已达 40 亿美元。
透过这些当下最新的趋势变化,不难感受到一个事实——
AI 作为一项底层、基础且核心的技术,正在快速变革当下时代。
而在以往技术周期里,能够承担如此角色的代表技术,分别是蒸汽技术、电力驱动、计算机。
换言之,如今的 AI 也能如同它们一样,成为未来生产力,带来指数级增长。
那么,怎么利用好这一未来生产力,就成为各行业当下最关心的事。
以小米所处的终端市场为例,大模型趋势正在向这里演进。
现在,手机接入大模型成为诸多厂商的“大招”。
不仅是让智能助手和云端大模型结合,并从自身场景出发大力开拓端侧模型。
比如谷歌被视为拿来对标 GPT-4 的 PaLM 2,就在发布时推出了最小“壁虎”版本,可在移动设备上快速运行,包括离线状态,每秒可处理 20 个 token。
更底层的芯片层面,也在为端侧部署大模型做好准备。
高通目前通过量化、编译和硬件加速优化,能够在搭载第二代骁龙 8 移动平台手机上,以 15 步 20 步推理的速度应用 Stable Diffusion,生成 512×512 像素的图片。
这背后反映出,大模型和手机终端正在双向奔赴。
对于大模型来说,手机场景构建了最为丰富、广阔的移动应用,是离普罗大众最近的一块屏幕,是大模型加速落地的关键地带。所以为了适应手机场景,更轻量化、可端侧部署的模型一定要出现。
对于手机而言,大模型正在加速重构移动应用、变革人机交互,手机行业一定会受到影响。在激烈变革下,抓住趋势就能抓住新的增长动力,所以对于手机乃至终端厂商而言,拥抱大模型也是必然。
综上,也就不难理解小米的最新动向里,为何 AI 含量如此高。
无论是推出大模型版小爱同学,还是发布自研端侧模型,都是从小米自身出发,拥抱趋势后的成果。
雷军在今年个人演讲中提出(软件×硬件)ᴬᴵ 这一公式,也更深入揭示了小米当下对于最新 AI 趋势的理解。
今年,雷军的年度演讲主题选定了“成长”这一主题,在三小时的演讲和年度新品发布中,他分享了过去 30 多年经历的几次关键成长和感悟。
对应来看,在这个 AI 发展史上一定会被重点标记的年份里,小米也站在了新的关键节点上——
小米集团宣布进行科技战略升级,公布科技理念,明确科技探索原则。
而这些新变化里,AI 含量非常高。
AI 成为新小米的关键变量
在小米最新升级的科技战略里,确立了四个原则:
深耕底层技术
长期持续投入
软硬件深度融合
AI 全面赋能
里里外外传递出一层信息:AI 将成为新小米的关键变量。
实际上,趋势内外,小米这次直接生在风口里。
首先,最新一波 AI 浪潮引发的变革,与小米技术布局和长板“天然适配”。
在 2016 年,AlphaGo 腾空出世把 AI 概念更进一步推向大众时,小米成立了首支 AI 团队。
当时 AI 趋势里,深度学习和计算机视觉领域快速发展,这不仅体现在基础算法上,也体现在应用落地方面。如国内 AI 四小龙,最初都是以计算机视觉起家。
小米成立的第一支 AI 团队,锚定的也是计算机视觉方向。
紧接着 2017 年,“Attention is all you need”来了。
Transformer 架构的出现,不仅直接推动 NLP 领域发展,同样影响计算机视觉、语音等领域,更是当今 AIGC 趋势的核心底层技术——要知道,目前市面上绝大多数大模型,底层都是基于 Transformer 架构。
这一年,小米在 AI 方面的动作更大,正式成立 AI 实验室,多方位布局,覆盖声学、语音、NLP、知识图谱等领域,甚至大模型也被列入其中。
之后几年里,AI 趋势正酣,有了较为坚实的底层算法做基础,行业应用落地脚步更快,尤其是细分领域进展迅速。
从手机这一场景来看,典型的两个例子是智能助手和 AI 影像。
它们都需要和产品深度结合,才能完成更进一步的探索。这方面,小米 AI 有布局,更可以说是有长板。
这次全面升级的小爱同学诞生于 6 年前,应用了小米 NLP 技术,并为如今大模型的接入应用积累了海量场景训练数据。AI 影像算法方面,小米也专门成立团队,如“夜枭算法”已应用在了成熟产品上。
今年 4 月,小米大模型团队火速成立,完成了趋势下的最新一次扩展。到如今小米 AI 团队规模已超 3000 人。
所以 AI 大模型浪潮,小米生在其间,积累和蓄力早已完成,需要的只是把好钢用到“刀刃”上,聚集资源实现更大的突破。
其次,技术因场景而强大,小米技术的天然优势背后,核心还是小米业务和产品具备的场景优势,而且小米上下都已经敏锐地感知到了这一趋势。
一方面,技术深入到场景中去,才能发挥更大价值。
远的不说,就说今天最火的概念“大模型”早在 2017 年就已起步,但一直以来 AI 研究届以刷学术指标测评榜单为主要前进方向,并未掀起太多波澜。
直到 ChatGPT 以直面普通消费者的姿态问世,才打开聊天机器人和智能助手的应用场景,以及后面的 AI 物种寒武纪大爆发,几乎要把每个行业改造个遍。
小米多年来正是这个理念的践行者。这也是为什么最新提出的公式中,(软件×硬件)作为底数。
小米的场景天生从软硬件一体出发,如智能助手小爱同学,拥有 1.1 亿月活用户,支持 5900 余款智能设备。
在多终端方面,“手机是基本盘,IoT 是想象空间”是很多人对小米的描述。
主阵地手机端,小米就是以软硬件一体奠定地位的。AIoT 方面,雷军在 2013 年便看到智能硬件和物联网的趋势,并率先成为 AIoT 智能生活的定义者。
2021 年,雷军亲自挂帅小米造车,补齐了小米在“人车家”的最后一环,由此小米全场景智能生态构建完成。
乃至仿生机器人方面,小米如今已推出两代 CyberDog、人形机器人 CyberOne,提前布局未来家居场景。
另一方面,技术深入到场景中去,才有了融合进化的空间。
比如小米手机上广受好评的“万物追焦”功能,其实最早是从 CyberDog 机器狗上的“主人追踪”技术;小米自动驾驶进展非常快,得益于 2017 年创办的小米人工智能实验室;同样,自动驾驶部门的很多技术,也应用在 CyberOne 上,又构成了仿生机器人的大脑。
而在最新大模型趋势下,如手机、仿生机器人等,都是正被广泛热议的落地场景。
也正是小米拥有的如此丰富的场景,让 AI 的技术应用和迭代更加令人期待,毕竟 AI 归本溯源,不论是深度学习算法还是如今的大模型范式,背后最核心的竞争力还是基于数据的迭代。而小米拥有的场景、终端、数据体量,都是 AI 技术落地和体验的绝佳保障。
以及别忘了,小米还有 AI 迭代的最可靠保障——米粉用户。
在 ChatGPT 的一鸣惊人之后,基于人类反馈的强化学习机制被反复提起,而这种关键的机制方法要素,没有哪个玩家比小米更有方法论和话语权。
最后,AI 之所以一定会刷新小米,最关键的还在于决心。
这种决心,既是小米的技术底色和研发投入上的有史为鉴,更有程序员出身的雷军始终如一对技术的坚定和知行合一。
一直以来,小米的产品体验太强而让技术被迫“失色”,以至于不少人忽略了小米的技术之强,布局之全。
所以“新小米”并不是说小米才刚刚开始改变,而是把一直以来在技术创新上做出的持续努力更好地展现在台面之上。
在雷军演讲现场,他专门强调了小米技术研发已布局 12 个技术领域,包括 5G 移动通信技术、大数据、云计算及人工智能,同时基于智能制造,进入机器人、无人工厂、智能电动汽车等,涉及 99 个细分赛道。
从软件、硬件,从微观技术栈到宏观产业赛道,都堪称全面。
2016 年以来小米在技术上的持续布局,造就了今天“新小米”开始展现技术的滚雪球效应。
雷军披露,在最体现实力的技术专利方面,截至 2023 年 3 月 31 日,小米全球授权专利数超 3.2 万件。其中,在中国信息通信研究院发布的 5G 标准必要专利声明有效全球专利族企业排名中,小米全球专利族占比 4.1%,首次进入前十——是最年轻玩家。
当然,这些技术积累的背后,也离不开研发投入的持续增加,从 2017 年到 2022 年,小米在技术研发方面投入增幅为 38.4%。
2022 年,小米研发投入约 160 亿,同比增长 21%。预计 2023 年全年总研发投入将超过 200 亿,未来五年(2022-2026)研发投入将超过 1000 亿。
所以当“AI 成为新小米的关键变量”的说法一出,质疑的声音或许有多个维度,但没有一个维度是关于战略定力、决心和执行力的。
小米这家公司,“永远相信美好的事情即将发生”,但这种信念背后,是知行合一、日拱一卒的执行力,一步步把事情做成,把梦想变成目标,把目标拆解成一个个量化指标,最后总能做好、做成。
实际上,大模型趋势发生以来,追逐风口、看到机遇的人很多,制定 AI 战略规划的公司也不在少数。
但当小米入局,没有人不关注,没有人不重视。背后正是小米这种创业 13 年积累的江湖战绩和商誉。
不过如果非要归本溯源,小米的 AI 想象空间和战略定力,或者小米技术相关的一切,最终都归于一个人,只要他在,外界就相信小米对于技术的认真、坚持和一定能成。
这个人就是雷军,小米的掌舵者,中国最早一代程序员,也是早期最厉害的技术大佬之一——他大二写的汇编代码,时隔三十年后还在知乎上被热议。
如果说中国有多少企业家真正有敏锐的技术洞察和趋势,雷军肯定是排在名单最前的一个,也正因如此,他能更容易看懂、看透技术趋势,也对 AI 这样的底层技术开发,也会更有耐心。
技术也好,AI 也好,对于小米不会是一阵风,而是始终不变的底色。
这也是为什么小米从成立以来,就始终强调技术为本。包括在“新小米”的战略升级中,雷军也特意强调了其中“小米的不变”:
无论时代如何变化,小米依然会坚持自己的使命、愿景、价值观,坚守“技术为本”的铁律。
这种技术为本,可以本质到什么程度?
雷军在今年的演讲中也给出了答案:选择对人类文明有长期价值的技术领域,长期持续投入。
这是一段算不上简洁的表达,但似乎琢磨几遍之后,会发现一个字都不能少。
足够远大的梦想是胸怀人类文明,判断投入的标准是长期价值,雷军和小米的方式是技术,而一以贯之的方式则是:长期、持续、投入。
评论