写点什么

Sam Altman 新公司将打造 AI 健康教练;全新大模型架构 TTT 超越 Transformer 丨 RTE 开发者日报

作者:声网
  • 2024-07-10
    四川
  • 本文字数:2128 字

    阅读完需:约 7 分钟

Sam Altman 新公司将打造 AI 健康教练;全新大模型架构 TTT 超越 Transformer 丨 RTE 开发者日报


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、OpenAI CEO 成立 AI 健康公司,将致力打造 AI 健康教练


OpenAI CEO Sam Altman 与 Thrive Global CEO Arianna Huffington 在《时代》杂志上发文,宣布联合创立一家名为 Thrive AI Health 的新公司。该公司将由 OpenAI Startup Fund 和 Thrive Global 资助,Google 前健康和可穿戴设备负责人 DeCarlos Love 将担任这家公司的 CEO。


Thrive AI Health 将致力于打造一个「 AI 健康教练」,该「教练」会以一个手机 App 的形式呈现。Sam Altman 也表示,希望这款 AI 应用可以利用科学和行为改变方法,为用户提供精准的健康建议,解决日常生活中的健康问题,让更多人享受健康平权的好处。(@爱范儿)


2、Genspark:通过实时生成定制页面来满足用户个性化的搜索需求


MainFunc 是一家于 2024 年联合创立的 AI 搜索公司,开发了基于大型语言模型的新搜索引擎 Genspark。Genspark 的核心产品是一款 AI Agent 搜索引擎,采用多代理框架,通过实时生成定制页面(称为 Sparkpages)来满足用户的特定信息需求。


其设计以对话为主要交互方式,用户提出问题后,Genspark 会生成相关的简短回答,直接提供所需信息,而不是 Google 传统的「十个蓝色链接」。Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要,后面是指向更详细的 Sparkpage 的链接,基本上可以理解为针对问题生成的一篇完整回答。


此外,Genspark 整合了来自各种信誉良好的来源的数据,专注于提供没有垃圾邮件和偏见的内容。(@Z 计划支持大模型创业)


3、彻底改变语言模型:全新架构 TTT 超越 Transformer,ML 模型代替 RNN 隐藏状态


一种全新的大语言模型(LLM)架构有望代替至今在 AI 领域如日中天的 Transformer,性能也比 Mamba 更好。本周一,有关 Test-Time Training(TTT)的论文成为了人工智能社区热议的话题。


TTT 架构用机器学习模型取代 RNN 隐藏状态,优化了语言模型方法。TTT 层替代自注意力层,增强了处理长上下文的能力,并降低了计算复杂度。实验结果显示 TTT 在多种模型规模上表现优于或匹敌传统的 Transformer 和 Mamba。(@机器之心)


4、AI 视频创新:MOTIA 让视频拓展无限可能


MOTIA (Mastering Video Outpainting Through Input-Specific Adaptation) 作为一种新型的视频外绘制技术,正在 revolutionizing 视频内容创作领域。这项由扩散模型驱动的技术能够智能地在原始视频视角之外生成高质量、连贯的内容,为创作者提供了前所未有的创意空间。


MOTIA 的核心优势在于其两阶段处理方法:首先通过输入特定适应学习源视频模式,然后利用模式感知外绘制技术扩展视频边界。这种创新方法不仅提高了生成质量,还增强了灵活性,无需大量特定任务调整就能在多个基准测试中超越现有最先进的方法。MOTIA 为视频创作者、电影制作和虚拟现实等领域开启了新的可能性,标志着视频处理技术的重大突破。(@AI 科技评论)


5、对标 Photoshop,悟空图像上线华为鸿蒙 HarmonyOS NEXT


亦心科技已与华为达成合作,旗下「悟空图像」应用接入华为鸿蒙生态。官方表示,悟空图像是亦心科技自主研发的国产专业图像处理软件,对标国外同类软件 Photoshop,双向兼容 PS 文件格式,支持全平台运行,可实现平替。悟空图像应用已完成鸿蒙 HarmonyOS NEXT 系统适配,并上架华为应用市场。


悟空图像适用于图像编辑与处理、创意设计、AI 实时绘画与实时渲染等场景,支持 50 亿像素图片,兼容 PSD、PDF 等格式文件,支持以文生图、以图生图、边画边实时生成等功能。(@IT 之家)

02 有态度的观点

1、中国工程院院士邬贺铨:原有互联网业务值得用 AI 再造


在 2024 中国互联网大会上,中国工程院院士邬贺铨强调了 AI 在互联网业态创新中的重要性。他认为,随着「5G-A+IPv6」和 AI 大模型的发展,互联网业务值得用 AI 重新塑造,以促进产业数字化和数字产业化。AI 将为平台经济带来新动能,互联网平台成为 AI 赋能消费和行业应用的关键。(@财联社)


2、周鸿祎称 2024 年是大模型场景之年,To C 将出现杀手级应用


「大模型是风口,不是泡沫。」周鸿祎表示「今年英伟达市值一直狂飙,超越了微软和苹果,这就是人类进入人工智能时代的一个标志。」周鸿祎称,今年年初的时候,我说 24 年会是大模型的场景之年,当时很多同行不以为然,在刷各种参数,但是到了 6 月份,我觉得整个研究就都转过来了。「因为模型不是产品,模型只是能力,你有了人工智能的能力,还要结合具体的需求。」(@AI 科技评论)


写在最后:


我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
Sam Altman 新公司将打造 AI 健康教练;全新大模型架构 TTT 超越 Transformer 丨 RTE 开发者日报_声网_InfoQ写作社区