写点什么

豆包模型能力大幅提升,中国版 Vision Pro 正式发布!今年大模型市场份额第一还会是百度吗?|AI 日报

作者:可信AI进展
  • 2024-08-23
    浙江
  • 本文字数:2051 字

    阅读完需:约 7 分钟

文章推荐

上线一天销售额超15亿!《黑神话:悟空》火爆全网的技术秘诀!

昆仑万维推出全球首款AI短剧平台SkyReels!中国首个接入大模型Linux开源操作系统正式发布!|AI日报

今日热点

IDC 首次发布大模型平台及应用市场份额报告,百度、商汤、智谱排名前三

国际数据公司(IDC)于 8 月 21 日首次发布了《中国大模型平台市场份额,2023:大模型元年 —— 初局》。

数据显示,2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。

报告中 2023 年中国大模型平台及应用市场份额如下:

  • 受益于多年来在 AI 领域的大力投入以及大模型的早期投入,百度智能云在 2023 年大模型市场规模达 3.5 亿元人民币,位居市场第一,市场份额达 19.9%;


  • 商汤科技也受益于其对大模型的专注投入,以及其所建设的上海 AIDC 能够为客户提供一体化的大模型计算与应用解决方案,位居市场第二,市场份额达 16.0%;


  • 智谱 AI 则是 2023 年初创企业中的胜出者,位居市场第三;

报告还提到,大语言基础模型的创新已经接近收敛阶段,而多模态大模型、视频大模型应用场景更为广泛但技术尚不成熟,市场需要该类产品。

https://www.ithome.com/0/790/060.htm

豆包大模型综合能力提升 20.3%,火山引擎成立零售大模型生态联盟

8 月 21 日,2024 火山引擎 AI 创新巡展在上海举办,展会中展示了如下内容:

豆包大模型综合能力提升 20.3%

豆包大模型公开及内部测评集显示,最新版豆包大语言模型相比发布初期综合能力提升了 20.3%。其中,角色扮演能力提升了 38.3%,具备了更强的上下文感知,让对话情境更连贯、角色更拟人化。

语言理解能力提升了 33.3%,让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升,能够在更多生产力场景中得到应用。

此外,模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。

火山引擎携手多点 DMALL 成立零售大模型生态联盟

大模型应用落地不仅需要技术成熟度,还要有适配的商业组织和商业生态。为此,火山引擎携手多点 DMALL 成立零售大模型生态联盟。

通过融合豆包大模型与 AI 能力,让零售企业能够以极低的试错成本将大模型技术应用到业务场景中,推动零售行业的智能化升级,提升行业的整体效能和创新能力,以适应不断变化的市场需求和消费者行为,加速零售行业的创新步伐。

全栈 AI 服务升级

火山引擎智能算法负责人、火山方舟负责人吴迪介绍,一站式大模型服务平台火山方舟最新推出全周期安全可信方案,支持身份认证、数据保密、环境隔离等,构建大模型安全“堡垒”。

联网、内容插件能力再升级,提升搜索能力、可获取更多优质内容,RAG 知识库插件进一步强化,更强知识库文档解析与检索能力,支持丰富场景,令企业应用更为灵活自如。

https://mp.weixin.qq.com/s/nzNkPQqSTSA07OVytSOs7w

“中国版 Vision Pro”:PICO 推出首款 MR 混合现实一体机 PICO 4 Ultra

近日,字节跳动旗下 XR 平台 PICO 推出首款 MR 混合现实一体机 PICO 4 Ultra,硬件上搭载全新高通骁龙 XR2 Gen2 计算平台,拥有 12GB 超大内存,GPU 性能相比前代 XR1 提升 2.5 倍,AI 性能比 XR1 提升 8 倍。

PICO 4 Ultra 还配备双目 3200 万像素彩色透视摄像头和 iToF 深度感知摄像头,支持 MR 并且系统层面引入全景屏工作台,以及支持体感追踪器。

全新 PICO 4 Ultra 支持 MR 观影、裸手手势、空间视频等功能。目前,PICO 生态拥有 MR 应用已经超过 50 款,VR 游戏超过 600 款,非游戏 VR 应用超过 300 款。

接下来,PICO 还与佳能共同推出空间视频创作者计划,并将利用 MR 互动剧《达芬奇:狂想之翼》、三体游戏“远征”,提升 PICO 的生态内容质量和产品体验。

https://www.tmtpost.com/7217755.html

视频帧数扩展到 1024,准确率 99.5%。英伟达 LongVILA:为长视频扩展长上下文视觉语言模型

长上下文能对于长视频理解至关重要,因此通过设计算法和系统推出 LongVILA,这是一种用于长上下文视觉语言模型的全栈解决方案。

对于模型训练,通过合并两个额外阶段(即长上下文扩展和长监督微调)升级现有的 VLM 以支持长视频理解。

然而,长视频训练需要大量计算和内存。因此引入了长上下文多模态序列并行 (MM-SP) 系统,该系统可有效并行化长视频训练和推理,在 256 个 GPU 上实现 2M 上下文长度训练,而无需任何梯度检查点。

LongVILA 有效地将 VILA 的视频帧数从 8 扩展到 1024,将长视频字幕得分从 2.00 提高到 3.26(满分 5),在 1400 帧(274k 上下文长度)视频中实现 99.5%的准确率。

https://www.arxiv.org/abs/2408.10188

深度伪造拜登音频的电信公司将向联邦通信委员会支付 100 万美元民事罚款

今年早些时候,新罕布什尔州的选民收到了由人工智能生成的拜登总统的虚假音频。

美国联邦通信委员会迅速反击,认定作案者是总部位于德克萨斯州的 Life Corporation,该公司多年来一直在实施类似的诈骗,并对其及其相关个人处以 600 万美元罚款。

但诈骗者还寻求了一家曾涉嫌不正当行为的电信公司的帮助。现在,Lingo Telecom 将支付 100 万美元的民事罚款。

Lingo 等电信公司不应该通过向已知的不良运营商提供服务来助长诈骗行为。联邦通信委员会主席 Jessica Rosenworcel 表示:“通信服务提供商是抵御这些威胁的第一道防线,他们必须被追究责任。”

https://techcrunch.com/2024/08/

用户头像

分享SPG,AGL,ACE和LLM在金融领域的进展。 2023-12-25 加入

还未添加个人简介

评论

发布
暂无评论
豆包模型能力大幅提升,中国版Vision Pro正式发布!今年大模型市场份额第一还会是百度吗?|AI日报_人工智能_可信AI进展_InfoQ写作社区