AI 日报|英伟达 Nemotron-4 340B 模型助力各行业数据生成,扣子发起匿名 AI 模型擂台赛!
文章推荐
AI日报|跃问App上架加入AI助理竞争!GPTZero获千万美元A轮融资,创始人不到30岁!
AI日报|Luma推出AI视频模型,又一Sora级选手登场?SD3 Medium发布,图中文效果改善明显
⭐️搜索“可信 AI 进展“关注公众号,获取当日最新 AI 资讯
今日热点
Nvidia 推出“Nemotron-4 340B”模型,重新定义合成数据生成,可与 GPT-4 相媲美
NVIDIA 近日推出一组开放模型 Nemotron-4 340B,开发人员可以使用这些模型生成合成数据,以训练大型语言模型。
Nemotron-4 340B 在训练中使用了多达 9 万亿个标记,拥有 4,000 个上下文窗口,并支持 50 多种自然语言和 40 种编程语言。
其表现远超其竞争对手,包括 Mistral 的 Mixtral-8x22B、Anthropic 的 Claude-Sonnet、Meta 的 Llama3-70B,甚至可以与 GPT-4 的性能相媲美。
Nemotron-4 340B 对各行各业的潜在影响不容小觑。
在医疗保健领域,生成高质量合成数据的能力可能带来药物研发、医学成像方面的突破。
在金融领域,使用合成数据训练的定制 LLM 可以彻底改变欺诈检测、风险评估和客户服务。
制造业和零售业也可以从特定领域的 LLM 中受益匪浅,从而实现预测性维护、供应链优化和个性化客户体验。
https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/
聆心智能新一代超拟人大模型 CharacterGLM Pro 版正式对外提供服务
聆心智能推出新一代超拟人大模型 CharacterGLM Pro 版,已正式对外提供服务。
CharacterGLM Pro 基于最新且门类更加丰富的数据进行训练,听取了真实产品和用户的反馈建议,使得回答更贴心,陪伴更有趣。
用户此后无需经历复杂的引导过程即可一键与贴心的陪伴伙伴聊天,获取情感支持和陪伴。
https://mp.weixin.qq.com/s/kYz4sdzYGOJKX8dUsTbNeg
软银宣布与 Perplexity AI 达成战略合作
日本软银今天宣布与 Perplexity AI 达成战略合作,将于 6 月 19 日向 Softbank、Y-Mobile 和 LINEMO 三大品牌的用户开放 Perplexity Pro 一年免费试用的申请。
Perplexity 今年 4 月获得来自软银和德国电信 6270 万美元投资,公司估值超 10 亿美元。
https://baijiahao.baidu.com/s?id=1802095135725311075
日本 AI 初创公司 Sakana AI 获超 1 亿美元投资,估值超过 10 亿美元
参与洽谈的消息人士透露,由美国投资基金牵头的投资方,将向 Sakana AI 注资约 200 亿日元,也就是约 1.28 亿美元,Sakana AI 的估值就将达到 1800 亿日元,折合约 11.5 亿美元,将成为 AI 领域新的独角兽。
Sakana AI 成立还不到 1 年,1 月 16 日,曾在官网宣布融资 3000 万美元,用于人工智能技术的研发。
https://www.fromgeek.com/ai/642214.html
字节跳动“扣子模型广场”正式上线,大模型可匿名 PK
模型广场是扣子发布的在线大模型对比与评估系统。可通过模型对战与两个匿名模型实时对话,并根据模型的回答进行投票。
扣子会持续收集用户的匿名投票数据,根据 Bradley-Terry 模型对大模型进行评分。
扣子模型广场支持多种对战方式,适用于各种模型评估场景。
纯模型对战:忽略编排等各种 Bot 配置的影响,直接评估大模型的文本生成能力。
基于 Bot 的模型对战:使用扣子已正式发布的 Bots,在各种多样化的场景中对比不同大模型的问答效果,评估真实业务场景下不同模型的文本生成、技能调用、知识调用等能力,帮助你为不同领域的 Bot 选择更合适的大模型。
https://www.coze.cn/model/arena?bid=6cqtlt2v87g1v&utm_source=lb
北京智源人工智能研究院公布一系列大模型“全家桶”和智算软件系统
北京智源人工智能研究院(以下简称智源研究院)公布一系列大模型“全家桶”和智算软件系统。
其中包括发布万亿参数的大语言模型进展,用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持 8 种芯片的智算操作系统 FlagOS。
智源研究院院长王仲远表示,FlagOS 是面向大模型、支持多种异构算力的智算集群软件栈。
目前,FlagOS 已支持超过 50 个团队的大模型研发,支持 8 种芯片,管理超过 4600 个 AI 加速卡,稳定运行 20 个月,SLA(服务级别协议)超过 99.5%。
其中,支持多元 AI 异构算力的并行训练框架 FlagScale 支持基于国产算力的 8x16B 千亿参数 MoE 语言大模型 1024 卡 40 天以上的稳定训练,全面帮助用户实现高效稳定的集群管理、资源优化、大模型研发。
https://www.tmtpost.com/7129429.html
国内大模型四小龙共同探讨:大模型在 AGI 发展中关键作用
国内大模型四小龙:百川智能 CEO 王小川、智谱 AI CEO 张鹏、月之暗面 CEO 杨植麟、面壁智能 CEO 李大海,在 2024 年智源大会上就“大模型是否是通往 AGI 之路的基石”的话题,分享了他们对大模型在 AGI 发展中关键作用的见解。
百川智能 CEO 王小川:大模型是通往 AGI 的基石,但仅靠 Scaling Law 无法实现 AGI,还需进行范式转换,如数据算法算力的创新,以及探索新的学习范式和压缩模式。
智谱 AI CEO 张鹏:虽然目前无法确定大模型能否帮助人类达到 AGI 的顶峰,但在现阶段,大模型是有效的,并且 Scaling Law 在未来相当一段时间内仍然会发挥作用。他认为 AGI 是一个动态的概念,其内涵和外延会不断变化。
月之暗面 CEO 杨植麟:大模型是第一性原理,通过提升模型规模和进行更好的压缩,可以产生智能。但在数据稀缺或不存在的领域,需要解决数据问题。他认为 AGI 的定义重要,但短期内难以精确量化,需要对评估维度进行拆分,以更好地衡量 AGI 的开发进度。
面壁智能 CEO 李大海:大模型是通往 AGI 方向上当前所有技术中能走得最远的,但能否直接达到 AGI 还存在未知因素。他认为大模型目前主要处理人的大脑系统 1“快思考”的工作,未来需要通过 agent 技术将系统的能力外部化或内化。
https://new.qq.com/rain/a/20240614A096WJ00
OpenAI CEO 奥尔特曼:OpenAI 正在考虑转变为一家营利性企业。OpenAI 回应:非营利组织是公司核心使命
OpenAI CEO 奥特曼曾在前几日告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。
奥特曼表示,董事会正在考虑的一种方案是成立一家营利性福利公司,Anthropic 和 xAI 等竞争对手正在采用这种方案。
据 The Information 报道,重组讨论仍在进行中,奥特曼和其他董事最终可能会决定采取不同的方式。
在回应路透社对该报道的询问时,OpenAI 表示:“我们仍致力于打造让所有人受益的人工智能。非营利组织是我们使命的核心,并将继续存在。”
版权声明: 本文为 InfoQ 作者【可信AI进展】的原创文章。
原文链接:【http://xie.infoq.cn/article/a1e3998412cb20af443d29795】。文章转载请联系作者。
评论