写点什么

AI 日报|英伟达 Nemotron-4 340B 模型助力各行业数据生成,扣子发起匿名 AI 模型擂台赛!

作者:可信AI进展
  • 2024-06-18
    浙江
  • 本文字数:2620 字

    阅读完需:约 9 分钟

文章推荐

AI日报|跃问App上架加入AI助理竞争!GPTZero获千万美元A轮融资,创始人不到30岁!

AI日报|Luma推出AI视频模型,又一Sora级选手登场?SD3 Medium发布,图中文效果改善明显

⭐️搜索“可信 AI 进展“关注公众号,获取当日最新 AI 资讯

今日热点

Nvidia 推出“Nemotron-4 340B”模型,重新定义合成数据生成,可与 GPT-4 相媲美

NVIDIA 近日推出一组开放模型 Nemotron-4 340B,开发人员可以使用这些模型生成合成数据,以训练大型语言模型。

Nemotron-4 340B 在训练中使用了多达 9 万亿个标记,拥有 4,000 个上下文窗口,并支持 50 多种自然语言和 40 种编程语言。

其表现远超其竞争对手,包括 Mistral 的 Mixtral-8x22B、Anthropic 的 Claude-Sonnet、Meta 的 Llama3-70B,甚至可以与 GPT-4 的性能相媲美。

Nemotron-4 340B 对各行各业的潜在影响不容小觑。

  • 在医疗保健领域,生成高质量合成数据的能力可能带来药物研发、医学成像方面的突破。

  • 在金融领域,使用合成数据训练的定制 LLM 可以彻底改变欺诈检测、风险评估和客户服务。

  • 制造业和零售业也可以从特定领域的 LLM 中受益匪浅,从而实现预测性维护、供应链优化和个性化客户体验。

https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/

https://venturebeat.com/ai/nvidias-nemotron-4-340b-model-redefines-synthetic-data-generation-rivals-gpt-4/

聆心智能新一代超拟人大模型 CharacterGLM Pro 版正式对外提供服务

聆心智能推出新一代超拟人大模型 CharacterGLM Pro 版,已正式对外提供服务。

CharacterGLM Pro 基于最新且门类更加丰富的数据进行训练,听取了真实产品和用户的反馈建议,使得回答更贴心,陪伴更有趣。

用户此后无需经历复杂的引导过程即可一键与贴心的陪伴伙伴聊天,获取情感支持和陪伴。

https://mp.weixin.qq.com/s/kYz4sdzYGOJKX8dUsTbNeg

软银宣布与 Perplexity AI 达成战略合作

日本软银今天宣布与 Perplexity AI 达成战略合作,将于 6 月 19 日向 Softbank、Y-Mobile 和 LINEMO 三大品牌的用户开放 Perplexity Pro 一年免费试用的申请。

Perplexity 今年 4 月获得来自软银和德国电信 6270 万美元投资,公司估值超 10 亿美元。

https://baijiahao.baidu.com/s?id=1802095135725311075

日本 AI 初创公司 Sakana AI 获超 1 亿美元投资,估值超过 10 亿美元

参与洽谈的消息人士透露,由美国投资基金牵头的投资方,将向 Sakana AI 注资约 200 亿日元,也就是约 1.28 亿美元,Sakana AI 的估值就将达到 1800 亿日元,折合约 11.5 亿美元,将成为 AI 领域新的独角兽。

Sakana AI 成立还不到 1 年,1 月 16 日,曾在官网宣布融资 3000 万美元,用于人工智能技术的研发。

https://www.fromgeek.com/ai/642214.html

字节跳动“扣子模型广场”正式上线,大模型可匿名 PK

模型广场是扣子发布的在线大模型对比与评估系统。可通过模型对战与两个匿名模型实时对话,并根据模型的回答进行投票。

扣子会持续收集用户的匿名投票数据,根据 Bradley-Terry 模型对大模型进行评分。

扣子模型广场支持多种对战方式,适用于各种模型评估场景。

纯模型对战:忽略编排等各种 Bot 配置的影响,直接评估大模型的文本生成能力。

基于 Bot 的模型对战:使用扣子已正式发布的 Bots,在各种多样化的场景中对比不同大模型的问答效果,评估真实业务场景下不同模型的文本生成、技能调用、知识调用等能力,帮助你为不同领域的 Bot 选择更合适的大模型。

https://www.coze.cn/model/arena?bid=6cqtlt2v87g1v&utm_source=lb

北京智源人工智能研究院公布一系列大模型“全家桶”和智算软件系统

北京智源人工智能研究院(以下简称智源研究院)公布一系列大模型“全家桶”和智算软件系统。

其中包括发布万亿参数的大语言模型进展,用于检索增强(RAG)的向量模型、采用自回归架构的多模态大模型、具身智能大模型和生物计算大模型,以及支持 8 种芯片的智算操作系统 FlagOS。

智源研究院院长王仲远表示,FlagOS 是面向大模型、支持多种异构算力的智算集群软件栈。

目前,FlagOS 已支持超过 50 个团队的大模型研发,支持 8 种芯片,管理超过 4600 个 AI 加速卡,稳定运行 20 个月,SLA(服务级别协议)超过 99.5%。

其中,支持多元 AI 异构算力的并行训练框架 FlagScale 支持基于国产算力的 8x16B 千亿参数 MoE 语言大模型 1024 卡 40 天以上的稳定训练,全面帮助用户实现高效稳定的集群管理、资源优化、大模型研发。

https://www.tmtpost.com/7129429.html

国内大模型四小龙共同探讨:大模型在 AGI 发展中关键作用

国内大模型四小龙:百川智能 CEO 王小川、智谱 AI CEO 张鹏、月之暗面 CEO 杨植麟、面壁智能 CEO 李大海,在 2024 年智源大会上就“大模型是否是通往 AGI 之路的基石”的话题,分享了他们对大模型在 AGI 发展中关键作用的见解。

百川智能 CEO 王小川:大模型是通往 AGI 的基石,但仅靠 Scaling Law 无法实现 AGI,还需进行范式转换,如数据算法算力的创新,以及探索新的学习范式和压缩模式。

智谱 AI CEO 张鹏:虽然目前无法确定大模型能否帮助人类达到 AGI 的顶峰,但在现阶段,大模型是有效的,并且 Scaling Law 在未来相当一段时间内仍然会发挥作用。他认为 AGI 是一个动态的概念,其内涵和外延会不断变化。

月之暗面 CEO 杨植麟:大模型是第一性原理,通过提升模型规模和进行更好的压缩,可以产生智能。但在数据稀缺或不存在的领域,需要解决数据问题。他认为 AGI 的定义重要,但短期内难以精确量化,需要对评估维度进行拆分,以更好地衡量 AGI 的开发进度。

面壁智能 CEO 李大海:大模型是通往 AGI 方向上当前所有技术中能走得最远的,但能否直接达到 AGI 还存在未知因素。他认为大模型目前主要处理人的大脑系统 1“快思考”的工作,未来需要通过 agent 技术将系统的能力外部化或内化。

https://new.qq.com/rain/a/20240614A096WJ00

OpenAI CEO 奥尔特曼:OpenAI 正在考虑转变为一家营利性企业。OpenAI 回应:非营利组织是公司核心使命

OpenAI CEO 奥特曼曾在前几日告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。

奥特曼表示,董事会正在考虑的一种方案是成立一家营利性福利公司,Anthropic 和 xAI 等竞争对手正在采用这种方案。

据 The Information 报道,重组讨论仍在进行中,奥特曼和其他董事最终可能会决定采取不同的方式。

在回应路透社对该报道的询问时,OpenAI 表示:“我们仍致力于打造让所有人受益的人工智能。非营利组织是我们使命的核心,并将继续存在。”

https://www.reuters.com/technology/artificial-intelligence/openai-ceo-says-company-could-become-benefit-corporation-information-2024-06-15/

https://www.ithome.com/0/775/637.ht

发布于: 刚刚阅读数: 4
用户头像

分享SPG,AGL,ACE和LLM在金融领域的进展。 2023-12-25 加入

还未添加个人简介

评论

发布
暂无评论
AI日报|英伟达Nemotron-4 340B模型助力各行业数据生成,扣子发起匿名AI模型擂台赛!_#人工智能_可信AI进展_InfoQ写作社区