写点什么

讯飞星火 V4.0 超越 GPT-4 Turbo!OpenAI、Meta、谷歌发布最新大模型袭卷 AI|AI 日报

作者:可信AI进展
  • 2024-06-30
    北京
  • 本文字数:1990 字

    阅读完需:约 7 分钟

文章推荐

AI实测|基于图像、语言与声音,人工智能是否已经超越了人类?

今日热点

OpenAI 正式推出 CriticGPT,用于捕获 ChatGPT 代码输出中的错误

在推理和模型行为方面,OpenAI 训练的 ChatGPT 变的更加准确,但其错误之处也变的更加隐蔽,从而让 AI 训练师难以发现错误。

为了应对这一挑战,当地时间 27 日, 基于 GPT-4,OpenAI 正式推出 CriticGPT 大模型,专为审查 ChatGPT 产生的代码错误而设计。

CriticGPT 通过 RLHF 技术(基于人类反馈的强化学习),提高代码审查的效率与准确性。

研究显示,在 CriticGPT 辅助下,审查代码的准确性比无辅助情况下高出 60%。

但 OpenAI 表示,CriticGPT 能提供的帮助是有限的:如果一项任务或响应极其复杂,即使是有模型帮助的专家也可能无法正确评估它。

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

谷歌正式向全球研究人员和开发者发布 Gemma 2

谷歌正式向全球研究人员和开发者发布 Gemma 2。Gemma 2 有 90 亿 (9B) 和 270 亿 (27B) 两种参数大小,与第一代相比,其性能更高、推理效率更高,并且内置了显著的安全改进。

其具有以下具体特征:

超大性能:Gemma 2 尺寸为 27B,性能在同类产品中首屈一指,甚至比其尺寸大两倍以上的型号更具竞争力。9B Gemma 2 型号的性能也处于同类产品领先水平,优 Llama 3 8B 和同类其他开放式型号。

极高效率和成本节省:27B Gemma 2 模型旨在在单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 上以全精度高效运行推理,在保持高性能的同时显着降低成本。这使得 AI 部署更加易于访问且经济实惠。

跨硬件的超快推理:Gemma 2 经过优化,可在各种硬件上以惊人的速度运行,从功能强大的游戏笔记本电脑和高端台式机到基于云的设置。在 Google AI Studio 中试用 Gemma 2 ,使用 CPU 上的 Gemma.cpp 量化版本解锁本地性能,或者通过 Hugging Face Transformers 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上试用。

https://blog.google/technology/developers/google-gemma-2/

Meta 推出强大开源模型 LLM Compiler,专为代码优化任务而设计,提供 7B 和 13B 参数

今日,Meta 推出了 Meta 大型语言模型 (LLM) 编译器 Compiler,旨在优化代码并彻底改变编译器设计。

LLM Compiler 在测试中达到了自动调整搜索优化潜力的 77%,这一结果可以显著减少编译时间并提高各种应用程序的代码效率。

该模型的反汇编能力更加令人印象深刻。在将 x86_64 和 ARM 汇编转换回 LLVM-IR 时,LLM Compiler 在往返反汇编中表现出 45%的成功率(精确匹配率为 14%)。这种能力对于逆向工程任务和遗留代码维护来说可能是无价之宝。

https://venturebeat.com/ai/metas-llm-compiler-is-the-latest-ai-breakthrough-to-change-the-way-we-code/

Huggingface CEO:阿里 Qwen-2 成全球开源大模型排行榜第一,中国处于领导地位

6 月 27 日,全球著名开源平台 huggingface 联合创始人兼首席执行官 Clem 在社交平台宣布,阿里最新开源的 Qwen2-72B 指令微调版本,成为开源模型排行榜第一名。

他表示,为了提供全新的开源大模型排行榜,使用 300 块 H100 对全球 100 多个主流开源大模型进行全新评估。

例如使用 Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基准测试集上进行评估。

结果显示,阿里开源的 Qwen-2 72B 力压科技巨头 Meta 的 Llama-3、中国在全球开源大模型领域处于领导地位。

https://wallstreetcn.com/livenews/2743987

科大讯飞发布讯飞星火大模型 V4.0,整体超越 GPT-4 Turbo

科大讯飞在讯飞星火 V4.0 发布会上宣布了其最新的 AI 成果,推出讯飞星火大模型 V4.0,实现了对国际顶级模型 GPT-4 Turbo 的全面超越。

据介绍,讯飞星火大模型 V4.0 基于全国首个国产万卡算力集群“飞星一号”训练而成,全面提升了大模型底座的七大核心能力。

在国内外中英文 12 项主流测试集中,星火 V4.0 在 8 个测试集中排名第一,领先国内大模型,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现对 GPT-4 Turbo 的整体超越。

伴随此次发布,科大讯飞同步上线了多款创新应用,覆盖教育、医疗及企业服务等,旨在通过讯飞星火技术赋能各行各业,推动 AI 应用深入日常生活与工作场景。

https://www.ithome.com/0/778/092.htm

亳州牵手华为,打造国内首个中医药大模型“华佗”

据有关部门了解,亳州市与华为公司强强联合,将充分利用华为算力、算法优势,以及亳州中医药政策、区域、资源、数据优势,打造首个中医药产业大模型—华佗中医药大模型。

根据《华佗中医药大模型建设方案》(以下简称《方案》),亳州市将构建全球首个中医药产业大模型,落实国家人工智能+行业战略目标,赋能中医药行业提质增效。

根据《方案》,华佗中医药大模型构建 1+3+N(华佗中医药大模型创新中心+产业交易平台、产业数据平台、产业大模型服务平台+线上交易、药材追溯、检验检测、价格/销量预测、中药材知识普及、品牌营销、人才培养等),赋能产业升级。

https://www.thepaper.cn/newsDetail_forward_27877392

发布于: 刚刚阅读数: 6
用户头像

分享SPG,AGL,ACE和LLM在金融领域的进展。 2023-12-25 加入

还未添加个人简介

评论

发布
暂无评论
讯飞星火V4.0超越 GPT-4 Turbo!OpenAI、Meta、谷歌发布最新大模型袭卷AI|AI日报_#人工智能_可信AI进展_InfoQ写作社区