写点什么

Claude 3.5 Sonnet 发布,比 GPT-4o 更智能;OpenAI CTO 预测 1 年半“博士级智能”AI 将出现|AI 日报

作者:可信AI进展
  • 2024-06-24
    浙江
  • 本文字数:2120 字

    阅读完需:约 7 分钟

文章推荐

1179万毕业生求职大潮袭来,8大AI模型实测,谁才是最强求职AI助手?

AI日报|我国人工智能核心产业规模已达5784亿元!阿里通义Qwen2成斯坦福大模型榜单最强开源模型!

⭐️搜索“可信 AI 进展“关注公众号,获取当日最新 AI 资讯

OpenAI 竞争对手 Anthropic 发布 Claude 3.5 Sonnet,比 GPT-4o 更智能

Claude 3.5 Sonnet 在 GPQA、MMLU 和 HumanEval 等测评中均打破了行业天花板,在理解和把握细微差别、幽默以及复杂指令方面有显著提升,尤其擅长以自然、亲切的语气撰写高质量内容。

此外,Claude 3.5 Sonnet 在视觉方面也有显著进步,主要体现在视觉推理的任务中。Claude 3.5 Sonnet 能准确地从图片中转录文本,并从中获取更多洞见,这是零售、物流和金融服务等行业的核心需求。

Claude 3.5 Sonnet 现已在 Claude.ai 和 iOS 应用上可用,订阅用户能以更高的访问速度使用。

开发者们可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。价格方面,Claude 3.5 Sonnet 和 Claude 3 Sonnet 保持一致,每百万输入 token 3 美元,每百万输出 token 15 美元,200k 上下文长度。

https://www.anthropic.com/news/claude-3-5-sonnet

OpenAI CTO 预测 1 年半内“博士级智能”的 AI 就会出现

在达特茅斯工程学院主持的一场对话中,作为该校校友的 OpenAI 首席技术官米拉·穆拉蒂(Mira Murati)参与了对话。她预计用于特定任务的“博士级智能”很快就会出现,这个时间可能是 1 年半。

当被问及 ChatGPT 的智能进展时,穆拉蒂表示:“这些系统在特定任务中已经达到了人类的水平,当然在很多任务中,它们还没有达到。”

“在接下来的几年里,我们将着眼于特定任务的博士级智能。所以情况正在迅速改变和提高。”

当主持人问到“是指 1 年后吗?”时,穆拉蒂回答:“是的,1 年半吧。”

https://finance.sina.com.cn/stock/usstock/c/2024-06-21/doc-inazntae1253847.shtml

阿里云推出首个 AI 全栈程序员,需求分析、开发、测试全流程都能干!

在今天的阿里云上海 AI 峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。据介绍,该“AI 程序员”是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与“通义灵码”有所不同。在收到用户需求后,“AI 程序员”就可实现软件开发“一条龙”:理解需求-拆分任务-编写代码-识别并解决报错-提交代码。

https://www.ithome.com/0/776/746.htm

北京市首例“AI 换脸”软件侵权案宣判:国风博主短视频被“换脸”后制作成付费模板

据北京互联网法院消息,6 月 20 日,北京互联网法院一审开庭宣判了两起北京市首例“AI 换脸”软件侵权案件,认定使用他人视频“换脸”后制作模板再提供“换脸”服务的网络服务提供者侵害了他人的个人信息权益。

两案原告廖某、吴某均系国风短视频模特,在全网拥有众多粉丝。被告是一款“换脸”App 的运营者。原告主张,在未经其授权同意的情况下,被告使用原告的出镜视频制作换脸模板,并上传至涉案换脸 App 中,提供给用户付费使用借此牟利。

法院判决,被告向原告赔礼道歉,赔偿精神损失及经济损失。目前案件尚在上诉期,一审判决未生效。

https://www.ithome.com/0/776/616.htm

AI 新研究可用手机筛查中风,准确率达 82%

来自皇家墨尔本大学(RMIT)生物医学工程师团队和圣保罗州立大学的博士生 Guilherme Camargo de Oliveira 共同开发了一款基于 AI 的面部筛查工具,医护人员只需要借助智能手机,在几秒钟内就可以确定患者是否中风,准确率达到了 82%。

该技术利用面部表情识别,分析面部对称性和肌肉运动,快速判断患者是否中风,有助于医护人员即刻通知医院并在黄金时间内采取治疗措施,从而改善康复效果并减少长期残疾风险。

研究指出,该工具特别适用于急救场景,尤其是由非专业人员初步判断时,能减少因症状微妙或患者背景差异造成的漏诊。

项目负责人 Dinesh Kumar 教授强调,该工具虽不能替代专业临床诊断,但能加快识别需紧急治疗的中风患者。

目前,团队正与医疗机构合作,进一步完善该技术并扩展其应用范围,以涵盖更多神经系统疾病的早期检测。

https://www.eurekalert.org/news-releases/1048439

不再建议往披萨里加胶水?数据显示谷歌已降低 Reddit 对 AI 搜索结果的影响

在今年谷歌 I/O 大会推出的 AI 搜索功能中,用户遇到了一些异常回复,比如在披萨中加胶水,这些问题源于 AI 系统抓取了包括 Reddit 帖子在内的网页信息。

根据搜索引擎优化平台 SERanking 公布的数据显示,Reddit 已经不再是谷歌“AI Overviews”信息来源的前十名。

该平台分析了 10 万个关键词,排在前五的信息源包括 Runners World、Healthline、LinkedIn、RunRepeat 及维基百科,Reddit 的具体排名未知,但确认其排名有下滑。

https://www.ithome.com/0/776/651.htm

AI Agent 初创公司 Decagon 完成 3500 万美元 A 轮融资

6 月 18 日,生成式 AI 初创公司 Decagon 宣布完成由 Accel 领投的 3500 万美元 A 轮融资以及此前由 a16z 领投的 500 万美元种子轮融资。

Decagon 由 CEO Jesse Zhang 以及 CTO Ashwin Sreenivas 共同创立,致力于为企业提供先进的生成式 AI 平台,以解决复杂的客户支持问题。Decagon 的解决方案不仅仅是简单的聊天机器人,而是能够与企业现有工作流程深度集成的类人 AI Agent。

发布于: 刚刚阅读数: 5
用户头像

分享SPG,AGL,ACE和LLM在金融领域的进展。 2023-12-25 加入

还未添加个人简介

评论

发布
暂无评论
Claude 3.5 Sonnet发布,比GPT-4o更智能;OpenAI CTO预测1年半“博士级智能”AI将出现|AI日报_#人工智能_可信AI进展_InfoQ写作社区