1018AI 资讯|Optimus 机器人进化,ChatGPT Windows 版推出 | Siri 新功能揭秘 | 复旦 AI 模型开创动画新纪元
❝
一起寻找 AI 时代的生存之道,包括但不限于工作提效,赚钱,就业,娱乐,汇总 AI 动态和工具资讯,助你跟上科技节奏。
🪐温馨提示:不是所有的都要看,挑感兴趣用得上的看,每个人的口味和需求不一样。
大模型动态
OpenAI 推出 GPT-4O-Audio-Preview OpenAI 展示了 GPT-4O-Audio-Preview 模型,展现高级语音与情感分析能力。此功能将在客户服务、教育和娱乐领域开创全新互动体验。
详情入口:https://platform.openai.com/docs/guides/audio/quickstart
Anthropic 发布 Claude 3.5 Sonnet 模型 Anthropic 推出 Claude 3.5 Sonnet,与 ChatGPT 展开竞争。
复旦发布 AI 模型 Hallo2,生成超长 4K 人物动画 复旦大学和百度联合开发 Hallo2,支持生成超长 4K 分辨率人物动画,大幅提升动画制作行业创新力。
详情入口:https://fudan-generative-vision.github.io/hallo2/#/
AI 产品
特斯拉发布新款 Optimus 机器人,具备自主导航
特斯拉 Optimus 机器人展示出自主导航与人类互动能力,技术进步明显,实现了更高效的 AI 和机器人合作。
苹果 Siri 计划推出 ChatGPT 集成与图像生成功能
苹果计划在 iOS18、iPadOS18 系统中集成 ChatGPT 功能,为 Siri 赋予更增强的图像及文本生成能力。
详情入口:https://appleinsider.com/articles/23/xx-new-features
OpenAI 推出 Windows 适用版本 ChatGPT 客户端
OpenAI 发布 ChatGPT Windows 客户端,处于早期测试阶段,将为更多 Windows 用户提供便捷使用体验。
精选工具
Perplexity 增加内部知识搜索功能
Perplexity 新增“内部知识搜索”,提高企业数据检索效率。团队可享有文件共享及 AI 助手定制功能。
原文链接:https://twitter.com/imxiaohu/status/1847190899744559275
JoyCaption 开源视觉语言模型,支持 NSFW 内容
JoyCaption,支持 NSFW 内容,研究人员新的实验工具,免费且开源。
技术与学术成果
Google NotebookLM 升级 AI 笔记助手
Google 为 NotebookLM 进行全面升级,增加音频概览和后台功能,为用户带来更佳使用体验。
MIMO 实现 AI 换人保持动作一致性
确保视频中人物一致性的 AI 换人技术,阿里研究,未完全开源。
详细信息:https://menyifang.github.io/projects/MIMO/index.html
Mini-Omni2: 多模态交互模型支持多输入
Mini-Omni2 支持文字、图像、音频输入,处于早期开发阶段,但交互潜力巨大。
末尾广告
觉得有收获,欢迎扫码“言寡意多”,AI 资讯和教程推送。
AI 工具导航站“未来已来”,AI 工具收录。(pc 端打开)
“GPT,MJ 多种 AI 大模型”扫码优惠购买。
“精选 AI 专栏”,优质信息,学 AI 不孤单。
评论