写点什么

ElevenLabs X-to-Voice:社交账号自动生成能说话的个人页面;OpenAI 正式推出 ChatGPT 搜索

作者:声网
  • 2024-11-01
    四川
  • 本文字数:2420 字

    阅读完需:约 8 分钟

ElevenLabs X-to-Voice:社交账号自动生成能说话的个人页面;OpenAI 正式推出 ChatGPT 搜索


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@SSN,@鲍勃

01 有话题的新闻

1、OpenAI 正式推出 ChatGPT 搜索


今天凌晨,OpenAI 宣布开放 ChatGPT 机器人中集成的全新搜索功能。当用户与 ChatGPT 交互时,聊天机器人会根据用户的需求自主决定是否进行网络搜索以提供更多更新的信息,用户也可以手动触发搜索功能。据介绍,搜索功能的底层模型是 ChatGPT-4o 微调版本。这个功能曾在今年 7 月以「SearchGPT」的原型向 10000 名测试用户推出。ChatGPT Plus 和 Team 订阅用户现在即可使用搜索功能,未来几周将向教育和企业用户开放,而免费用户还需要等待几个月的时间。OpenAI 也官宣了和多家新闻媒体的合作,包括美联社、路透社、《时代》杂志等多家媒体,这些合作伙伴可以选择对 ChatGPT 开放自己的内容,以出现在搜索结果中。(@APPSO)


2、D-ID 推超逼真 AI 虚拟头像:进行视频训练就能复刻头部和躯干动作


人工智能视频平台 D-ID 今日宣布推出两款新型虚拟头像 ——Express 和 Premium+,旨在提升内容创作的质量和效率。Express 头像的训练时间仅需约一分钟的视频,能够在用户讲话时复制其头部动作。而 Premium + 则是公司的旗舰模型,需要至少几分钟的录制,以生成可以在视频中展示手部和躯干动作的 AI 头像。D-ID 的目标是通过增加手部和躯干的动作,使虚拟头像在与用户互动时更加自然和真实。D-ID 表示,Premium + 模型具备实时互动能力,特别适合用于网络研讨会和翻译等应用场景。公司计划将这些虚拟头像应用于企业领域,包括生成销售线索、提升客户互动和个性化营销活动。D-ID 首席执行官吉尔・佩里在接受《科技 Crunch》采访时表示:「我们相信与 AI 模型面对面互动是最佳方式,因此我们正在创建这些超逼真的虚拟头像和自然的用户界面。」 他还强调,商业人士将会创造自己的数字头像,并且 D-ID 希望这些头像在安全和隐私方面得到良好保障,避免技术被用于误导他人。D-ID 还提到,个性化视频活动的效果显著,可以使点击率提高 30%,转化率提升 35%。(@AIbase 基地)


3、Meta 重磅发布!MobileLLM 模型全面开放,研究人员免费获取!


Meta 近日宣布,其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这些模型已与 Transformers 库全面集成。这一举措旨在推动移动设备上的大型语言模型(LLM)的研究和开发,为开发者和学术界提供更广泛的工具与资源。MobileLLM 是 Meta 在移动 AI 领域的重要进展。它的推出标志着 Meta 在降低大型语言模型使用门槛方面的重要一步。这些模型能够在移动设备上运行,使得开发者能够在更广泛的应用场景中利用 AI 技术。研究人员现在可以直接在自己的项目中测试和集成这些模型,从而推动新技术的创新。随着 AI 技术的不断进步,特别是在自然语言处理领域,大型语言模型在多个行业中显示出了巨大的潜力。然而,如何将这些技术有效地应用于实际问题仍是一个挑战。Meta 通过提供完整的模型权重,为研究者解决了这一难题,使得他们可以在自己的应用场景中进行定制化的实验。(@AIbase 基地)


4、继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端



继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。(@IT 之家)


5、X-to-Voice:输入你的 Twitter 账号名称 自动生成能说话的个人资料头像


用户可以输入 Twitter 账号名称,系统将分析其资料数据生成特有的语音和动画头像。主要功能个性化声音生成:使用 ElevenLabs 的声音设计 API,根据用户的 Twitter 资料生成专属的声音配置,使每位用户拥有独特的声音特点。动态头像创建:使用 Taedra 工具,基于用户的社交资料生成与声音匹配的动画头像,使虚拟形象更加生动。资料分析与定制:用户输入 Twitter 账号后,系统会分析该账号的资料数据,提取信息并生成声音和头像配置,让用户的线上形象更具个性。简易操作流程:用户只需输入 Twitter 账号并点击「分析」按钮,系统会在约一分钟内完成分析和生成步骤,提供即刻体验。分享与展示:生成的声音和头像可以分享至社交媒体,方便用户展示个性化的虚拟形象和声音。(@小互 AI)

02 有态度的观点

1、Runway CEO:不要去成为一家 AI 公司


AI 视频生成公司 Runway CEO Cristóbal Valenzuela 发布了一封公开信,讨论了 AI 公司的未来。Valenzuela 认为,属于 AI 公司的时代已经结束了,但这并不是说 AI 失败了,而是因为 AI 正在成为像电力或互联网一样的基础设施。在 2024 年称自己为 AI 公司,和自称互联网公司一样过时。AI 不是终极目标,而是一种工具,是支撑更伟大成就的地基,这也是 Runway 的愿景:AI 是讲故事的必备工具。真正的革新不是技术本身,而是技术能实现的事物:全新的表达和讲故事方式,以及连接人类经验的新方法。(@APPSO)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
ElevenLabs X-to-Voice:社交账号自动生成能说话的个人页面;OpenAI 正式推出 ChatGPT 搜索_声网_InfoQ写作社区