写点什么

Getty 携手英伟达升级商业文生图 AI 模型;苹果新专利探索「心跳」解锁 iPhone 丨 RTE 开发者日报

作者:声网
  • 2024-08-01
    四川
  • 本文字数:2272 字

    阅读完需:约 7 分钟

Getty 携手英伟达升级商业文生图 AI 模型;苹果新专利探索「心跳」解锁 iPhone 丨 RTE 开发者日报


开发者朋友们大家好:


这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、苹果专利探索 Heart ID:用心跳数据验证身份解锁 iPhone


7 月 31 日,继 Touch ID 指纹解锁和 Face ID 面部解锁之后,苹果最新专利探索 Heart ID,通过检测和验证用户心跳数据,实现 iPhone 等设备解锁。


苹果公司在专利中表示,电子设备通常存储了个人和机密信息,涵盖联系人、电子邮件、通话记录等等,而且可能存在多位用户共用 1 台设备的情况。


苹果在专利中认为除了常规生物认证方式之外,还可以根据用户的心跳属性来验证用户身份。例如,设备可以处理用户心律特定部分的持续时间或用户心电图(EKG)峰值的相对大小,并与存储的配置文件进行比较,以验证设备用户的身份。(@IT 之家)


2、零样本即可时空预测,港大、华南理工等发布时空大模型 UrbanGPT


香港大学和华南理工大学的研究人员联合发布了一款名为 UrbanGPT 的时空大模型,该模型结合了时空依赖编码器和指令微调技术,致力于解决城市时空预测中的挑战。这项技术的目标是揭示城市生活中交通、人口迁移和犯罪率等各个方面的未来趋势和模式。


UrbanGPT 旨在提高在数据不足情况下的预测准确性,通过分析超过 500 万个热门视频,运用 GPT-4o 生成脚本和故事板,强化视频效果。该模型在多个公共数据集上进行了广泛实验,表现出色,超越了现有顶尖模型。UrbanGPT 特别擅长零样本学习,在标签数据稀缺或重新训练成本高昂的情况下,仍能提供全面和精确的预测。


此外,该模型还具有多语言支持,适用于电子商务营销、产品介绍、应用推广等多种场景。研究团队计划未来收集更多城市数据,增强模型应用能力,并致力于提高模型的可解释性,增加透明度和用户信任。(@新智元)


3、AI 视频编辑工具 Topview.ai 一键生成营销广告


Topview.ai 是一个免费的在线 AI 视频编辑工具,它能够快速将用户提供的链接或媒体资产转换成具有吸引力的视频广告。该平台通过分析 YouTube 和 TikTok 上的超过 500 万个热门视频,运用 GPT-4o 生成脚本和故事板,并利用 AI 头像增强视频效果。


Topview.ai 提供的 AI 功能包括脚本生成、剪辑选择与编辑、语音旁白、头像创建、自动字幕生成以及多语言支持。这些功能可以为电子商务营销、产品介绍、应用推广等多种场景制作吸引人的营销视频。用户无需专业的视频编辑技能,可以通过 Topview.ai 提高视频制作效率,大幅降低成本。(@AI 科技评论)


4、京东发布言犀智能体平台、智能编程助手 JoyCoder 等八大产品


京东云推出一系列大模型应用产品,京东云的企业大模型服务支持一站式打造企业专属大模型,同时保持垂直领域知识的注入和模型的通用能力。言犀 AI 开发计算平台 2.0 提供了多种开源模型和数据集,以及大模型开发服务。


此外,京东云还推出了大模型安全可信平台,涵盖了超过 200 种对抗攻击手法,并覆盖了监管合规要求的全部 31 类风险类型。京东云云舰 AI 算力云支持多地域分布式算力的统一调度,提供高性价比的算力供给。新一代分布式存储云海 3.0 支持千亿级参数 AI 大模型。京东云言犀智能体平台已接入数十个大模型,活跃在京东内部的智能体超过 3300 个,并提供了行业应用快速落地的解决方案模板。(@AI 科技评论)


5、Getty 携手英伟达升级 AI 文生图服务:6 秒生成 4 张照片、提示词最多 250 个单词


Getty Images 和英伟达公司近日发布声明,联合推出安全的商业文生图 AI 模型,能够在 6 秒时间内生成 4 张照片,比以前的模型性能提高了一倍,速度处于行业领先水平。


Getty Images 表示全新文生图 AI 模型部分基于英伟达 Edify 模型架构,该架构隶属于英伟达 Picasso,主要为视觉设计搭建和部署生成式 AI 模型。英伟达 Edify 模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词,而且该改进了 4K 采样和微调模型的能力。


作为更新的一部分,公司还推出了 AI 修图功能,让客户能够修改生成的 AI 图像和现有的预拍摄创意图像,这些新功能包括添加或更改单个元素、扩展画布或一键删除背景。AI 修图功能现已在 iStock 上推出,不久也将在 Getty Images 上推出。(@IT 之家)

02 有态度的观点

1、英伟达黄仁勋:每个人都将拥有 AI 助手


英伟达 CEO 黄仁勋和《连线》杂志编辑 Lauren Goode 在 SIGGRAPH 大会上讨论了 AI 如何增强未来人类生产力等话题。


黄仁勋认为,未来每个人都会有一个 AI 助手,每一家公司、公司内的每一项工作都将得到 AI 的帮助。黄仁勋也表示,生成式 AI 能提升人类生产力,支撑其的加速计算技术则有望使计算更加节能,加速计算可以节省 20 倍甚至 50 倍的能耗,并能完成同样的处理工作。黄仁勋认为,应加速每一个应用,进而减少全世界能源使用量。


这次谈话之前,英伟达推出了一套新的 NIM 推理微服务,专为各种工作流程量身定制,包括 OpenUSD、3D 建模、物理、材料、机器人、工业数字孪生和物理 AI。(@爱范儿)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
Getty 携手英伟达升级商业文生图 AI 模型;苹果新专利探索「心跳」解锁 iPhone 丨 RTE 开发者日报_声网_InfoQ写作社区