写点什么

硅纪元视角 | 6 秒生成 4 张图,Getty Images 和英伟达联合推出文生图 AI 模型

作者:硅纪元
  • 2024-07-31
    云南
  • 本文字数:2795 字

    阅读完需:约 9 分钟


在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟 AI 科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在 AI 时代中把握机遇。


1 分钟速览新闻


  • OpenAI 推出 GPT-4o 模型的高级语音模式,ChatGPT Plus 用户独享

  • Midjourney 6.1 更新,增强图像质量和连贯性

  • 京东云八大 AI 产品亮相,智能编程助手 JoyCoder 成焦点

  • AI 搜索巨头 Perplexity 和出版社共享广告收益

  • 6 秒生成 4 张图,Getty Images 和英伟达联合推出文生图 AI 模型


全球 AI 新闻


一、OpenAI 推出 GPT-4o 模型的高级语音模式,ChatGPT Plus 用户独享



资讯概要


OpenAI 开始向部分 ChatGPT Plus 用户推出 GPT-4o 模型的高级语音模式,这一新功能可以提供更自然的实时对话体验,支持用户打断对话并回应情感。预计到 2024 年秋季,所有 Plus 用户都能使用这一功能。该功能的推出曾因安全问题和斯嘉丽·约翰逊的法律威胁而推迟。目前,语音模式尚处于 alpha 阶段,只有少数用户能够初步使用。该模式包含四种预设声音,且被编程以避免模仿特定个人。从今天起,该功能开始向用户推出,并提供超现实的音频响应。


硅纪元视角


OpenAI 的高级语音模式的推出,预示着人工智能在自然语言处理和语音合成领域迈出了重要一步。这一模式的超现实音频响应能力,将极大地提升用户体验,使得与 AI 的互动更加流畅和自然。在教育领域,该技术可以用于创建个性化的虚拟助教,帮助学生在语言学习中获得即时反馈。在客户服务领域,它能够提供更加人性化的客服体验,通过情感识别和响应,更好地处理用户咨询和投诉。此外,在娱乐和媒体制作中,高级语音模式可以用于生成逼真的配音或角色对话,为游戏和电影制作提供便利。随着技术的发展和应用场景的拓展,我们期待看到更多创新的 AI 语音应用,为人们的生活和工作带来便利和乐趣。同时,如何确保技术的安全性、避免滥用,也是 OpenAI 和整个 AI 行业需要持续关注和解决的问题。


二、Midjourney 6.1 更新,增强图像质量和连贯性!



资讯概要


Midjourney 发布了其 AI 图像生成器的 6.1 版本,带来了图像质量和一致性的显著提升。新版本特别优化了解剖学特征的渲染,如手臂、腿部和身体,同时增强了纹理并减少了像素伪影。用户可以通过 Discord 和网页应用访问这一版本,并可通过在提示中添加'--v 6.1'来体验新功能。社区对此版本反应热烈,认为它为创造生动、详细的图像提供了更强的能力。


硅纪元视角


Midjourney 6.1 版本的发布,标志着 AI 图像生成技术的又一大步。在艺术创作、游戏设计、电影制作等多个领域,这一技术的应用潜力巨大。例如,在艺术创作中,艺术家可以利用这一工具快速生成草图,节省时间并激发创意;在游戏设计领域,它可以用于快速原型设计,帮助开发者测试和优化游戏角色和环境的视觉表现。此外,随着 AI 生成图像质量的提升,它在电影和电视制作中的应用也日益增多,可以用于概念艺术的创建或作为预可视化工具,帮助导演和制片人更好地规划拍摄。


在广告和市场营销领域,Midjourney 6.1 可以快速生成吸引人的广告图像,提高营销材料的吸引力和转化率。随着技术的不断进步,我们可以预见到 AI 图像生成工具将在更多领域得到应用,如虚拟现实内容的创作、教育领域的可视化辅助教学等。同时,随着用户对个性化和定制化内容需求的增加,AI 图像生成技术将为用户提供更加丰富和个性化的视觉体验,推动创意产业的发展。然而,随着技术的发展,也需要注意版权、伦理和隐私等方面的问题,确保技术的应用不会侵犯他人的权益。


三、京东云八大 AI 产品亮相,智能编程助手 JoyCoder 成焦点



资讯概要


京东云峰会在上海举办,会上展示了京东言犀大模型的行业应用,并发布了八大 AI 产品。这些产品包括京东云企业大模型服务、言犀 AI 开发计算平台 2.0、大模型安全可信平台、云舰 AI 算力云、分布式存储云海 3.0、言犀智能体平台、言犀数字人 3.0 以及智能编程助手 JoyCoder。其中,JoyCoder 作为一款基于大模型技术的编程工具,为开发者提供代码预测续写、智能代码评审等功能,目前已服务数亿用户,研发提效 30%。


硅纪元视角


京东云发布的这一系列 AI 产品,展现了其在人工智能领域的深厚积累和创新能力。从企业大模型服务到智能编程助手,这些产品不仅提升了企业的研发效率,也为 AI 技术的行业应用提供了更多可能性。


以 JoyCoder 为例,其代码预测续写功能可以大幅提高程序员的编码速度,智能代码评审则有助于提升代码质量,减少 bug。在大规模软件开发项目中,这些功能可以显著提升开发效率,缩短项目周期。


此外,言犀数字人 3.0 平台的发布,为虚拟主播、客服等领域提供了更多个性化和行业化的选择。结合京东在电商、物流等行业的深厚积累,这些 AI 产品有望在更多场景中发挥价值,推动行业的智能化升级。


总的来说,京东云的 AI 产品矩阵,不仅体现了其在 AI 技术自主研发上的实力,也为各行各业的数字化转型提供了有力支撑。随着 AI 技术的不断进步和应用落地,我们有理由相信,这些产品将为社会带来更加智能化、高效化的服务体验。


四、AI 搜索巨头 Perplexity 和出版社共享广告收益



资讯概要


AI 搜索公司 Perplexity 在被指过度抓取内容后,与多家知名出版社达成协议,推出“出版商计划”。这一计划允许合作伙伴在 Perplexity 使用其内容回应用户查询时,分享一定比例的广告收入。参与的出版商包括《时代》、《明镜周刊》等,同时他们还将免费获得 Perplexity 企业专业版一年的订阅,以及访问开发者工具和洞察力服务。


硅纪元视角


Perplexity 的新策略不仅解决了与出版社之间的版权争议,还为 AI 搜索领域开创了一种新的商业模式。通过与出版商分享广告收益,Perplexity 能够吸引更多高质量的内容合作伙伴,进一步丰富其搜索结果的多样性和深度。同时,这也为出版商提供了新的收入来源,激励他们创作更多有价值的内容。


Perplexity 与出版社的合作是 AI 技术在内容产业中的一次有益尝试。它不仅解决了版权问题,还为 AI 搜索和推荐系统的发展提供了新的思路。随着 AI 技术的不断进步,我们有理由相信,它将在更多领域发挥重要作用,推动内容产业的创新和发展。


五、6 秒生成 4 张图,Getty Images 和英伟达联合推出文生图 AI 模型



资讯概要


Getty Images 和英伟达公司联合推出安全商业文生图 AI 模型,能在 6 秒生成 4 张照片,性能翻倍,速度行业领先。新模型基于英伟达 Edify 架构,提升 4K 采样和微调能力。更新功能包括:行业领先生成速度、4K 生成细节、详细提示支持、更长提示词支持、先进镜头控制,以及 AI 修图功能。


硅纪元视角


新 AI 文生图技术在广告、影视、游戏等行业的应用潜力巨大。广告业可快速生成创意广告图,提升营销效率;影视制作中,可快速生成场景概念图,加速前期制作流程;游戏设计中,AI 生成的图像能丰富游戏世界的细节。此外,AI 修图功能为用户提供了更多创作自由度,可对生成图像进行个性化调整。随着 AI 技术的进步,未来文生图应用将更加广泛,为创意产业带来革命性变革。同时,AI 生成图像的版权、伦理等问题也需行业共同探讨解决。

用户头像

硅纪元

关注

还未添加个人签名 2024-07-16 加入

还未添加个人简介

评论

发布
暂无评论
硅纪元视角 | 6秒生成4张图,Getty Images和英伟达联合推出文生图AI模型_硅纪元_InfoQ写作社区