写点什么

iPhone 可运行的谷歌 Gemma 2 2B 模型,性能超 GPT-3.5

作者:硅纪元
  • 2024-08-02
    云南
  • 本文字数:3264 字

    阅读完需:约 11 分钟


在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟 AI 科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在 AI 时代中把握机遇。


1 分钟速览新闻


  • Black Forest Labs 推出 FLUX.1 图像生成模型

  • 全球首部 AI 法规生效:欧盟《人工智能法案》开启监管新纪元

  • 首款国产自研 AI 视频大模型 Vidu,让静态照片“活”起来

  • OpenAI 测试 GPT-4o 长输出版,单次 64K tokens 输出能力

  • iPhone 可跑谷歌 Gemma 2 2B 模型,性能超 GPT-3.5


全球 AI 新闻


一、Black Forest Labs 推出 FLUX.1 图像生成模型



资讯概要


Black Forest Labs,由 Robin Rombach、Patrick Esser 和 Andreas Blattmann 创立,推出了 FLUX.1 系列文本到图像的先进模型。此系列包括 FLUX.1[pro]和 12 亿参数的 FLUX.1[dev],旨在提供卓越的文本理解、构图、提示遵循、图像细节和输出多样性。公司已筹集 3100 万美元资金,推动这些模型的发展。FLUX.1 模型在 HuggingFace 和 Poe 等平台上发布,具有出色的 ELO 评分,预计将在行业中树立新的标准。Black Forest Labs 还计划未来推出文本到视频的模型。


硅纪元视角


FLUX.1 模型的推出标志着 AI 技术在图像生成领域的新突破。这些模型的多参数设计和高 ELO 评分预示着它们在生成高质量、多样化图像方面的巨大潜力。在广告、游戏设计、电影制作等领域,FLUX.1 可以快速生成符合特定主题或场景的图像,极大提高内容创作的效率和灵活性。此外,FLUX.1 的 API 和开源许可使得开发者和企业能够根据自身需求定制和集成图像生成技术,推动个性化和创新解决方案的发展。


在教育领域,FLUX.1 可以作为辅助工具,帮助学生更好地理解复杂概念,通过图像化的方式呈现抽象信息。在艺术创作中,FLUX.1 可以激发艺术家的灵感,提供新颖的视觉元素,创造出前所未有的艺术作品。随着 Black Forest Labs 未来推出文本到视频的模型,我们可以预见到视频内容创作将迎来同样革命性的变化,为视频制作、虚拟现实体验和动画设计等领域带来新的机遇和挑战。总的来说,FLUX.1 模型的发展不仅推动了 AI 技术的边界,也为多个行业提供了创新的动力和可能性。


二、全球首部 AI 法规生效:欧盟《人工智能法案》开启监管新纪元


资讯概要


欧盟《人工智能法案》正式生效,成为全球首部全面监管人工智能的法规。该法案旨在确保人工智能的可信度,并保护人们的基本权利,同时建立统一的内部市场,鼓励技术采用与创新。违反法案的罚款可能高达全球年营业额的 7%。法案将 AI 系统分为最小风险、特定透明度风险、高风险和不可接受风险四类,对不同类别的 AI 系统提出了相应的监管要求。


硅纪元视角


欧盟《人工智能法案》的实施对 AI 行业具有里程碑意义。它不仅为 AI 技术的安全应用提供了法律框架,也为全球 AI 监管树立了标杆。法案对 AI 系统的分类监管,体现了对不同风险等级的精准把控。最小风险类 AI 系统如推荐系统,可享受更宽松的环境,鼓励创新;而高风险类 AI 系统如招聘或贷款评估,则需满足更严格的要求,确保公平性和透明度。


法案对不可接受风险的明确禁止,如操纵人类行为的 AI 系统,彰显了对个人自由和隐私的尊重。同时,对特定透明度风险的要求,如聊天机器人的披露义务,有助于增强用户对 AI 交互的信任。


从应用视角看,法案的实施将推动 AI 技术在教育、医疗、金融等行业的规范发展。例如,在医疗领域,高风险 AI 系统的严格监管将确保诊断和治疗建议的准确性和可靠性。在金融领域,对贷款评估 AI 的监管有助于防止算法偏见,保护消费者权益。


此外,法案对 AI 生成内容的透明度要求,将促进内容创作和版权保护的规范化。在广告、娱乐等领域,AI 生成内容的明确标识,有助于维护真实性和公平竞争。总之,《人工智能法案》的生效标志着 AI 行业进入规范发展的新时代。它为 AI 技术的创新应用提供了法律保障,同时也对 AI 伦理和社会责任提出了更高要求。随着法案的逐步实施,我们期待 AI 技术能在更广泛的领域发挥积极作用,同时确保技术的健康发展和用户的权益保护。


三、首款国产自研 AI 视频大模型 Vidu,让静态照片“活”起来



资讯概要


首个国产纯自研视频大模型 Vidu 上线,由清华大学与生数科技联合发布。Vidu 具备文生视频、图生视频两大核心功能,支持 4 秒和 8 秒视频生成,最高 1080P 分辨率。Vidu 采用了全球首个 Diffusion 与 Transformer 融合的架构 U-ViT,新增角色一致性、动漫风格、文字与特效画面生成等能力。在构图、叙事和光影等方面,Vidu 能实现接近电影级效果,并能生成影视级特效画面。


硅纪元视角


Vidu 的推出标志着国产 AI 视频生成技术的重大突破。其在构图、叙事和光影上的卓越表现,为视频内容创作提供了全新的工具和平台。在影视制作领域,Vidu 能够辅助导演和摄影师快速生成高质量的动态画面,提高创作效率。在广告和营销领域,Vidu 可以根据广告创意自动生成吸引人的视频内容,提升广告的吸引力和传播效果。


此外,Vidu 在动漫风格的生成能力,为动漫产业带来了新的发展机遇。动漫创作者可以利用 Vidu 快速生成动漫角色和场景,降低创作门槛,激发更多创意。在教育和培训领域,Vidu 可以根据教学内容自动生成生动的教学视频,提高学生的学习兴趣和效果。


Vidu 的动漫风格生成和特效画面生成能力,还可以应用于游戏开发和虚拟现实领域,为游戏角色和场景设计提供更多可能性。同时,Vidu 在角色一致性方面的技术,有望在人脸识别、视频监控等安全领域发挥作用,提高识别的准确性和可靠性。


总之,Vidu 的推出为 AI 视频生成技术的发展注入了新的活力,其在多个领域的应用潜力值得期待。随着技术的不断优化和完善,相信 Vidu 将为视频内容创作和产业发展带来更多创新和价值。


四、OpenAI 测试 GPT-4o 长输出版,单次 64K tokens 输出能力



资讯概要


OpenAI 最新推出的长输出版 GPT-4o(GPT-4o Long Output)正在进行 Alpha 测试,该版本模型能够单次输出最多 64K tokens。Alpha 测试参与者可以通过“gpt-4o-64k-output-alpha”模型名称访问。由于推理成本增加,该模型定价较高,每百万 tokens 输入价格 6 美元,输出价格 18 美元。此前发布的 GPT-4o mini 以低成本效益著称,每百万 tokens 输入价格仅为 15 美分,输出价格 60 美分。


硅纪元视角


长输出版 GPT-4o 的推出,意味着 AI 技术在文本生成领域的进一步突破。64K tokens 的输出能力,为复杂场景下的应用提供了更广阔的空间。例如,在撰写长篇小说、生成详细报告或构建复杂对话系统时,更长的输出能力可以提供更加丰富和连贯的内容。此外,随着 AI 技术的不断进步,更长的输出能力也有助于提高模型的理解和推理能力,从而在教育、咨询、客服等领域提供更加精准和个性化的服务。然而,成本的增加也可能对小型企业和个人用户的应用造成一定影响,这需要 OpenAI 在技术优化和成本控制上做出更多努力。同时,长输出能力也可能带来信息过载和质量控制的挑战,如何在保证内容质量和用户体验的同时,合理利用这一能力,也是开发者需要考虑的问题。随着 AI 技术的不断发展,我们期待看到更多创新的应用场景和解决方案的出现。


五、iPhone 可跑的 AI 新贵:谷歌 Gemma 2 2B 模型性能超 GPT-3.5



资讯概要


谷歌 DeepMind 推出 Gemma 2 2B 小模型,性能超越 GPT-3.5。该模型从 27B 参数的 Gemma 2 中蒸馏而来,参数量为 2.6B。在 LMSYS 竞技场得分超 1130 分,适配多种平台,包括 iPhone 15 Pro。同时发布的还有 ShieldGemma 安全分类器和 Gemma Scope 可解释性工具,后者通过开源稀疏自编码器帮助理解 AI 决策过程。


硅纪元视角


Gemma 2 2B 模型的推出,标志着 AI 技术在轻量化和高性能方面的新突破。其在 iPhone 等移动设备上的应用,预示着 AI 能力将更加普及和便捷。ShieldGemma 作为安全内容分类器,将有助于提高 AI 系统的安全性和可靠性,尤其是在处理敏感信息时。而 Gemma Scope 的推出,为 AI 的可解释性问题提供了新的解决方案,通过可视化的方式帮助研究人员和开发者理解模型的内部工作机制,推动了 AI 技术的透明度和可信度。在教育、医疗、客服等领域,Gemma 2 2B 的轻量化特性将使得个性化 AI 助手更加智能和高效。同时,Gemma Scope 的应用将促进 AI 系统的自我学习和优化,提高决策的准确性。随着技术的不断进步,我们可以预见 AI 将在更多领域扮演关键角色,为人类社会带来更多便利和价值。

用户头像

硅纪元

关注

还未添加个人签名 2024-07-16 加入

还未添加个人简介

评论

发布
暂无评论
iPhone可运行的谷歌Gemma 2 2B模型,性能超GPT-3.5_gpt4o_硅纪元_InfoQ写作社区