写点什么

Google 推出 Gemma 2 2B 端侧模型;Github 新服务帮助开发者选择 AI 模型 丨 RTE 开发者日报

作者:声网
  • 2024-08-02
    四川
  • 本文字数:1864 字

    阅读完需:约 6 分钟


开发者朋友们大家好:


这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。


本期编辑:@JLT,@鲍勃


01 有话题的新闻


1、Google 推出 Gemma 2 2B 模型,能够在手机、笔记本电脑、台式机等边缘设备上运行


Gemma 2 2B 是 Google 推出的 Gemma 2 系列中一款重量级的轻量级 AI 模型,具有 2 亿参数。Gemma 2 2B 利用了知识蒸馏技术,通过从更大、更复杂的模型中学习,将其知识传递到较小的模型中,取得了超出预期的性能表现。


GEMMA 2 2B 模型适用于多种文本生成任务,包括问答、摘要和推理。其相对较小的体积使其能够在笔记本电脑、台式机或私人云基础设施等资源有限的环境中部署。(@小互 AI)


2、微软 GitHub 推出 Models 服务:定位 AI 工程师,让开发者试用和部署模型


微软旗下代码托管平台 GitHub 最新推出了 GitHub Models 服务,定位是新一代 AI 工程师,帮助开发者选择适合其应用的 AI 模型。


GitHub 在官方新闻稿中表示,GitHub Models 将服务该平台 1 亿多用户,为其提供业界领先的大语言模型(LLM)或者小语言模型(SLM)。


GitHub Models 服务目前处于限量公测阶段,可以对接 OpenAI 的 GPT-4o 和 GPT-4o mini、微软的 Phi 3、Meta 的 Llama 3.1 以及 Mistral 的 Large 2 等 AI 模型,并承诺未来会继续扩充更多语言和视觉模型。开发人员可以通过内置的 Model Playground 访问这些模型,并在此测试不同的提示和模型参数。(@IT 之家)


3、巴黎奥运会启用阿里云「子弹时间」系统



据奥林匹克广播服务公司介绍,巴黎奥运会采用了阿里云 AI 增强的全新转播技术——多镜头回放系统。


据介绍,该系统让转播有了科幻电影般的视觉效果,给观众呈现强化慢镜头、时间静止等特效画面,被称为「子弹时间」。


在 7 月 31 晚,自由式小轮车女子公园赛决赛中,18 岁中国选手邓雅文高高跃起的姿态在直播回放环节中突然定格,镜头呈现环绕效果,这就是「子弹时间」系统的效果。


目前,「子弹时间」系统已经在 14 个比赛场馆内启用,涵盖七人制橄榄球、羽毛球、体操田径、篮球、沙滩排球、乒乓球、摔跤、网球、柔道、霹雳舞、小轮车自由式和滑板等 21 个项目。(@爱范儿)


4、Midjourney V6.1 版本上线,优化远景人脸,细节更丰富



Midjourney V6.1 版本的上线带来了多项重要更新,包括图像连贯性的突破、画质的全面提升、微观细节的精准把控等。在处理复杂结构如人体和动植物时,表现出色,尤其是在细节如手臂、腿部和手掌的自然流畅表现上。新版本在减少像素伪影、增强纹理表现力方面取得了显著进展,特别是在皮肤质感和 8bit 复古风格的呈现上。


标准图像任务的处理速度提升约 25%, 能更准确地生成文字,可以调用旧任务中的个性化模型和数据。(@AI 科技评论)


5、GitStart AI Ticket Studio 优化软件开发,自动化生成工程票据


GitStart AI Ticket Studio 旨在通过 AI 来简化和优化软件开发过程中的 Bug 报告和功能请求。它能够自动化地生成详细、清晰的工程票据,减少沟通成本,提高开发效率。


该工具集成了自然语言处理和机器学习技术,可以理解开发者和项目经理的描述,然后转化为标准化的、易于理解的任务描述。用户可以通过简单的描述来启动这个过程,AI 将自动填充必要的细节,包括问题的重现步骤、相关截图和日志,以及可能的解决方案。这样的工具对于提升团队协作和加速软件迭代至关重要。(@AI 科技评论)


02 有态度的观点


1、科大讯飞研究院院长:AI 应用落地关键是深入场景


在一场媒体沟通会上,科大讯飞副总裁、研究院院长刘聪谈到了对 AI 应用场景的理解。


刘聪认为,中国拥有独特的应用场景优势,庞大的人口基数为行业产品提供了丰富的数据和多样化的应用场景,AI 应用要能够创造商业价值,核心在于对落地场景的深入理解。


「AI 大模型应用落地的第一核心是深入理解场景,用场景需求牵引着技术的发展」,刘聪表示,他也认为,模型大小的选择也应根据实际应用场景和任务需求来决定。(@爱范儿)


写在最后:


我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。


对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。



素材来源官方媒体/网络新闻

用户头像

声网

关注

还未添加个人签名 2021-02-05 加入

声网(NASDAQ:API)成立于2014年。开发者可通过声网API,在应用内构建多种实时音视频互动场景。使用声网服务的包括小米、陌陌、斗鱼、哔哩哔哩、新东方、小红书、HTC VIVE 、Yalla等遍布全球的巨头、独角兽企业。

评论

发布
暂无评论
Google 推出 Gemma 2 2B 端侧模型;Github 新服务帮助开发者选择 AI 模型 丨 RTE 开发者日报_声网_InfoQ写作社区