写点什么

CANN 开放端侧 NPU 自定义算子编程,助力 QQ 音乐首创移动端实时声伴分离

作者:HarmonyOS SDK
  • 2025-07-03
    贵州
  • 本文字数:881 字

    阅读完需:约 3 分钟

近日,华为开发者大会 2025 在松山湖成功举办。通过主题演讲、专题论坛等多元形式,结合沉浸式互动体验,为全球开发者搭建起思想碰撞与技术交流的平台。QQ 音乐作为鸿蒙应用开发领域的优秀典范,凭借其在技术创新与用户体验上的亮眼表现,在【HarmonyOS SDK】使能高效开发,打造优质创新应用体验分论坛中,为开发者进行了经验分享。



作为国内领先的流媒体音乐平台,QQ 音乐在数字音乐发展的浪潮中不断推陈出新,以满足用户日益多元化的音频体验诉求。论坛上,QQ 音乐音频算法研究员就通过 HarmonyOS SDK 实现端侧声伴分离的方案进行了介绍与解读。


QQ 音乐的"伴唱模式"可供用户自主调节人声与伴奏的占比,但在部分场景下,应用的声伴分离能力无法覆盖全量曲库。例如古风歌曲的听众往往热衷于"纯人声"听歌,但由于曲风小众等原因受限,很多歌曲不在其伴唱模式的支持范围内。基于此痛点,QQ 音乐与 HarmonyOS SDK 开展深化合作,利用 CANN 的端侧 NPU 自定义算子编程,为端侧音频处理带来了全新解决方案。


得益于此能力的开放,QQ 音乐基于 CANN 提供的工具链,通过算子原型定义、工程生成、代码编写等步骤,快速完成声伴分离核心算子开发。CANN 开放的端侧 NPU 自定义算子编程,就像开了一扇门,让从前只在云端跑的复杂算法,能"接地气"地在端侧高效运行。其编程语言 Ascend C,兼容 C/C++标准,支持自动并行调度与结构化核函数编程,大幅降低了算子的开发难度。例如,针对声伴分离中常用的序列建模等操作,利用 Ascend C 优化后,计算效率可显著提升。


在这个过程中,CANN 的作用至关重要。它不仅提供了高效的计算平台,还通过优化的内存管理和任务调度,确保了音乐分离过程的流畅性和实时性 。同时,NPU 自定义算子编程的灵活性,使得开发者能够根据不同的音乐分离算法和需求,定制最适合的计算逻辑,从而提高声伴分离的准确性和效率。



CANN 开放 Ascend C NPU 自定义算子编程能力,使能 QQ 音乐声伴分离功能落地 。不仅为 QQ 音乐用户带来了更加优质、全面的音频体验,也为开发者提供了全新的技术路径。未来,随着人工智能技术的不断进步,基于 HarmonyOS SDK 开放的技术特性将在更多领域得到应用,为用户带来更加智能、便捷的应用体验。

用户头像

HarmonyOS SDK

关注

HarmonyOS SDK 2022-06-16 加入

HarmonyOS SDK通过将HarmonyOS系统级能力对外开放,支撑开发者高效打造更纯净、更智能、更精致、更易用的鸿蒙应用,和开发者共同成长。

评论

发布
暂无评论
CANN开放端侧NPU自定义算子编程,助力QQ音乐首创移动端实时声伴分离_harmoyos_HarmonyOS SDK_InfoQ写作社区