语音识别
1 人感兴趣 · 56 次引用
- 最新
- 推荐
vue3+vite+ts 项目集成科大讯飞语音识别
本人最近在做数字人项目,用到科大讯飞的语音识别功能,遇到了许多坑,做个总结,给兄弟们铺铺路。
顺丰科技携手飞桨自研“智能外呼机器人”,为客户打造优质服务体验
顺丰科技的自然语言处理(NLP)团队基于飞桨语音模型库 PaddleSpeech 自研了“智能外呼机器人”的语音合成系统,于2022年双十一前夕正式上线并持续稳定运行,助力业务提质增效。
三点几嚟,饮茶先啦!PaddleSpeech 发布全流程粤语语音合成
大家好!今天带来的是基于PaddleSpeech的全流程粤语语音合成技术的分享~
一文读懂 PaddleSpeech 中英混合语音识别技术
本次PaddleSpeech发布的中英文语音识别预训练模型Conformer_talcs可以通过PaddleSpeech封装的命令行工具CLI或者Python接口快速使用,开发者们可以基于此搭建自己的智能语音应用,也可以参考示例训练自己的中英文语音识别模型。
AngularJS 进阶 (十六) 脏值检查及语音识别集成
在项目开发过程中,需要对药店信息进行更改。如下图所示。现在的需求是:当药店信息没有发生变化时,点击“更新信息”按钮,提示“药店信息未做任何更改”。
FastCorrect:语音识别快速纠错模型丨 RTC Dev Meetup
本文将介绍一种低延迟、高精度的纠错模型 FastCorrect,通过利用编辑对齐以及多个候选结果,在取得 10% 的词错误率下降的同时,将模型加速 6-9 倍,相关研究论文已被 NeurIPS 2021 和 EMNLP 2021 收录。
马志强:语音识别技术研究进展和应用落地分享丨 RTC Dev Meetup
本文内容源自「RTC Dev Meetup 丨语音处理在实时互动领域的技术实践和应用】的演讲分享,分享讲师为寰语科技语音识别研究主管马志强。
使用 APICloud & 科大讯飞 SDK 快速实现语音识别功能
语音识别功能已经是一个很普及的功能,在特定情境下,能带给人们方便的交互的体验,比如驾驶时使用语音进行唤醒手机,各类智能音响产品,语音控制智能电视等。本文主要介绍在APICloud平台使用科大讯飞的SDK快速实现语音识别功能。
AI 语音识别 - 我给浏览器加了个语音搜索功能
语音采集功能使用QT的QAudioInput类来实现,采集声卡的PCM数据,保存起来,通过华为云的语音识别HTTP接口完成文字识别,得到文字后再通过浏览器进行搜索文字相关内容。
恒源云 (GPUSHARE)_ 语音识别与语义处理领域之低资源机器翻译综述
文章来源 | 恒源云社区 神经机器翻译效果非常好,但需要大量的平行语料,因此有了低资源翻译的研究。本文按照按数据的利用对低资源翻译分为3类详解
恒源云 (GPUSHARE)_ 字节跳动的 mRASP 预训练模型真香
本文想构建一个统一的机器翻译模型,在提供任意语言对的情况下,可以快速适应新语言。于是提出一种通用的多语言机器翻译预训练模型:mRASP(多语言随机对齐预训练)
恒源云 (GPUSHARE)_ 语音识别与语义处理领域之 [机器翻译] 21.7 mRASP2
文章来源 | 恒源云社区(一个专注 AI 行业的共享算力平台恒源智享云)