写点什么

开发者空间实践指导:基于 3 大 PaaS 主流服务轻松实现文字转换语音

  • 2024-09-12
    海南
  • 本文字数:2387 字

    阅读完需:约 8 分钟

【摘要】 基于 CodeArts API 设计语音合成接口,基于 API Explorer 调试接口,并利用 CodeArts IDE 实现数据流转换为音频

案例简介

开发者将在云主机中,基于 CodeArts API 设计语音合成接口,基于 API Explorer 调试接口,并利用 CodeArts IDE 实现数据流转换为音频。在此过程中,开发者可体验 API 设计、开发、调试等全生命周期,对华为云产品 API 体系及 API 开放能力有全面了解,并最终完成应用创建,全程实践约 15 分钟。

配置开发者空间

华为云为全球开发者打造专属开发者空间,汇聚了华为优质开发资源及工具,让每一位开发者拥有一台云主机。

在华为开发者空间,每位开发者每年可享有数百小时的云主机使用时长,5GB 的云存储空间和场景化沙箱资源,以及海量的技术赋能课程与专业开发者认证内容。

点此领取:https://auth.huaweicloud.com/authui/login.html?service=https%3A%2F%2Fdeveloper.huaweicloud.com%2Fspace%2Flogin-forword.html%3FforwardUrl%3Dhttps%253A%252F%252Fdeveloper.huaweicloud.com%252Fspace%252Fhome%26module%3Dhuaweideveloper&locale=zh-cn#/login

1.进入开发者空间,点击“云主机(beta 体验)”


2.点击“添加云主机”


3.点击“立即进入”


4.点击“下一步”


5.继续点击“下一步”


6.点击“进入桌面”


7.等待机器准备进度条加载完成至 100%,预计等待 1 分钟,然后点击“打开云桌面”即可使用



通过 CodeArts API 设计语音合成接口

3.1     进入 CodeArts API 官网,打开左边工具栏-Firefox 网络浏览器,输入网页版体验地址并登录

https://developer.huaweicloud.com/develop/codeartsapi.html


3.2     创建项目

3.2.1    登录后点击页面右上角的“创建项目”按钮




3.2.2    在创建项目弹窗中输入项目名称:语音合成,并点击保存


3.2.3    提示保存成功,点击 API 设计页签,进入到 API 设计页面


3.3     设计接口

3.3.1    点击页面上的“新建 API 接口”卡片


3.3.2    显示新建标签页


3.3.3    输入接口的 URL:/tts


3.3.4    输入接口名称:语音合成


3.3.5    下拉滚动条到请求参数区域,点击请求体“Body”页签,选择“raw”,默认选择“JSON”格式。


3.3.6    显示请求体的数据结构模板,默认根节点类型为“object”


3.3.7    点击根节点最右侧的“+”操作


3.3.8    页面上在根节点下新增一条参数(可以通过滚动条左右拖动)


3.3.9    将参数名 param2 修改为 text,描述 param2 修改为待合成的文本


3.3.10 下拉页面,看到返回响应区域


3.3.11 同样点击根节点最右侧的“+”操作(可以通过滚动条拖动到最右侧),在根节点下显示一条新的参数


3.3.12 将参数名 param2 修改为 result,将描述修改为合成结果


3.3.13 点击右上角的保存按钮


3.3.14 保存成功,设计完成


通过 API Explorer 调试语音合成接口,生成 5 段数据流

4.1     语音合成(API Explorer 部分):

链接:https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

4.1.1    生成语音格式为 wav,采样率:8000,标准女音,语速 0,音色 0


图 1.1.1 wav 标准女音

4.1.2    生成语音格式为 wav,采样率:16000,标准男声,语速 0,音色 0


图 1..12 wav 标准男音

4.1.3    生成语音格式为 mp3,采样率:8000,标准女音,语速 100,音色 100


图 1.1.3 mp3 标准女音

4.1.4    生成语音格式为 mp3,采样率:16000,标准男声,语速 100,音色 100


图 1.1.4 mp3 标准男声

4.1.5    生成语音格式为 pcm,采样率:16000,标准男声,语速 100,音色 100


图 1.1.5 标准男声

在开发者空间基于华为云自研 CodeArts IDE,实现数据流转换为音频的功能

5.1     实现数据流转换为音频

5.1.1    将实验用 Demo 工程上传到 CodeArts IDE

打开右侧工具栏-Firefox 网络浏览器,输入并访问 Demo 工程下载链接:

https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip


对下载好的文件进行解压(目录:主文件夹/下载),右键提取到此处


打开 CodeArts IDE,左上角点击“工程”->“打开工程”,选择刚刚解压出来的文件夹,打开:


预计等待 1 分钟左右的时间,工程模型同步成功:

5.1.2    在华为云控制台新增访问秘钥,配置 AK/SK

1)登录华为云控制台:https://console.huaweicloud.com/iam/?agencyId=599e2ee1492f48e9b69a0a682d435fb8&region=cn-north-4&locale=zh-cn#/mine/accessKey

选择“我的凭证”->“访问秘钥”->新增访问秘钥

注:如果已经有 AK/SK 秘钥,不需要新增访问秘钥


创建秘钥成功后点击“立即下载”,即可获得“credentials.csv”文件,里面可以查看到 AK(Access Key Id)和 SK(Secret Access Key)

2)进入工程,src/main/resources 下选择 credentials.properties,将 AK/SK 配置上


5.1.3    将 API Explorer 上调试成功的流数据文件配置到 APIResponse.json 中

在 2.1 语音合成章节,我们在 API Explorer 完成接口的调试

https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

最终生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件,打开 json 文件,复制响应体内容(如果响应体内容没有超出限制,直接点击右侧的复制按钮即可)


打开工程,进入 src/main/resources 中,选择 APIResponse.json,将 json 文件的内容复制到 APIResponse.json 中。


5.1.4    配置 pom.xml:

在 pom.xml 中如图所示,增加如下配置:

  <properties>

        <java.version>17</java.version>

        <maven.compiler.source>17</maven.compiler.source>

        <maven.compiler.target>17</maven.compiler.target>

  </properties>


5.1.5    执行“should_return_audio_when_response_json”,生成 mps 格式音频文件:

找到 test 目录下的测试类 SisServiceTest.java,点击找到方法“should_return_audio_when_response_json()”,点击执行测试,最后可以看到目录下生成的音频文件。


目录下生成“devkit.mps”文件,实验结束。



用户头像

还未添加个人签名 2023-04-20 加入

还未添加个人简介

评论

发布
暂无评论
开发者空间实践指导:基于3大PaaS主流服务轻松实现文字转换语音_平平无奇爱好科技_InfoQ写作社区