写点什么

语音识别与语音控制的原理介绍

作者:芯动大师
  • 2024-09-19
    四川
  • 本文字数:957 字

    阅读完需:约 3 分钟

语音识别与语音控制的原理介绍

硬件平台

机器硬件:OriginBot(导航版/视觉版)PC 主机:Windows(>=10)/Ubuntu(>=20.04)扩展硬件:X3 语音版

运行案例

首先进入 OriginBot 主控系统,运行一下指令。请注意,部分操作 OriginBot 内暂未放入,请根据内容进行适当处理。

cd /userdata/dev_ws/# 配置TogetheROS环境source /opt/tros/setup.bash
# 从tros.b的安装路径中拷贝出运行示例需要的配置文件。cp -r /opt/tros/lib/hobot_audio/config/ .
# 加载音频驱动,设备启动之后只需要加载一次bash config/audio.sh
#启动launch文件ros2 launch speech speech_recongnition_launch.py
复制代码

其中 speech_recongnition_launch.py 文件内容如下:

from launch import LaunchDescriptionfrom launch.actions import DeclareLaunchArgumentfrom launch.substitutions import LaunchConfigurationfrom launch_ros.actions import Node
def generate_launch_description():
# 启动音频采集pkgaudio_get = Node( package='hobot_audio', executable='hobot_audio', output='screen', parameters=[ {"config_path":"./config"}, {"audio_pub_topic_name": "audio_smart"} ], arguments=['--ros-args', '--log-level', 'error'] )
return LaunchDescription([ audio_get])
复制代码

​ 此时出现如下报错是因为没有语音唤醒,说出“地平线你好”后,即可唤醒



​ 当人依次在麦克风旁边说出“地平线你好”、“向左转”、“向右转”、“向前走”、“向后退”命令词,语音算法 sdk 经过智能处理后输出识别结果,log 显示如下



​ 识别到语音命令词“向前走”、“向左转”、“向右转”、“向后退”,并且输出 DOA 的角度信息,如recv hrsc sdk doa data: 110字段表示 DOA 角度为 110 度。

语音控制

SSH 连接 OriginBot 成功后,配置智能语音模块:

#从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。cp -r /opt/tros/lib/hobot_audio/config/ .
#加载音频驱动,设备启动之后只需要加载一次bash config/audio.sh
复制代码

启动机器人底盘在终端中输入如下指令,启动机器人底盘:

ros2 launch originbot_bringup originbot.launch.py
复制代码

启动语音控制以下是口令控制功能的指令:

ros2 launch audio_control audio_control.launch.py
复制代码

此时即可看到小车运动的效果了

发布于: 刚刚阅读数: 3
用户头像

芯动大师

关注

凡事预则立,不预则废! 2022-06-01 加入

某公司芯片AE工程师,嵌入式开发工程师,InfoQ签约作者,阿里云专家博主,华为云·云享专家,51CTO专家博主,腾讯云社区优秀共创官。

评论

发布
暂无评论
语音识别与语音控制的原理介绍_语音控制_芯动大师_InfoQ写作社区