-
公开(公告)号:CN115762519A
公开(公告)日:2023-03-07
申请号:CN202211339220.8
申请日:2022-10-28
Applicant: 歌尔科技有限公司
IPC: G10L15/25
Abstract: 本发明属于语音识别技术领域,公开了一种语音识别方法、装置、设备及存储介质。该方法包括:获取多个方位上的定位摄像模块反馈的唇语采集图像;根据各唇语采集图像确定目标唇语和用户唇部坐标;根据用户唇部坐标确定语音拾取阵列的语音拾取方向;获取语音拾取阵列根据所述语音拾取方向反馈的采集语音;根据目标唇语识别所述采集语音的语音内容。通过上述方式,根据多个方位上的定位摄像反馈的唇语采集图像确定目标唇语和用户唇部坐标,基于用户唇部坐标确定语音拾取方向,实现了采集语音的定向拾取,并基于目标唇语识别采集语音的语音内容,融合多种模态下的内容降低环境中噪声的干扰,实现了纯净信号的还原,提高了语音听感和语音识别的准确率。
-
公开(公告)号:CN117092639A
公开(公告)日:2023-11-21
申请号:CN202311080711.X
申请日:2023-08-25
Applicant: 歌尔科技有限公司
Abstract: 本申请公开了一种避障方法、避障系统、头戴设备及存储介质,所属技术领域为智能穿戴设备领域。所述避障方法应用于设置有4D成像雷达的头戴设备,避障方法包括:按照导航路线输出导航信息;利用4D成像雷达采集环境点云图像,并从环境点云图像中识别障碍物;判断障碍物是否处于运动状态;若是,则确定障碍物的预期位置变化序列,并根据用户的当前位置和预期位置变化序列重新规划导航路线。本申请能够辅助用户躲避运动中的障碍物,降低导航路线的更新频率。
-
公开(公告)号:CN119109793A
公开(公告)日:2024-12-10
申请号:CN202310692489.2
申请日:2023-06-09
Applicant: 歌尔科技有限公司
Abstract: 本发明涉及智能设备技术领域,公开了一种音频算法参数调整方法、装置、设备及存储介质,所述方法包括:在检测到与待调整音频参数设备通信成功时,获取所述待调整音频参数设备使用的算法拓扑链路信息;根据所述算法拓扑链路信息确定所述待调整音频参数设备使用的音效算法模块的算法参数;对所述音效算法模块的算法参数进行调整;通过上述方式,在检测到与待调整音频参数设备通信成功时,根据待调整音频参数设备使用的算法拓扑链路信息确定相对应的音效算法模块的算法参数,然后对音效算法模块的算法参数进行调整,从而能够实现对算法参数的实时动态调整,以及动态适配不同的智能设备,进而使得智能设备在音效调优的选择上更加灵活。
-
公开(公告)号:CN117156375A
公开(公告)日:2023-12-01
申请号:CN202311056489.X
申请日:2023-08-21
Applicant: 歌尔科技有限公司
IPC: H04S7/00
Abstract: 本发明涉及智能穿戴技术领域,尤其涉及一种智能穿戴设备的音频优化方法、装置、设备及存储介质,本发明通过获取行车数据和头动数据,并根据行车数据对头动数据进行数值补偿,得到补偿后的目标头动数据,在基于补偿后的目标头动数据进行计算,得到头部姿态解,从而减少行车过程对于自主头动的影响,最后通过对头部姿态解进行声场计算,进而实现声场头动优化,实现音频和自主头动的跟踪,避免了现有技术乘车场景下智能穿戴设备音频播放效果不佳的技术问题,提高音频播放效果。
-
-
-