声音调节方法、装置、电子设备及计算机可读介质

    公开(公告)号:CN119521076A

    公开(公告)日:2025-02-25

    申请号:CN202411424261.6

    申请日:2024-10-12

    Abstract: 本申请公开了一种声音调节方法、装置、电子设备及计算机可读介质,属于音频处理技术领域,包括:获取车内每个人员对应的目标座位;采集每个目标座位上人员的图像信息、每个目标座位区域内的语音信息,以及每个目标座位对应的发声装置播放的音频数据对应的音频类别中的至少一种;基于每个目标座位对应的参考信息,确定每个目标座位的免打扰级别,基于每个目标座位的免打扰级别,获取每个目标座位对应的预设信噪比;确定每个目标座位对应的待调整发声装置,基于每个目标座位对应的预设信噪比,调节每个目标座位对应的待调整发声装置。基于每个目标座位的免打扰级别,调节与之对应的待调整发声装置,可精细化的自动调节,兼顾车内每个人员的需求。

    音频处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119226502A

    公开(公告)日:2024-12-31

    申请号:CN202411093763.5

    申请日:2024-08-09

    Abstract: 本申请实施例公开了一种音频处理方法、装置、电子设备及存储介质。所述方法包括:获取目标音频对应的文本数据,所述文本数据为根据所述目标音频对应的文本内容中每个字符的索引,对所述文本内容进行拼接后得到的数据;将目标提示词和所述文本数据输入到预先训练好的大语言模型中,获取所述大语言模型输出的所述目标音频对应的内容划分结果,其中,所述目标提示词用于指示所述大语言模型对所述文本数据按照大意进行段落划分,并输出每个段落内容的大意纲领。通过上述方法,可以帮助用户通过大意纲领快速定位到目标音频中的特定段落内容,显著提高了用户的回顾效率。

    音频处理方法、装置、电子设备以及存储介质

    公开(公告)号:CN119170033A

    公开(公告)日:2024-12-20

    申请号:CN202411032303.1

    申请日:2024-07-30

    Abstract: 本申请公开了一种音频处理方法、装置、电子设备以及存储介质。该方法包括:获取麦克风阵列采集的目标音频数据,目标音频数据为多通道音频数据;对目标音频数据进行预处理,得到预处理音频数据,预处理音频数据适于输入预先训练的音频处理模型;通过预先训练的音频处理模型对预处理音频数据进行处理,得到至少两个方向的拾音数据,预先训练的音频处理模型包括编码网络以及分别连接于编码网络的至少两个解码网络,至少两个解码网络中不同解码网络输出的拾音数据的方向不相同。本申请实施例提供的技术方案,可以使不同方向的拾音数据的分离效果更好,降低多个方向的拾音数据发生语音混淆的概率,从而提升听觉体验。

    语音播放方法、装置、电子设备以及存储介质

    公开(公告)号:CN118314901B

    公开(公告)日:2024-08-20

    申请号:CN202410724499.4

    申请日:2024-06-05

    Abstract: 本申请公开了一种语音播放方法、装置、电子设备以及存储介质。该方法包括:对待播放语音片段进行语音识别,获得待播放语音片段对应的初始文本数据,以及初始文本数据对应的时间信息;基于初始文本数据以及时间信息,获得初始结构化信息;若检测到针对初始文本数据的修改操作,则确定初始文本数据对应的修改信息;基于修改信息对初始结构化信息中各字节对应的修改状态的标签的内容进行更新,获得目标结构化信息;根据目标结构化信息对待播放语音片段进行语音播放,进而确保修改后的文本与语音片段对齐播放,提高了语音播放的可靠性。

    语音播放方法、装置、电子设备以及存储介质

    公开(公告)号:CN118314901A

    公开(公告)日:2024-07-09

    申请号:CN202410724499.4

    申请日:2024-06-05

    Abstract: 本申请公开了一种语音播放方法、装置、电子设备以及存储介质。该方法包括:对待播放语音片段进行语音识别,获得待播放语音片段对应的初始文本数据,以及初始文本数据对应的时间信息;基于初始文本数据以及时间信息,获得初始结构化信息;若检测到针对初始文本数据的修改操作,则确定初始文本数据对应的修改信息;基于修改信息对初始结构化信息中各字节对应的修改状态的标签的内容进行更新,获得目标结构化信息;根据目标结构化信息对待播放语音片段进行语音播放,进而确保修改后的文本与语音片段对齐播放,提高了语音播放的可靠性。

    音频获取方法、装置、电子设备及存储介质

    公开(公告)号:CN117935838B

    公开(公告)日:2024-06-11

    申请号:CN202410344779.2

    申请日:2024-03-25

    Abstract: 本申请公开一种音频获取方法、装置、电子设备及存储介质。该方法包括:获取样本音频片段;基于对应的实数谱和虚数谱获取与多个通道各自对应的掩膜;基于对应的掩膜更新每个通道对应的实数谱和虚数谱,得到新的多通道实数谱和新的多通道虚数谱;将新的多通道实数谱和新的多通道虚数谱输入待训练神经网络模型的指定注意力池化层,并获取指定注意力池化层输出的与样本音频片段对应的单通道实数谱与单通道虚数谱;基于单通道实数谱与单通道虚数谱获取目标损失函数,并将目标损失函数收敛时的待训练神经网络模型作为目标神经网络模型,通过目标神经网络模型进行音频拾取。本方法提升了神经网络模型对音频片段关键通道的关注能力,提升音频拾取效果。

    语音增强方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN118155641A

    公开(公告)日:2024-06-07

    申请号:CN202410264059.5

    申请日:2024-03-08

    Abstract: 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,该方法应用于语音增强系统中的电子设备,语音增强系统还包括M个语音采集设备,该方法包括:确定M个语音采集设备中的第一语音采集设备和第二语音采集设备;根据第一语音采集设备和第二语音采集设备的位置确定用户的位置;根据第一语音采集设备的位置、第二语音采集设备的位置和用户的位置,确定用户的语音采集设备阵列;根据语音采集设备阵列中每个语音采集设备的位置,对语音采集设备阵列采集的语音信息进行多通道语音增强,得到用户的语音信号。本申请实施例中,可以通过多个语音采集设备采集用户的语音信息,进而可以进行多通道语音增强,可以提高语音增强的效果。

    状态调整方法、装置、电子设备及存储介质

    公开(公告)号:CN118141373A

    公开(公告)日:2024-06-07

    申请号:CN202410116064.1

    申请日:2024-01-26

    Abstract: 本申请公开了一种状态调整方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:在检测到用户的情绪处于异常波动的情况下,获取预设时间段内的用户体征数据,用户体征数据包括至少一种维度的身体状态数据;获取用户浏览指定内容的频率,指定内容表征负面情绪内容;若所述频率大于频率阈值,基于用户体征数据显示对应的情绪引导信息,以降低用户的抑郁症倾向。本方法可以在检测到用户的情绪处于异常波动且用户浏览负面情绪内容的频率大于频率阈值的情况下,通过基于至少一种维度的身体状态数据向用户显示对应的情绪引导信息,以降低负面情绪内容对用户情绪的影响,从而降低用户的抑郁症倾向,进而提升抑郁症倾向的干预效果。

Patent Agency Ranking