-
公开(公告)号:CN119811354A
公开(公告)日:2025-04-11
申请号:CN202411820770.0
申请日:2024-12-11
Applicant: 新疆生产建设兵团第七师公安局 , 深圳市声扬科技有限公司 , 胡杨河市博锐启智信息科技有限公司
Abstract: 本申请公开了一种小语种训练数据的生成方法、装置、电子设备及存储介质该方法包括:获取第一语种下的待转换音频和第二语种下的文本内容;通过预训练好的声纹处理模型对待转换音频进行声纹提取和声纹转换,得到第二语种下的目标声纹;通过预训练好的语音合成模型对文本内容和目标声纹进行语音合成,得到第二语种下的目标音频;根据目标音频确定训练数据。本申请通过第一语种对应的音频和第二语种的文本内容来生成第二语种下的目标音频,以此避免了由于第二语种的使用人数少导致的训练数据难以采集的问题,增加训练数据的丰富性。
-
公开(公告)号:CN119521076A
公开(公告)日:2025-02-25
申请号:CN202411424261.6
申请日:2024-10-12
Applicant: 深圳市声扬科技有限公司
IPC: H04R3/00
Abstract: 本申请公开了一种声音调节方法、装置、电子设备及计算机可读介质,属于音频处理技术领域,包括:获取车内每个人员对应的目标座位;采集每个目标座位上人员的图像信息、每个目标座位区域内的语音信息,以及每个目标座位对应的发声装置播放的音频数据对应的音频类别中的至少一种;基于每个目标座位对应的参考信息,确定每个目标座位的免打扰级别,基于每个目标座位的免打扰级别,获取每个目标座位对应的预设信噪比;确定每个目标座位对应的待调整发声装置,基于每个目标座位对应的预设信噪比,调节每个目标座位对应的待调整发声装置。基于每个目标座位的免打扰级别,调节与之对应的待调整发声装置,可精细化的自动调节,兼顾车内每个人员的需求。
-
公开(公告)号:CN119226502A
公开(公告)日:2024-12-31
申请号:CN202411093763.5
申请日:2024-08-09
Applicant: 深圳市声扬科技有限公司
Abstract: 本申请实施例公开了一种音频处理方法、装置、电子设备及存储介质。所述方法包括:获取目标音频对应的文本数据,所述文本数据为根据所述目标音频对应的文本内容中每个字符的索引,对所述文本内容进行拼接后得到的数据;将目标提示词和所述文本数据输入到预先训练好的大语言模型中,获取所述大语言模型输出的所述目标音频对应的内容划分结果,其中,所述目标提示词用于指示所述大语言模型对所述文本数据按照大意进行段落划分,并输出每个段落内容的大意纲领。通过上述方法,可以帮助用户通过大意纲领快速定位到目标音频中的特定段落内容,显著提高了用户的回顾效率。
-
公开(公告)号:CN119170033A
公开(公告)日:2024-12-20
申请号:CN202411032303.1
申请日:2024-07-30
Applicant: 深圳市声扬科技有限公司
IPC: G10L21/0216 , G10L21/0264 , G10L21/0232 , G10L25/30
Abstract: 本申请公开了一种音频处理方法、装置、电子设备以及存储介质。该方法包括:获取麦克风阵列采集的目标音频数据,目标音频数据为多通道音频数据;对目标音频数据进行预处理,得到预处理音频数据,预处理音频数据适于输入预先训练的音频处理模型;通过预先训练的音频处理模型对预处理音频数据进行处理,得到至少两个方向的拾音数据,预先训练的音频处理模型包括编码网络以及分别连接于编码网络的至少两个解码网络,至少两个解码网络中不同解码网络输出的拾音数据的方向不相同。本申请实施例提供的技术方案,可以使不同方向的拾音数据的分离效果更好,降低多个方向的拾音数据发生语音混淆的概率,从而提升听觉体验。
-
公开(公告)号:CN118314901B
公开(公告)日:2024-08-20
申请号:CN202410724499.4
申请日:2024-06-05
Applicant: 深圳市声扬科技有限公司
Abstract: 本申请公开了一种语音播放方法、装置、电子设备以及存储介质。该方法包括:对待播放语音片段进行语音识别,获得待播放语音片段对应的初始文本数据,以及初始文本数据对应的时间信息;基于初始文本数据以及时间信息,获得初始结构化信息;若检测到针对初始文本数据的修改操作,则确定初始文本数据对应的修改信息;基于修改信息对初始结构化信息中各字节对应的修改状态的标签的内容进行更新,获得目标结构化信息;根据目标结构化信息对待播放语音片段进行语音播放,进而确保修改后的文本与语音片段对齐播放,提高了语音播放的可靠性。
-
公开(公告)号:CN118314901A
公开(公告)日:2024-07-09
申请号:CN202410724499.4
申请日:2024-06-05
Applicant: 深圳市声扬科技有限公司
Abstract: 本申请公开了一种语音播放方法、装置、电子设备以及存储介质。该方法包括:对待播放语音片段进行语音识别,获得待播放语音片段对应的初始文本数据,以及初始文本数据对应的时间信息;基于初始文本数据以及时间信息,获得初始结构化信息;若检测到针对初始文本数据的修改操作,则确定初始文本数据对应的修改信息;基于修改信息对初始结构化信息中各字节对应的修改状态的标签的内容进行更新,获得目标结构化信息;根据目标结构化信息对待播放语音片段进行语音播放,进而确保修改后的文本与语音片段对齐播放,提高了语音播放的可靠性。
-
公开(公告)号:CN117935838B
公开(公告)日:2024-06-11
申请号:CN202410344779.2
申请日:2024-03-25
Applicant: 深圳市声扬科技有限公司
IPC: G10L21/0232 , G10L21/0364 , G10L25/18 , G10L25/30 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本申请公开一种音频获取方法、装置、电子设备及存储介质。该方法包括:获取样本音频片段;基于对应的实数谱和虚数谱获取与多个通道各自对应的掩膜;基于对应的掩膜更新每个通道对应的实数谱和虚数谱,得到新的多通道实数谱和新的多通道虚数谱;将新的多通道实数谱和新的多通道虚数谱输入待训练神经网络模型的指定注意力池化层,并获取指定注意力池化层输出的与样本音频片段对应的单通道实数谱与单通道虚数谱;基于单通道实数谱与单通道虚数谱获取目标损失函数,并将目标损失函数收敛时的待训练神经网络模型作为目标神经网络模型,通过目标神经网络模型进行音频拾取。本方法提升了神经网络模型对音频片段关键通道的关注能力,提升音频拾取效果。
-
公开(公告)号:CN118155641A
公开(公告)日:2024-06-07
申请号:CN202410264059.5
申请日:2024-03-08
Applicant: 深圳市声扬科技有限公司
IPC: G10L21/02 , G10L21/0216 , G10L21/0272 , G10L21/0308 , G10L17/00
Abstract: 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,该方法应用于语音增强系统中的电子设备,语音增强系统还包括M个语音采集设备,该方法包括:确定M个语音采集设备中的第一语音采集设备和第二语音采集设备;根据第一语音采集设备和第二语音采集设备的位置确定用户的位置;根据第一语音采集设备的位置、第二语音采集设备的位置和用户的位置,确定用户的语音采集设备阵列;根据语音采集设备阵列中每个语音采集设备的位置,对语音采集设备阵列采集的语音信息进行多通道语音增强,得到用户的语音信号。本申请实施例中,可以通过多个语音采集设备采集用户的语音信息,进而可以进行多通道语音增强,可以提高语音增强的效果。
-
公开(公告)号:CN118141373A
公开(公告)日:2024-06-07
申请号:CN202410116064.1
申请日:2024-01-26
Applicant: 深圳市声扬科技有限公司
Abstract: 本申请公开了一种状态调整方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:在检测到用户的情绪处于异常波动的情况下,获取预设时间段内的用户体征数据,用户体征数据包括至少一种维度的身体状态数据;获取用户浏览指定内容的频率,指定内容表征负面情绪内容;若所述频率大于频率阈值,基于用户体征数据显示对应的情绪引导信息,以降低用户的抑郁症倾向。本方法可以在检测到用户的情绪处于异常波动且用户浏览负面情绪内容的频率大于频率阈值的情况下,通过基于至少一种维度的身体状态数据向用户显示对应的情绪引导信息,以降低负面情绪内容对用户情绪的影响,从而降低用户的抑郁症倾向,进而提升抑郁症倾向的干预效果。
-
公开(公告)号:CN117975970A
公开(公告)日:2024-05-03
申请号:CN202410163993.8
申请日:2024-02-05
Applicant: 新疆生产建设兵团第七师公安局 , 深圳市声扬科技有限公司 , 胡杨河市博锐启智信息科技有限公司
Abstract: 本申请公开了一种录音质量检测方法、装置、设备及计算机可读取存储介质,该录音质量检测方法包括:根据待鉴定录音样本与预设声纹鉴定模型,确定待鉴定录音样本中的用户是否为目标待鉴定用户;若待鉴定录音样本对应的用户为目标待鉴定用户,则根据待鉴定录音样本与预设相似度检测模型,以确定待鉴定录音样本与预设鉴定标本之间的相似度;根据相似度,确定待鉴定录音样本的质量。由此,在确定待鉴定录音样本中的用户为目标待鉴定用户的情况下,通过预设相似度检测模型确定的相似度来进一步判断待鉴定录音样本的质量,以提高确定待鉴定录音样本质量的准确性,后续根据待鉴定录音样本的质量确定是否进行重新录制,从而提高后续声纹鉴定结果的准确性。
-
-
-
-
-
-
-
-
-