-
公开(公告)号:CN114080641B
公开(公告)日:2024-11-01
申请号:CN202080051540.6
申请日:2020-06-09
Applicant: 星电株式会社
Abstract: 麦克风单元(1)具备:声音数据获取部(11),获取声音作为声音数据;声音数据注册部(12),注册从声音数据提取了特征点的对照用声音数据;评价用声音数据获取部(13),获取输入到第一麦克风(10)的声音作为评价用声音数据;对照部(14),基于对照用声音数据和从评价用声音数据提取的特征点,进行基于评价用声音数据的声音的发声者是否是基于对照用声音数据的声音的发声者的对照;对照结果输出部(15),输出对照部(14)的对照结果。
-
公开(公告)号:CN113920560B
公开(公告)日:2024-10-25
申请号:CN202111092312.6
申请日:2021-09-17
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开一种多模态说话人身份识别方法、装置和设备,该方法包括:获取会话场景的视频数据和音频数据;对所述视频数据进行人脸检测和唇形检测,得到参会人的子视频数据和所述子视频数据中的人脸框数据和唇形框序列;根据所述参会人的所述唇形框序列和所述音频数据,确定所有参会人中的说话人和所述说话人对应的音频数据;根据所述说话人的所述人脸框数据提取所述说话人的视觉特征,并根据所述说话人对应的音频数据提取所述说话人的音频特征;根据所述视觉特征和所述音频特征对所述说话人进行身份识别。本申请能够在复杂多样的会话场景下提高说话人身份识别的准确性。
-
公开(公告)号:CN112735426B
公开(公告)日:2024-10-22
申请号:CN202011551178.7
申请日:2020-12-24
Applicant: 深圳市声扬科技有限公司
Inventor: 陈东鹏
Abstract: 本申请涉及一种语音验证方法及系统、计算机设备和存储介质。所述方法包括:语音验证终端向外界环境发射声波,所述声波包含根据预设规则变化的第一音频信号,所述预设规则使得所述第一音频信号在不同的时刻不相同;在所述声波发射的状态下通过第一采集器采集第一语音数据,所述第一采集器安装在能够接收并采集所述声波的位置;若所述第一语音数据中包含与第一语音数据采集的时刻对应的第一音频信号,则去除所述第一语音数据中的第一音频信号,得到第二语音数据;提取所述第二语音数据的声纹特征;若所述声纹特征与预设声纹特征相匹配,则语音验证通过。本申请能够防御录音回放攻击,提高了语音验证的安全性。
-
公开(公告)号:CN113160854B
公开(公告)日:2024-10-18
申请号:CN202010085433.7
申请日:2020-01-22
Applicant: 阿里巴巴集团控股有限公司
IPC: G10L25/87 , G10L25/30 , G10L21/0208 , G10L15/02 , G10L15/06 , G10L15/16 , G10L15/18 , G10L15/22 , G10L15/30 , G10L17/00
Abstract: 本申请公开了语音交互系统、相关方法、装置及设备。其中,所示系统通过智能音箱采集用户语音数据;若用户语音静默时长大于第一时长阈值,则向服务端发送针对所述语音数据的句尾检测请求;服务端通过句尾检测模型包括的第一声学特征确定子网络,根据语音数据的声学特征信息,确定后续语音的声学特征信息;以及,通过句尾检测模型包括的语义特征确定子网络,根据语音数据的文本序列,确定后续语音的语义特征信息;通过句尾检测模型包括的句尾预测子网络,根据后续语音的声学特征信息和语义特征信息,确定语音数据是否包括句尾信息;若检测到句尾信息,则智能音箱关闭传声器。采用这种处理方式,可以有效提升智能音箱闭麦时机的准确度。
-
公开(公告)号:CN115242472B
公开(公告)日:2024-10-08
申请号:CN202210804951.9
申请日:2022-07-08
Applicant: 北京新唐思创教育科技有限公司
Inventor: 赵子龙
Abstract: 本公开涉及一种身份验证方法、装置、设备及介质,应用于三维虚拟课堂场景中,其中,该方法包括:获取针对用户账号的身份验证请求;基于身份验证请求采集第一语音信息;基于第一语音信息对用户账号进行身份验证。本公开能够针对三维虚拟课堂场景提升身份验证的快捷有效性。
-
公开(公告)号:CN113450477B
公开(公告)日:2024-09-06
申请号:CN202110649356.8
申请日:2021-06-10
Applicant: 北京声智科技有限公司
Abstract: 本申请提供了一种智能背包、智能背包的控制方法及存储介质,该智能背包,包括背包本体,以及设置在背包本体上的控制装置,控制装置包括中央控制器、压力传感器、语音采集器和背包锁;压力传感器用于采集压力信号;语音采集器用于采集用户语音信号;中央控制器用于根据压力信号和用户语音信号,控制背包锁打开和关闭,有效提高背包安全性,以及提高解锁的方便性。
-
公开(公告)号:CN112447178B
公开(公告)日:2024-08-06
申请号:CN201910800717.7
申请日:2019-08-28
Applicant: 北京声智科技有限公司
IPC: G10L17/00 , G06F16/2455 , H04M3/51
Abstract: 本发明提供了一种声纹检索方法、装置及电子设备,获取用户的声音信息,确定与所述声音信息对应的目标声纹信息,查找与所述目标声纹信息对应的账号信息,以依据所述账号信息进行信息推荐。由于目标声纹信息为多个,则得到的账户信息也是多个账户的账户信息,进而可以根据多个账号信息进行更精准的信息推荐,能够推荐更符合用户需求的信息。
-
公开(公告)号:CN111145903B
公开(公告)日:2024-08-06
申请号:CN201911312648.1
申请日:2019-12-18
Applicant: 东北大学
Abstract: 本发明公开了一种获取眩晕症问诊文本的方法、装置、电子设备及问诊系统,一种获取问诊文本的方法,包括:实时采集医生针对眩晕症所提出的问题以及患者针对所述问题的应答;将所述问题和所述应答转换为问诊文本;存储所述问诊文本和/或发送所述问诊文本至预设文本分析单元;其中,所述问题和应答为语音信号。以解决自动抽取医患历史对话中患者的病症信息,缺少医生和患者的实时互动,以及问诊内容的获得都是设计好问题和答案供患者选择,限制了患者的表述,而某些患者对文字进行阅读理解和书写有困难,容易丢失问诊信息,影响诊断的问题。
-
公开(公告)号:CN112216306B
公开(公告)日:2024-08-02
申请号:CN202011026883.5
申请日:2020-09-25
Applicant: 广东电网有限责任公司佛山供电局 , 广东电力信息科技有限公司
Abstract: 本申请公开了一种基于声纹的通话管理方法、装置、电子设备以及存储介质。该方法包括:获取接入会议的语音信号,所述语音信号包括至少两个来自不同与会终端的子语音信号,检测所述语音信号的语音状态,若所述语音信号的语音状态为异常状态,基于所述语音信号的语音特征,确定导致所述异常状态的异常子语音信号,向所述异常子语音信号对应的目标与会终端发送提示信息。该方法可以提高确定导致异常状态的异常子语音信号的准确性,提高确定异常子语音信号的速度,保证会议正常进行,以及简化会议室现场人员的操作流程。
-
公开(公告)号:CN113053391B
公开(公告)日:2024-07-26
申请号:CN202110309045.7
申请日:2018-01-10
Applicant: 谷歌有限责任公司
Abstract: 本申请涉及一种话音查询处理服务器及通过该话音查询处理服务器来抑制话音查询的方法。该方法在指定的时间间隔期间接收多个包括音频数据的话音查询处理请求。作为响应,处理所述音频数据以生成声学指纹;并且通过确定所生成的声学指纹之间的匹配,标识一组话音查询处理请求,其中所述一组话音查询处理请求的每个参考共同话音查询,然后可以抑制执行所述共同话音查询所指示的操作。
-
-
-
-
-
-
-
-
-