基于软对比伪学习的开放世界伪造语音归因方法及系统

    公开(公告)号:CN118298809B

    公开(公告)日:2024-10-18

    申请号:CN202410428635.5

    申请日:2024-04-10

    Abstract: 本发明公开了一种基于软对比伪学习的开放世界伪造语音归因方法及系统,方法包括:将语音样本的时频特征输入训练好的伪造语音归因模型,输出语音样本的时频特征属于已知语音伪造方法和未知语音伪造方法中的各个类别的概率,作为伪造语音归因的识别结果;伪造语音归因模型包括:特征提取模块和特征分类模块;特征提取模块用于采用深度卷积神经网络提取语音样本的深层特征和浅层特征,将获得的所述语音样本的深层特征输出到所述特征分类模块;特征分类模块用于对语音样本的深层特征进行类别判断。本发明在不影响对已知类别数据的识别精度的同时,显著提高对未知类别和所有类别数据的聚类性能。

    基于矩阵补全的用户多域权限联合估计方法

    公开(公告)号:CN112039843B

    公开(公告)日:2024-02-02

    申请号:CN202010722804.8

    申请日:2020-07-24

    Abstract: 本发明公开了基于矩阵补全的用户多域权限联合估计方法,方法对目标网络空间中预先设定的各个域提取各个域的实体;对各个实体对应的权限类型进行枚举;根据提取的各个域的实体以及枚举出的各个实体对应的权限类型建立用户权限矩阵;通过获取不同用户在目标网络空间中的用户权限确定用户权限矩阵中的相应元素值;根据已经获取到的不同用户的部分用户权限,通过对用户权限矩阵补全,确定用户未获取的用户权限。该方法能够在不获取目标网络空间实体关系的情况下,仅通过多个用户在物理域、网络域、信息域中的部分权限分布,对未知的用户权限获取情况进行估计,大幅度减少了用户权限推断依赖的基础信息,估计的准确率能够满足(56)对比文件郭伟光.一种基于角色的跨域访问授权方法.赤峰学院学报(自然科学版).2010,(04),22-23.白玮;潘志松;夏士明;成昂轩.基于遗传算法的网络安全配置自动生成框架.计算机科学.2020,314-320.张毅;杜秀春;刘欣;刘华富.基于多域的互联网物理对象关联分析方法研究.计算机技术与发展.2017,25-30.Roberto López-Valcarce;Josep Sala-Alvarez.Low-Rank Data Matrix RecoveryWith Missing Values And FaultySensors.IEEE.2019,第27卷1-5.Kefu Yi;Jiangwen Wan;Lei Yao;TianyueBao.Partial Matrix Completion Algorithmfor Efficient Data Gathering in WirelessSensor Networks.IEEE.2014,第19卷(第1期),54-57.白玮;潘志松;夏士明;成昂轩.基于遗传算法的网络安全配置自动生成框架.计算机科学.2020,(05),314-320.李国朋;潘志松;姚清;李德毅.融合先验信息的非负矩阵分解社区发现算法.模式识别与人工智能.2016,(07),34-41.

    一种并行特征全卷积神经网络及其构建方法

    公开(公告)号:CN108596330A

    公开(公告)日:2018-09-28

    申请号:CN201810468647.5

    申请日:2018-05-16

    Abstract: 本发明公开了一种并行特征全卷积神经网络及其构建方法。所述神经网络包括卷积神经网络,并行膨胀模块,并行特征上采样模块,特征图求和模块,特征图并列模块和几个卷积层。构建方法为:移除卷积神经网络最后的分类层,设计并行膨胀模块和并行特征上采样模块提取卷积神经网络中间层特征图;特征图求和模块提取出的特征图,通过加法操作两两相加;特征图并列模块提取出的特征图直接并列输出;从上述特征图求和模块、特征图并列模块输出的特征图分别组成一个张量,通过一个对应的卷积层,然后共同输入到网络末端的卷积层,融合所有加和及并列特征,输出融合结果。本发明有较少的网络参数量,更好地利用了网络中的特征图,可以应用到图像的像素级别标注任务中。

    一种语音增强方法、装置、介质及系统

    公开(公告)号:CN118430557A

    公开(公告)日:2024-08-02

    申请号:CN202410509056.3

    申请日:2024-04-26

    Abstract: 本发明公开了一种语音增强方法、装置、介质及系统,其方法包括:获取带噪语音信号;将所述带噪语音信号输入预先训练的轻量化语音增强网络模型,得到干净语音信号;其中,所述轻量化语音增强网络模型包括:编码器模块、深度三阶段网络注意力模块和解码器模块。本发明引入三阶段注意力机制,充分挖掘语音特征的通道关系与长短时相关性,并利用深度可分离卷积膨胀卷积金字塔、局部交互通道注意力等降低增强模型的计算复杂度,能够更好地区分噪声与干净语音,并保留干净语音谐波,恢复高质量的增强语音。

    基于编解码器架构与递归神经网络的骨导语音盲增强方法

    公开(公告)号:CN108986834B

    公开(公告)日:2023-04-07

    申请号:CN201810960512.0

    申请日:2018-08-22

    Abstract: 本发明公开了一种基于编解码器架构与递归神经网络的骨导语音盲增强方法,首先提取气导和骨导语音特征,对提取的语音特征数据进行对齐预处理,然后以骨导语音特征作为训练输入,以气导语音字典组合系数作为训练目标,作为下一步骤中编码器的初始化参数;构建基于局部注意力机制的解码器模型,以编码器输出作为解码器的输入,以气导语音特征为训练目标,联合训练编解码器模型,并存储模型参数;最后提取待增强的骨导语音特征,利用上述步骤训练好的编解码神经网络实现特征转换,再对神经网络的输出进行反归一化和特征逆变换,最终得到增强后的时域语音。本发明解决高频成分的恢复、骨导无声段恢复及较强噪声背景下的恢复等问题,改善了骨导语音的增强质量。

    一种膨胀全卷积神经网络装置及其构建方法

    公开(公告)号:CN108717569B

    公开(公告)日:2022-03-22

    申请号:CN201810470228.5

    申请日:2018-05-16

    Abstract: 本发明公开了一种膨胀全卷积神经网络及其构建方法。该神经网络包括依次连接的卷积神经网络、特征提取模块、特征融合模块。构建方法如下:选取卷积神经网络:将卷积神经网络中用于分类的全连接层和分类层去除,只留下中间的卷积层和池化层,并从卷积层和池化层中提取特征图;构造特征提取模块:特征提取模块包括多个串联的膨胀上采样模块,每个膨胀上采样模块分别包括一个特征图合并层、一个膨胀卷积层和一个反卷积层;构造特征融合模块:特征融合模块包括一个密集膨胀融合卷积块、一个反卷积层。本发明有效地解决了卷积神经网络中特征提取和融合问题,可以应用到图像的像素级别标注任务中。

    一种声学事件的定位检测方法及装置

    公开(公告)号:CN115827913A

    公开(公告)日:2023-03-21

    申请号:CN202211454353.X

    申请日:2022-11-21

    Abstract: 本发明公开了一种声学事件的定位检测方法及装置,其方法:获取声学事件的多通道音频数据;将声学事件的多通道音频数据输入训练好的定位检测模型,获取估计的声源方位信息和类别信息;其中,所述定位检测模型的训练包括:选取音频数据库,从音频数据库中获取包含声源方位信息和类别信息的多通道音频数据;按照预设比例对音频数据库的多通道音频数据进行划分并生成训练集和验证集;构建声学事件的定位检测模型;所述定位检测模型由特征提取模块、卷积表示学习模块、多级注意力模块、时间卷积网络模块以及估计输出模块级联而成;使用训练集和验证集对构建的定位检测模型进行训练;本发明能够高效的对声学事件的声源方位信息和类别信息进行估计。

Patent Agency Ranking