基于视频GOP的用户拷贝快速生成方法

    公开(公告)号:CN101976323B

    公开(公告)日:2012-09-05

    申请号:CN201010543679.0

    申请日:2010-11-15

    Applicant: 武汉大学

    Abstract: 本发明涉及数字内容安全保护技术领域,尤其涉及一种基于视频GOP的用户拷贝快速生成方法。本发明基于级联指纹码技术,用户拷贝生成过程包括以下步骤:依据指纹码的内码序列生成母拷贝视频源文件;根据用户的外码,依次从对应的母拷贝视频源文件中提取相应的图像块组,通过对GOP图像块组的组合拼接生成用户唯一拷贝。本发明将生成用户视频拷贝的时间从编码一个视频源的时间降低到复制视频源的时间,可在短时间内快速生成大量视频拷贝,适用于面向大规模用户的音像作品的实时在线发布系统。本发明所提出算法具备良好的通用性和实用性,可适用于常用的视频编码标准,如H.264,MPEG-2,MPEG-4,AVS等。

    级联指纹码的软判决译码方法

    公开(公告)号:CN101930505A

    公开(公告)日:2010-12-29

    申请号:CN200910062831.0

    申请日:2009-06-26

    Applicant: 武汉大学

    Inventor: 胡瑞敏 任延珍

    Abstract: 本发明属于数字安全技术领域,特别涉及级联指纹码的软判决译码方法,译码过程包括以下步骤:对攻击后的指纹码进行反置乱,获得规整后的合谋指纹码,然后对其进行分段获得合谋指纹码的各个内码;在合谋指纹码的每个内码中计算各个内码码字的码字合谋度;联合所有内码码字合谋度,构建整个合谋指纹码的码字合谋矩阵;依据合谋矩阵计算每个用户的用户合谋度,根据每个用户合谋度判断用户合谋度异常的用户为合谋用户。本发明所提出技术方案通用性强,跟踪成功率高,且译码复杂度低。

    数字指纹生成和跟踪方法
    53.
    发明公开

    公开(公告)号:CN101276407A

    公开(公告)日:2008-10-01

    申请号:CN200810047646.X

    申请日:2008-05-09

    Applicant: 武汉大学

    Abstract: 本发明公开了数字指纹生成和跟踪算法,数字指纹生成方法为采用三级级联编码方式构建指纹码字,即首先采用抗合谋码作为内码构建特征指纹码,然后采用纠错码作为外码构建单元指纹码,最后串联多个单元指纹码构建联合指纹码;数字指纹跟踪方法为采用软判断跟踪方式判断用户是否参与合谋,即对用户的合谋参与度进行量化计算,根据用户的合谋参与度判断出合谋用户。本发明非常适用于嵌入容量小的数字作品的数字版权保护,同时,可推广应用于数字电视、数字广播、VOD、DVB等环境下的付费数据的保护。

    一种针对说话人识别系统的语音对抗防御方法及系统

    公开(公告)号:CN119943057A

    公开(公告)日:2025-05-06

    申请号:CN202510022873.0

    申请日:2025-01-07

    Applicant: 武汉大学

    Abstract: 本发明提供一种针对说话人识别系统的语音对抗防御方法及系统,提出一种新型的对抗净化框架SA‑Net,其关键思路是在特征层面采用“先减法后加法”策略,减法步骤通过分析说话人特征的分布,过滤掉非鲁棒特征,从而压缩对抗噪声的生存空间;加法步骤则重建完整的语音信号,使得说话人识别系统能够准确识别,而无需额外的微调或重新训练。本发明在两个开源的SRS上对于抵御自适应攻击时的平均防御准确率达到87.8%,同时保持了98.5%的正常识别准确率,分别比Parallel WaveGAN高出29.3%和2.8%。此外,本发明具有较强的防御能力和广泛的适用性,可作为各种部署中的SRS的即插即用防线。

    基于视觉Transformer的伪造语音检测方法

    公开(公告)号:CN119601041A

    公开(公告)日:2025-03-11

    申请号:CN202411302010.0

    申请日:2024-09-18

    Applicant: 武汉大学

    Abstract: 本申请涉及语音检测技术领域,特别涉及一种基于视觉Transformer的伪造语音检测方法,其中,方法包括:使用标记数据对目标预训练模型进行微调,得到自监督学习的前端特征提取器,并提取待检测语音的中间语音特征输入至预设后端分类网络,以将其切分为目标大小的多个重叠块进行随机dropout处理,以在处理后的多个重叠块上添加分类token和蒸馏token;将分类token和蒸馏token的平均值输入到Transformer编码器的分类层进行分类预测,得到待检测语音中的伪影,并根据伪影输出最终的语音检测结果。本申请在多种实际应用中可能遇到的失配场景下仍具有良好的检测性能,鲁棒性较高,具有良好的可解释性。

    基于块级别对比学习的声码器指纹识别方法、系统及设备

    公开(公告)号:CN118016101A

    公开(公告)日:2024-05-10

    申请号:CN202410094742.9

    申请日:2024-01-23

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于块级别对比学习的声码器指纹识别方法、系统及设备,基于一种新的声码器架构归因方案VFD‑Net(声码器指纹检测网络),可以在跨数据集和压缩场景中有效地跟踪伪造语音来源。本发明利用块级别的监督对比学习来捕获全局一致性的声码器指纹,这有助于将属于同一类(虚假语音类型或声码器类型)的块在表示空间中更接近,同时将来自不同类的块推得更远。本发明在跨数据集和AAC压缩场景下比现有方法提高了30%‑45%;并且在1s短时长的伪造语音测试场景下,准确率为83.67%,比现有方法提高了37.90%。此外,本发明可以通过分析声码器指纹的一致性实现对于部分伪造检测的应用。

    一种基于人类听觉反馈机制的声音活体检测方法及系统

    公开(公告)号:CN117854539A

    公开(公告)日:2024-04-09

    申请号:CN202311867810.2

    申请日:2023-12-29

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于人类听觉反馈机制的声音活体检测方法及系统,为了保护说话人验证系统免受伪造语音的欺骗,本发明首次将活体说话人在嘈杂环境下会不由自主地改变自己说话模式的Lombard效应引入声音活体检测,并提出了基于Lombard效应的声音活体检测框架Lombard‑VLD。为了改善Lombard‑VLD的鲁棒性和泛化性,本发明设计了基于参考的双输入模式和差分增强网络,以普通语音的特征为参考,对Lombard语音与普通语音之间的差异性特征进行提取和增强。本发明利用Lombard效应所导致的活体说话人发声模式的差异实现了低成本、高准确率、鲁棒性强、泛化性强的声音活体检测,可以方便地应用到各种类型的移动设备中以实现高效的说话人验证系统的反欺骗前置防护上。

    一种双通道俯角人脸融合校正GAN网络及人脸融合校正方法

    公开(公告)号:CN111291669B

    公开(公告)日:2023-08-04

    申请号:CN202010075862.6

    申请日:2020-01-22

    Applicant: 武汉大学

    Abstract: 本发明公开了一种双通道俯角人脸融合校正GAN网络及人脸融合校正方法,本发明的GAN网络利用低分辨率正脸的全局结构和高分辨率俯角脸的局部纹理重建清晰的正面人脸,提高人脸识别系统的精度。建立的GAN网络包括超分辨率重建网络、姿态校正网络、头部姿态估计模块、人脸配准模块、人脸综合模块等主要功能模块。首先通过超分辨率重建网络将低分辨率正脸提升到高分辨率俯角脸同等分辨率,接着通过姿态校正网络完成高分辨率人脸的俯视姿态校正,然后使用光流配准方法实现二者的像素级对齐,最后将估计出的头部俯视角转换为融合权重,进行角度自适应的人脸合成。本发明能够精确地重建清晰的正面人脸,为监控视频人脸识别提供了新的思路。

    一种基于掩蔽效应的AAC安全隐写算法及系统

    公开(公告)号:CN115620733A

    公开(公告)日:2023-01-17

    申请号:CN202211219447.9

    申请日:2022-09-30

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于掩蔽效应的AAC安全隐写算法及系统。人耳听觉掩蔽效应会导致一些声音强度低的音频信号被强度高的信号掩蔽,存在隐藏秘密信息的空间。因此,本发明分析了AAC编码中MDCT系数的量化过程,将其中被掩蔽的音频信号记录为可修改的位置,结合STC自适应隐写框架实现秘密信息的嵌入。实验结果表明,该算法最大嵌入容量可以达到13.61kbps,同时可以保证语音的听觉隐蔽性,并且具有较好的安全性。

    基于对抗学习的伪造人脸视频检测方法

    公开(公告)号:CN113283403B

    公开(公告)日:2021-11-02

    申请号:CN202110824499.8

    申请日:2021-07-21

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于对抗学习的伪造人脸视频检测方法。本方法采用深度卷积神经网络和递归神经网络相结合的方式,构建了一种端到端的双分支深度学习模型,使用对抗学习和度量学习的训练策略,提取具有压缩鲁棒性的特征。本方法采用对抗学习策略,将压缩视频和原始视频映射到一个具有压缩鲁棒性的编码空间中,同时采用度量学习策略,缩小成对视频的编码距离,从而提取视频帧内和帧间具有压缩鲁棒性的伪造特征。本发明对输入的压缩人脸视频进行真伪检测,输出视频的真假标签,有效克服了压缩场景下伪造人脸视频中伪造信息衰减难以检测的难题,提高了检测的准确率。

Patent Agency Ranking