Patent search ap:("武汉大学") AND inv:"任延珍" Page 4

31.

发明授权
一种基于宏块复杂度的自适应视频运动矢量隐写方法有权

公开(公告)号：CN105704489B

公开(公告)日：2019-01-04

申请号：CN201610066448.2

申请日：2016-01-30

Applicant: 武汉大学

Inventor： 王丽娜 , 徐一波 , 翟黎明 , 任延珍 , 谭选择

IPC: H04N19/122 , H04N19/176 , H04N19/467 , H04N21/2347

Abstract: 本发明公开一种基于自适应宏块复杂度的视频运动矢量隐写方法，本方法利用视频运动矢量进行信息隐藏，其嵌入过程包含一次解压缩和两次压缩过程：首先，对于给定的一段载体视频，解压缩为无压缩的YUV视频；然后，进行第一次模拟压缩过程，记录每个宏块复杂度，获取视频序列复杂度分布数据；最后，依据复杂度分布与所要嵌入的秘密信息数量选择复杂度阈值，并进行第二次压缩，嵌入秘密信息时使用加减1匹配嵌入；本方法利用低复杂度宏块较高的局部最优概率，以及加减1匹配嵌入对相邻相关性的保持特性；嵌入算法生成的含密视频具有比特率低、画面质量高、嵌入速度快、反检测能力强等优点。

32.

发明授权
一种面向AAC数字音频的通用隐写分析方法失效

公开(公告)号：CN105118512B

公开(公告)日：2018-11-13

申请号：CN201510437226.2

申请日：2015-07-23

Applicant: 武汉大学

Inventor： 任延珍 , 熊浩 , 王丽娜

IPC: G10L19/018 , G10L25/27

Abstract: 本发明公开了一种面向AAC数字音频的通用隐写分析方法，本发明采用Markov转移概率和累积邻接密度作为相关性评价标准从帧间和帧内提取相关性子特征，根据AAC编码特性对子特征进行融合，采用随机森林分类器对AAC样本进行二分类。本发明针对不同隐写算法的stego样本统一训练分类模型，实现了面向AAC的通用隐写分析。

33.

发明公开
基于基音延迟子帧组组内差值Markov转移概率特征的AMR基音延迟隐写分析方法无效

公开(公告)号：CN107564536A

公开(公告)日：2018-01-09

申请号：CN201710797602.8

申请日：2017-09-06

Applicant: 武汉大学

Inventor： 任延珍 , 杨婧 , 王丽娜

IPC: G10L19/00 , G10L19/008 , G10L19/018

Abstract: 本发明公开了基于基音延迟子帧组组内差值Markov转移概率特征的AMR基音延迟隐写分析方法。该方法针对语音编码中两种修改基音延迟的隐写算法，提出基于基音延迟子帧组组内差值Markov转移概率的AMR隐写分析特征，采用支持向量机进行分类预测，实现了面向AMR基音延迟的隐写分析方法。本发明的优势在于，针对已有的面向基音延迟的两种隐写方法，在相对嵌入率为50％时，检测率能达到95％以上。

34.

发明公开
一种面向MP3数字音频文件的重压缩检测方法失效

公开(公告)号：CN104123935A

公开(公告)日：2014-10-29

申请号：CN201410338396.0

申请日：2014-07-16

Applicant: 武汉大学

Inventor： 任延珍 , 范梦迪 , 高雄智 , 吴兴超 , 赵思寒

IPC: G10L15/10 , G06F17/30

Abstract: 本发明公开了一种面向MP3数字音频文件的重压缩检测方法，采用模式分类技术进行MP3数字音频文件特征的提取，采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测。本发明提出基于校准的重压缩检测方法，利用原始音频与校准音频的平均每帧量化MDCT系数等于0~9值的个数的差值作为特征进行检测，实验结果表明，能够在很大程度上解决同比特率重压缩以及从高到低比特率重压缩检测的难题。不仅能够鉴别数字音频文件是否被压缩过，还能较准确地判定其原始压缩码率。从而为音频篡改检测提供依据。

35.

发明公开
一种基于差异能量的监控视频对象删除篡改检测算法失效

公开(公告)号：CN103391441A

公开(公告)日：2013-11-13

申请号：CN201310311135.5

申请日：2013-07-23

Applicant: 武汉大学

Inventor： 任延珍 , 杨婧 , 汪肇翔 , 崔晓煜 , 何梓健

IPC: H04N7/26 , G06T7/00

Abstract: 本发明公开了一种基于差异能量的监控视频对象删除篡改检测算法，包括以下步骤：步骤1：导入待测视频序列；步骤2：对待测视频序列的每个视频帧灰度图进行中值滤波处理，得到待测视频灰度图序列；步骤3：对待测视频灰度图序列进行最匹配块标记，得到每个视频帧灰度图对应的最匹配块标记图；步骤4：对最匹配块标记图进行相邻帧过滤处理；步骤5：对相邻帧过滤处理后的最匹配块标记图进行形态学滤波，判断有无篡改，有则标记篡改位置，得到检测结果。本发明排除了视频压缩带来的噪声及帧间相似性对检测结果的影响，保证结果的准确性；同时，本发明所提出算法具备良好的通用性和实用性，可使用于不同码率、不同分辨率的监控视频。

36.

发明公开
一种针对MSU的隐写分析方法失效

公开(公告)号：CN102843576A

公开(公告)日：2012-12-26

申请号：CN201210260731.0

申请日：2012-07-25

Applicant: 武汉大学

Inventor： 任延珍 , 王旻杰 , 赵砚彬 , 王丽娜 , 蔡婷婷 , 郭伟

IPC: H04N17/02

Abstract: 本发明涉及隐写分析技术领域，尤其涉及一种针对MSU的隐写分析方法。本发明算法包括以下步骤：下采样帧间合谋获取原始视频近似估计帧；对视频宏块运动检测分类的弃块处理后进行棋盘格模式探测；计算视频YU分量模式探测率差值进行动态阈值隐写判定。本发明算法以合谋帧取代相邻帧，提高了估计帧的准确性，从而提高了检测算法的正确率。同时，在该算法中，分别提出基于下采样块匹配帧间合谋算法、基于运动状态检测的弃块技术、以及基于YU分量模式探测的动态阈值隐写判定技术等，从多个方面提升了隐写算法的检测正确率，尤其对存在大量非刚体运动区域视频的检测性能提升更为明显。

37.

发明公开
一种基于面部关键点的伪造说话人脸检测方法及系统审中-公开

公开(公告)号：CN119964215A

公开(公告)日：2025-05-09

申请号：CN202510022868.X

申请日：2025-01-07

Applicant: 武汉大学

Inventor： 任延珍 , 彭荔 , 黄逸焕

IPC: G06V40/16 , G06V40/40 , G06V40/20 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/08

Abstract: 本发明提供一种基于面部关键点的伪造说话人脸检测方法及系统，通过对说话行为所带来的肌肉运动以及深度伪造说话人脸视频生成过程带来的伪造线索的深入分析，设计了面部关键点连接网络，以图注意力网络为主干网络，在保留面部拓扑结构的基础上，实现了对面部真伪特征的提取；同时考虑到长短时特征在视频伪造检测的重要性，通过在图网络中建立时序连接实现短时特征建模，通过循环神经网络实现长时特征建模。本发明的优势在于能提供准确且鲁棒的伪造说话人脸检测。

38.

发明公开
面向具有高质量因子和大尺寸图像的鲁棒隐写方法及装置审中-实审

公开(公告)号：CN119232850A

公开(公告)日：2024-12-31

申请号：CN202411359395.4

申请日：2024-09-27

Applicant: 武汉大学

Inventor： 任延珍 , 栾志恒 , 梁雪闻

IPC: H04N1/32

Abstract: 本申请涉及数字媒体处理技术领域，特别涉及一种面向具有高质量因子和大尺寸图像的鲁棒隐写方法及装置，其中，方法包括：对载体图像进行解码，得到载体图像的第一空域像素值，基于目标网络平台的信道特性，对载体图像对应的空域图像进行预缩放处理，并获取离散余弦变换DCT系数；将目标秘密信息嵌入到DCT系数，得到初始载密DCT系数，调整其的不稳定系数，得到最终载密DCT系数；将最终载密DCT系数变换到空间域得到第二空域像素值，并根据第二空域像素值对第一空域像素值进行修改，直至修改后的第一空域像素值对应的空域图像满足第一预设缩放条件，对修改后的第一空域像素值对应的空域图像进行压缩，生成满足预设尺寸的最终载密图像。

39.

发明公开
一种基于分组特征校准的声音事件检测方法及系统审中-实审

公开(公告)号：CN116778919A

公开(公告)日：2023-09-19

申请号：CN202310672434.5

申请日：2023-06-07

Applicant: 武汉大学

Inventor： 任延珍 , 刘晨雨 , 刘武洋

IPC: G10L15/16 , G10L25/18 , G10L25/30 , G10L25/51

Abstract: 本发明提供一种基于分组特征校准的声音事件检测方法及系统，包括：获取待检测声音事件的音频特征数据；将音频特征数据输入时频学习网络，通过卷积神经网络获取时频谱图，基于多个维度对时频谱图的中间表征进行分组特征学习得到分组强化特征，对分组强化特征进行任务感知激活得到自适应特征；将自适应特征输入上下文建模网络，获取音频信号时域相关性特征，对音频信号时域相关性特征进行分类，得到声音事件类别检测结果。本发明根据声音事件检测任务中不同类型音频的时频特性引入分组特征校准模块，增强了声音事件检测网络对各类音频的特征表示能力，参数量小且通用性强，以较小的计算代价引入现有的主流声音事件检测模型中并提升其性能。

40.

发明公开
一种语音转换说话人溯源方法及装置审中-实审

公开(公告)号：CN116665687A

公开(公告)日：2023-08-29

申请号：CN202310236391.6

申请日：2023-03-10

Applicant: 武汉大学

Inventor： 任延珍 , 朱洪承 , 翟黎明 , 孙宗锟 , 沈茹冰 , 王丽娜

IPC: G10L21/013 , G10L25/18 , G10L25/30

Abstract: 本发明公开了一种语音转换说话人溯源方法及装置。针对语音转换技术在实际应用过程中滥用时难以主动追溯源说话人身份的问题，本发明设计了一个基于异步VAE‑Glow的追溯方法，既能在语音转换过程中并行隐藏源说话人身份，又能从压缩的转换语音中准确地恢复隐藏的源说话人身份甚至原始语音。本方法可与任意的语音转换框架集成并用于各类社交媒体和语音通话应用中，在不影响转换语音质量的前提下实现说话人身份的隐藏和溯源，在面临大范围比特率(16～128kbps)的主流音频和语音压缩标准(如AAC、MP3、Opus和SILK)时仅凭0.74s的语音就能实现接近100％的溯源准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification