Patent search ap:("国家计算机网络与信息安全管理中心" OR "杭州东信北邮信息技术有限公司") AND inv:"孙旭东" Page 4

31.

发明公开
一种基于信道补偿的声纹识别方法及系统无效

公开(公告)号：CN111785281A

公开(公告)日：2020-10-16

申请号：CN202010554305.2

申请日：2020-06-17

Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司

Inventor： 沈亮 , 万辛 , 李鹏 , 倪江帆 , 高圣翔 , 冯象雷 , 孙旭东 , 占建波 , 宁珊 , 孙晓晨

IPC: G10L17/02 , G10L17/04 , G10L17/06 , G10L17/18 , G10L21/0208

Abstract: 本发明公开了一种基于信道补偿的声纹识别方法及系统，该方法包括如下步骤：步骤SS1：初始化去噪网络G和判别网络D；步骤SS2：输入噪声音频到去噪网络G，生成fake音频，将所述fake音频和真实的干净音频送入到判别网络D进行训练，更新判别网络D的网络参数，得到新一代判别网络D1；步骤SS3：冻结判别网络D1的参数，在去噪网络G中输入噪声音频，同时将对应的判别标签设为True，来欺骗判别网络D1；步骤SS4：重复步骤SS2至步骤SS3，直至判别网络D收敛，转入步骤SS5；步骤SS5：去噪网络G输出增强音频信号。本发明对于声纹识别大幅提高了整体准确率。

32.

发明公开
一种音视频片段分类方法及装置有权

公开(公告)号：CN111625661A

公开(公告)日：2020-09-04

申请号：CN202010408234.5

申请日：2020-05-14

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 孙旭东 , 张震 , 林格平 , 刘铭 , 刘发强 , 倪善金

IPC: G06F16/45 , G06F16/483 , H04N21/845 , G06N3/04 , G06N3/08

Abstract: 本发明实施例公开了一种音视频片段分类方法及装置，所述方法包括：基于待分类音视频片段的视频帧序列提取目标视频帧，基于待分类音视频片段的音频帧序列提取目标音频帧；基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段；基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征；通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率，提高音视频分类的鲁棒性和准确率。

33.

发明公开
一种识别呼叫方属性的方法及装置失效

公开(公告)号：CN110708418A

公开(公告)日：2020-01-17

申请号：CN201910848492.2

申请日：2019-09-09

Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学

Inventor： 林格平 , 戚梦苑 , 沈亮 , 李娅强 , 刘发强 , 孙旭东 , 孙晓晨 , 宁珊 , 蔡文强 , 王玉龙

IPC: H04M1/725 , H04M1/57 , G10L25/54 , G10L25/03

Abstract: 本发明公开了一种识别呼叫方属性的方法及装置，涉及通信技术领域，包括：接收到第二设备的通话请求后，与所述第二设备建立通话连接；获取所述第二设备发送的语音数据；提取所述语音数据的噪声特征，作为待处理噪声特征；所述噪声特征包括以下任意一项或多项：期望、熵和超熵；在预先建立的噪声特征与属性标签的对应关系中，查找所述待处理噪声特征对应的属性标签，作为所述第二设备的第一属性。本发明通过噪声特征来识别呼叫方的属性，相比于现有技术提升了识别准确性。

34.

发明公开
基于注意力机制的通话人识别方法及装置失效

公开(公告)号：CN110556114A

公开(公告)日：2019-12-10

申请号：CN201910684343.7

申请日：2019-07-26

Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学

Inventor： 林格平 , 戚梦苑 , 沈亮 , 李娅强 , 刘发强 , 孙旭东 , 孙晓晨 , 宁珊 , 蔡文强 , 王玉龙

IPC: G10L17/18 , G10L17/04 , H04M1/656 , H04M1/725

Abstract: 本发明公开了一种基于注意力机制的说话人识别方法及装置，包括如下步骤：采集多个被测试通话人的通话录音和测试通话人的通话录音；根据所述被测试通话人对应的通话录音，建立通话人语音库；采用基于注意力的神经网络对所述被测试通话人语音进行训练，获得训练模型；存储所述测试通话人的通话录音，获得录音文件；将所述录音文件采用所述训练模型识别所述被测试通话人是否目标通话人。通过采用基于注意力的神经网络对所述被测试通话人语音进行训练，获得训练模型，采用训练模型识别所述被测试通话人，确认了拨号码对应的主人的一致性，避免了由于通话人身份被仿冒带来的通信安全隐患，进一步提高了通话过程中的信息的安全性。

35.

发明公开
通信线路特征提取方法、通信线路识别方法及装置失效

公开(公告)号：CN110545359A

公开(公告)日：2019-12-06

申请号：CN201910713518.2

申请日：2019-08-02

Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学

Inventor： 林格平 , 戚梦苑 , 沈亮 , 李娅强 , 刘发强 , 孙旭东 , 孙晓晨 , 宁珊 , 胡晓慧 , 王玉龙

IPC: H04M3/22

Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述方法包括：通过运营商通信线路建立位于主叫地的主叫终端与位于被叫地的被叫终端之间的通话连接；在所述主叫终端处播放语音；在所述被叫终端处获取所述语音对应的音频；从所述音频中提取音频特征作为通信线路特征，所述通信线路特征为所述主叫地与所述被叫地之间的所述运营商通信线路的特征，从而有助于准确且高效的识别相应的运营商和来源地，进而提高用户通话的可靠性。

36.

发明授权
一种针对隧道流量的关联方法和装置有权

公开(公告)号：CN117768343B

公开(公告)日：2024-08-30

申请号：CN202311587718.0

申请日：2023-11-24

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 鲁睿 , 时磊 , 李胜男 , 党中恺 , 刘星辰 , 孙旷怡 , 贺欣 , 王红兵 , 吕东 , 李鹏霄 , 孙旭东 , 闫超阳

IPC: H04L43/02 , H04L43/062 , H04L47/70

Abstract: 本发明提供一种针对隧道流量的关联方法和装置，其中所述方法包括：获取预建立的网络隧道的多个入口节点流和多个出口节点流；确定与每个出口节点流对应的候选入口节点流，分别计算多个候选入口节点流的累计传输量距离；将每个出口节点流输入至自编码网络，输出对应的映射入口节点流，分别计算映射入口节点流和多个候选入口节点流的降噪距离；将多个候选入口节点流输入至优化表示生成器，分别输出多个候选入口节点流之间的优化表示距离；根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离，对候选入口节点流进行筛选，确定每个出口节点流对应的目标入口节点流。

37.

发明公开
伪造视频检测方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN117593679A

公开(公告)日：2024-02-23

申请号：CN202311340257.7

申请日：2023-10-16

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 孙旭东 , 杜金浩 , 刘发强 , 刘睿霖 , 熊晶 , 王立强 , 贺文晨

IPC: G06V20/40 , G06V40/16 , G06V10/764 , G06V10/25 , G06V10/82 , G06N3/084 , G06N3/0499

Abstract: 本发明提供一种伪造视频检测方法、装置、电子设备及存储介质，涉及计算机技术领域，方法包括：基于待检测视频，确定待检测视频对应的第一判别特征向量和第二判别特征向量；第一判别特征向量表示待检测视频中每帧人脸图像之间的时域特征信息；第二判别特征向量表示待检测视频中每帧人脸图像之间的频域特征信息；基于第一判别特征向量和第二判别特征向量，确定待检测视频对应的目标特征向量；目标特征向量表示融合时域特征信息和频域特征信息的特征信息；基于目标特征向量，确定待检测视频的检测结果。通过时域特征信息和频域特征信息的融合，能够准确确定待检测视频的检测结果，提升了待检测视频的检测精度。

38.

发明公开
一种语音检测方法审中-实审

公开(公告)号：CN116778910A

公开(公告)日：2023-09-19

申请号：CN202310505872.2

申请日：2023-05-06

Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张鹏远 , 张震 , 陆镜泽 , 孙旭东 , 王文超 , 刘睿霖 , 王丽 , 杜金浩 , 陈树丽 , 计哲

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/28 , G06F18/2135 , G06F18/241 , G06N3/0464 , G06N3/08

Abstract: 本申请提供了一种语音检测方法，包括：获取目标语音，将所述目标语音进行预处理，所述预处理包括预加重、分帧及加窗；确定所述预处理后目标语音的第一声道特征、第一声源波特征和多种第一相关特征；基于所述第一声道特征、第一声源波特征和多种第一相关特征确定所述第一主成分特征；将所述第一主成分特征输入训练好的分类器，输出分类的结果，所述分类结果为伪造语音，或自然语音。本申请利用伪造语音在基频处留下的痕迹信息，利用伪造语音与自然语音在声源和声道特征上的差异以实现伪造语音检测。使用主成分分析的方法分别对声源和声道特征进行筛选，选取具有较高相关性的主成分作为特征，减少特征维度和冗余特征，提高模型的泛化能力和效率。

39.

发明授权
一种音视频片段分类方法及装置有权

公开(公告)号：CN111625661B

公开(公告)日：2023-09-08

申请号：CN202010408234.5

申请日：2020-05-14

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 孙旭东 , 张震 , 林格平 , 刘铭 , 刘发强 , 倪善金

IPC: G06F16/45 , G06F16/483 , H04N21/845 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/084

Abstract: 本发明实施例公开了一种音视频片段分类方法及装置，所述方法包括：基于待分类音视频片段的视频帧序列提取目标视频帧，基于待分类音视频片段的音频帧序列提取目标音频帧；基于目标视频帧/目标音频帧的第一出现时刻/第二出现时刻及预设子片段时长确定第一音视频子片段/第二音视频子片段；基于第一音视频子片段/第二音视频子片段提取第一视频分量特征和第一音频分量特征/第二视频分量特征和第二音频分量特征；通过预设音视频分类模型基于第一视频分量特征、第一音频分量特征、第二视频分量特征和第二音频分量特征确定待分类音视频片段的音视频分类结果。采用本发明可以提高音视频分类效率，提高音视频分类的鲁棒性和准确率。

40.

发明公开
一种基于频带选择的伪造语音检测方法审中-实审

公开(公告)号：CN116129913A

公开(公告)日：2023-05-16

申请号：CN202211490461.2

申请日：2022-11-25

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 张震 , 孙旭东 , 王立强 , 杜金浩

IPC: G10L17/04 , G10L25/18 , G10L25/27

Abstract: 本发明实施例公开了一种基于频带选择的伪造语音检测方法。所述方法包括，获取目标语音信号，将目标语音信号进行变换，获得语谱图特征；对所述语谱图特征进行频带切分，获得低频子带特征和高频子带特征；使用低频子带特征训练语音合成伪造语音检测模型；使用高频子带特征训练录音回放伪造语音检测模型；然后将低频子带特征输入语音合成伪造语音检测模型；以及将交叉匹配的高、低频子带特征输入录音回放伪造语音检测模型，获得最终的语音检测结果。在本发明实施例中，实现了提升神经网络伪造语音检测系统在数据集不匹配等情况下的鲁棒性，以及通过子带选择减小了特征大小，降低了伪造语音检测的参数量和计算量。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification