-
公开(公告)号:CN113052270B
公开(公告)日:2024-12-24
申请号:CN202110503779.9
申请日:2021-05-10
Applicant: 清华大学 , 国家计算机网络与信息安全管理中心
IPC: G06F18/21 , G06F18/241 , G06F18/22
Abstract: 本申请涉及一种分类精度评价方法、装置、计算机设备和存储介质。所述方法包括:获取有害语音样本集;将有害语音样本集中的每个有害语音样本输入待评价的有害语音分类模型中进行分类,得到预测类别标签;在预设的分类层级中,确定与预测类别标签和有害语音样本的样本类别标签对应的目标分类;根据目标分类计算待评价的有害语音分类模型的分类精确程度。本方案中,对有害语音样本进行了多层次的分类(即分类层级),然后在分类层级中确定预测类别标签和样本类别标签共同所属的目标分类,目标分类可以反映预测类别标签和样本类别标签的匹配度,进而根据目标分类确定分类模型的分类精确程度,能够有效的提高分类模型评价的准确度。
-
公开(公告)号:CN111858925B
公开(公告)日:2023-08-18
申请号:CN202010501138.5
申请日:2020-06-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/335 , G06F40/211 , G06F40/289 , G06Q30/018 , G06Q50/32
Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。
-
公开(公告)号:CN113420111B
公开(公告)日:2023-08-11
申请号:CN202110674586.X
申请日:2021-06-17
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/33 , G06F16/332 , G06F40/126 , G06F40/289 , G06F40/30 , G06F18/24 , G06N3/02
Abstract: 本申请实施例公开了一种用于多跳推理问题的智能问答方法及装置,方法包括:获取问题文本;对问题文本进行语义编码,获得问题文本的语义编码表示;根据问题文本的语义编码表示,确定第一预测结果,第一预测结果为问题文本的至少一个问题主体所在位置的预测结果;根据问题文本的语义编码表示,确定第二预测结果,第二预测结果为问题文本的至少一个问题关系的预测结果;根据第一预测结果和第二预测结果,生成子问题文本,子问题文本包括至少一个子问题;根据筛选文档,对至少一个子问题依次进行回答,获得与至少一个子问题对应的答案,筛选文档包括至少一个子问题对应的答案;根据至少一个子问题对应的答案,确定问题文本的最终答案。
-
公开(公告)号:CN111698685B
公开(公告)日:2023-05-12
申请号:CN202010541713.4
申请日:2020-06-15
Applicant: 珠海高凌信息科技股份有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种识别伪装成携号转网号码的虚假主叫的系统和方法的技术方案,包括:通过本网GMSC用于对具有不同NDC归属运营商的主叫号码与被叫号码进行号码状态查询,获取所述主叫号码的第一状态;根据所述第一状态对查询结果中已进行携号转网的所述主叫号码通过所述转发网关发送ATI消息;通过所述ATI消息获取所述主叫号码的第二状态,根据所述第一状态或第二状态对所述主叫号码进行放行或防护。本发明的有益效果为:通过新增网元,修改现网网元机制,达到获取携号转网用户状态的目标,实现对伪装携号转网号码的识别。
-
公开(公告)号:CN113676604B
公开(公告)日:2023-03-31
申请号:CN202010403400.2
申请日:2020-05-13
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 国家计算机网络与信息安全管理中心
IPC: H04M7/00
Abstract: 本发明实施例公开了一种语音处理方法、相关设备和存储介质。所述方法包括:第一网络设备接收到呼叫请求消息,所述呼叫请求消息中包括主叫号码和被叫号码;判断所述主叫号码是否满足预设触发条件;在判定所述主叫号码满足预设触发条件的情况下,将所述呼叫请求消息转发至接入能力网元;所述接入能力网元用于从业务服务器获得针对所述呼叫请求消息的呼叫控制策略、并根据所述呼叫控制策略对所述呼叫请求消息对应的呼叫事件进行处理。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN108460772B
公开(公告)日:2022-05-17
申请号:CN201810150076.0
申请日:2018-02-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06T7/11 , G06T7/136 , G06T7/155 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种基于卷积神经网络的广告骚扰传真图像检测系统及方法,包括关键字区域提取模块,所述关键字区域提取模块用于确定待检测传真图像的关键字可疑区域;神经网络置信度分析模块,所述神经网络置信度分析模块与所述关键字区域提取模块相连,所述神经网络置信度分析模块用于对所述关键字可疑区域的文字进行识别,实现传真图像的分类。本发明通过关键字区域提取模块对关键字可疑区域进行提取,自动化运行,工作效率高;通过神经网络置信度分析模块对关键字可疑区域的文字进行识别,实现广告骚扰传真的分类判断,节约时间,管控能力强,使得本发明具有工作效率高,管控能力强的特点。
-
公开(公告)号:CN113779961A
公开(公告)日:2021-12-10
申请号:CN202010518026.0
申请日:2020-06-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/211 , G06F40/253 , G06F40/289
Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。
-
公开(公告)号:CN113742478A
公开(公告)日:2021-12-03
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN113205801A
公开(公告)日:2021-08-03
申请号:CN202110498059.8
申请日:2021-05-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本申请涉及一种恶意语音样本的确定方法、装置、计算机设备和存储介质。该方法包括:获取初始语音样本集;根据预设的多种恶意类别对初始语音样本集进行分类,得到多种恶意类别中每种恶意类别对应的语音样本子集;根据每种恶意类别对应的语音样本子集中的语音样本信息,计算每种恶意类别对应的语音样本子集的恶意度;将恶意度满足预设恶意度条件的恶意类别对应的语音样本子集中的语音样本,确定为恶意语音样本。本方法基于语音样本子集的恶意类别以及恶意度可自动确定恶意语音样本,有利于提高恶意语音样本的确定效率。
-
-
-
-
-
-
-
-
-