-
公开(公告)号:CN116680419A
公开(公告)日:2023-09-01
申请号:CN202310955604.0
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F40/216 , G06F40/30 , G06F40/295
Abstract: 本发明涉及自然语言处理技术领域,提供一种多源数据映射关联细粒度不良信息检测方法,所述方法包括:获取待检测文本和历史浏览文本,待检测文本和历史浏览文本属于同一用户的浏览文本;对待检测文本进行实体关系抽取,得到待检测三元组;获取历史浏览文本中的不良信息所对应的历史三元组,并基于历史三元组与待检测三元组之间的关联度,从待检测三元组中确定出待检测文本中的不良信息所对应的三元组。本发明提供的一种多源数据映射关联细粒度不良信息检测方法,能够准确从待检测三元组中确定出待检测文本中的不良信息所对应的三元组,避免传统方法中分词演变绕过黑名单机制导致漏检的问题,进一步提高的不良信息的检测精度。
-
公开(公告)号:CN113419971A
公开(公告)日:2021-09-21
申请号:CN202110978263.X
申请日:2021-08-25
Applicant: 北京邮电大学 , 国家计算机网络与信息安全管理中心
Abstract: 本公开提供一种安卓系统服务漏洞检测方法及相关装置,基于安卓系统源码,获取本地系统服务接口;获取所述本地系统服务接口对应的数据类型;基于所述数据类型,利用遗传算法构造接口测试用例;基于所述接口测试用例,对所述本地系统服务接口进行模糊测试,以发现所述漏洞,本公开能够有效发现安卓本地系统服务的漏洞,提高安卓本地系统服务的安全性。
-
公开(公告)号:CN117633092A
公开(公告)日:2024-03-01
申请号:CN202311358101.1
申请日:2023-10-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/26 , G06F16/2455
Abstract: 一种改进apriori的频繁有序项集挖掘方法,包括:采取项为首、特征为尾拼接的方式生成新项集,以发现数据中频繁出现的连续有序项集,而不是无序的关联规则;在候选项筛选中,加入项预判断,减少对事务集的扫描次数;另外,还采用记录项事务集的方式避免了对全部数据集的频繁扫描,提高了算法的时间性能。该方法有效解决了Apriori算法无法用于发现频繁有序项集,以及候选集筛选过程中频繁扫描整个事务集带来的时间开销巨大的问题。
-
公开(公告)号:CN117371423A
公开(公告)日:2024-01-09
申请号:CN202311076561.5
申请日:2023-08-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/20 , G06N3/0442 , G06N3/09
Abstract: 本发明公开了一种不平衡条件下的文本分类器生成方法和装置,所述方法包括:获取不平衡数据,基于所述不平衡数据构建训练集;生成特征向量,将特征向量作为输入数据;将输入数据输入分类网络,分类网络包括依次相连的卷积层、池化层、LSTM层、GRU层、全连接层;输入数据经所述分类网络处理,得到中间分类结果,所述中间分类结果是未经完全训练,但是已有分类效果的结果;将中间分类结果与真实标签输入损失函数,得到中间结果对应的损失值,若损失值小于预定义的损失值,则当前的分类网络结合当前的权重作为构建完毕的分类器。本方法能在训练过程中减少分对样本的损失在总的损失中的权重,使得分类器的优化更偏向分错的样本。
-
公开(公告)号:CN116910754A
公开(公告)日:2023-10-20
申请号:CN202310947894.4
申请日:2023-07-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56 , G06F16/33 , G06F16/35 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明属于应用程序技术领域,具体为一种基于知识图谱的高危App检测识别方法。本发明提供了基于知识图谱的高危App检测识别方法,包括数据采集:根据预设采集规则,面向境内主流的移动应用市场进行全网信息采集;采用代理自动切换和多线程并发策略,结合深度优先遍历、广度优先遍历、种子池搜索、ID索引等技术进行全量数据获取。无需人工干涉,系统自动捕获最新的应用版本,既能确保追踪应用信息的更新,又能确保捕获应用信息的新增,同时还不影响兼顾采集效率;通过借助构建的App知识图谱关联关系及纯文本语义关系,综合处理获取信息,实现对App多维度的风险检测评估,本发明以整体关联分析的方法处理,速度快且灵活性高。
-
公开(公告)号:CN117391072A
公开(公告)日:2024-01-12
申请号:CN202311173762.7
申请日:2023-09-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06F40/216 , G06F16/35 , G06N3/0464 , G06N3/09
Abstract: 本发明提供了一种基于遮挡语言模型的文本纠错方法、系统、设备及介质,能够通过无监督学习大量语料文本的方式,完成对文本的智能纠错,不需要人工标记的大量语料。本发明在不需要准备专门的平行语料的情况下完成中文文本纠错的任务,只需要提供大量中文语言的文本给语言模型自动进行训练即可,采用无监督学习大量语言文本的方式拓展了平行语料范围有限造成的局限性,不需要人工标记的大量语料。本发明采用遮挡语言模型的方式进行文本纠错,其过程中通过无监督学习大量语料文本的方式,完成对文本的智能纠错,应用于针对中文文本纠错的系统中,发现并纠错文本中在输入等过程中产生的错误。
-
-
-
-
-