一种针对海量文本数据的定向筛选架构及方法

    公开(公告)号:CN113742478A

    公开(公告)日:2021-12-03

    申请号:CN202010474192.5

    申请日:2020-05-29

    Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。

    一种基于分类分级的数据出境合规路径推荐方法及系统

    公开(公告)号:CN118587069A

    公开(公告)日:2024-09-03

    申请号:CN202410753996.7

    申请日:2024-06-12

    Abstract: 本发明涉及数据出境安全技术领域,公开了一种基于分类分级的数据出境合规路径推荐方法及系统,根据数据处理者是否属于关键信息基础设施运营者、实际数据出境类型、数据敏感程度、数据链路情况,判断与申报材料相比是否有错误,是则根据不同对比情况给出合规建议,否则该数据出境业务场景合规,无需额外处理;判断数据出境业务场景是否属于预设可免予申报数据出境安全评估、订立个人信息出境标准合同、通过个人信息保护认证的场景,若全部出境场景均属于,则结束;根据数据处理者是否属于关键信息基础设施运营者、实际出境数据明细日志,结合预定义的数据分类分级标准,分析出境数据类型、数据敏感程度、不同时间范围内出境的数据数量以及自然人数,完成数据出境合规路径的自动化推荐。本发明结合数据处理者境内数据出境出口日志数据,实现对数据处理者数据出境合规三种路径的推荐以及合规后常态化监测,并根据实际问题给出合理处置建议。

    一种针对海量文本数据的定向筛选装置及方法

    公开(公告)号:CN113742478B

    公开(公告)日:2023-09-05

    申请号:CN202010474192.5

    申请日:2020-05-29

    Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。

    一种基于下载链接的僵尸网络恶意软件检测方法

    公开(公告)号:CN119544333A

    公开(公告)日:2025-02-28

    申请号:CN202411725602.3

    申请日:2024-11-28

    Abstract: 本发明涉及数据检测技术领域,公开了一种基于下载链接的僵尸网络恶意软件检测方法,首先进行原始流量解析,捕获环境中的pcap包并提取出pcap包中每个帧的IP、端口和url信息;对环境中的pcap包的数据进行数据集整理;进行训练检测,首先进行构建邻接矩阵,然后进行参数初始化;对初始化的数据再进行矩阵运算,然后再进行多通道训练,并进行图卷积层输入,训练出识别模型;对训练出的识别模型进行模型训练调优;将训练好的模型应用在基于下载链接的数据进行僵尸网络恶意软件的检测。本发明检测方法设计灵活,能够适应不断变化的恶意软件攻击手段和模式。通过动态调整检测策略和参数,本方法能够迅速响应和适应新出现的威胁,保持高效的检测能力。

Patent Agency Ranking