-
公开(公告)号:CN117271765A
公开(公告)日:2023-12-22
申请号:CN202311059507.X
申请日:2023-08-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于多语义特征融合的文本分类方法及装置,所述方法包括:获取待分类的文本,将所述待分类的文本进行预处理,得到处理后的文本;将词级粒度向量输入训练完毕的词级语义特征提取模型,得到词级语义特征;将句子级粒度向量输入训练完毕的句子级语义特征提取模型,得到句子级语义特征;基于文章级向量对所述处理后的文本进行特征提取,得到文本级语义特征;将所述词级语义特征、句子级语义特征以及文本级语义特征进行特征拼接融合,得到融合后特征,使用分类器对所述融合后特征进行分类。本方法从词粒度、句子粒度和文章粒度等多个层面对文本进行精细语义建模,利用文本的多语义融合特征进行文本分类,提高了文本分类的准确率。
-
公开(公告)号:CN117194773A
公开(公告)日:2023-12-08
申请号:CN202311061729.5
申请日:2023-08-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9538 , G06F16/35 , G06F16/532
Abstract: 本发明公开了一种基于多模态特征的网站识别方法及装置,所述方法包括:获取处理后的网页信息;得到对应的网页文本特征;获取网页用户特征;获取网页资源信息特征;获取所述网页信息对应的网页图片快照,由网页图片处理模块对所述网页图片快照提取网页图片特征;将所述网页文本特征、网页用户特征、网页资源信息特征及网页图片特征进行特征融合,得到多模态融合特征,由多模态识别模型对所述多模态融合特征进行识别。本方法利用多模态识别模型对网站进行分类,有效提高了对不良网站识别的准确率。
-
公开(公告)号:CN110879861A
公开(公告)日:2020-03-13
申请号:CN201910834941.8
申请日:2019-09-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953
Abstract: 本发明公开了一种基于表示学习的相似移动应用计算方法,所述方法包括:读取移动应用相关的文档、网页以及图数据库中的三元组,获取与文档、网页以及图数据库中与所述移动应用相关的实体,构建表示学习算法-网络嵌入模型LINE网络;基于LINE负采样技术优化Skip-gram模型,通过所述Skip-gram模型训练所述LINE网络,得到每个实体以及移动应用自身的向量表示;根据每个实体以及移动应用自身的向量表示,对移动应用进行相似度计算。
-
公开(公告)号:CN110688316A
公开(公告)日:2020-01-14
申请号:CN201910921222.X
申请日:2019-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F11/36 , G06F16/2455 , G06F16/36
Abstract: 本发明公开了一种基于规则引擎的移动应用风险等级推理评估方法及装置,所述方法包括:获取预先存储的预定义风险等级推理规则,并从移动应用的图数据库中读取各个移动应用的三元组实例;通过预定算法根据所述预定义风险等级推理规则和所述三元组实例,对各个移动应用进行推理,得到各个移动应用的风险等级。
-
公开(公告)号:CN110134947A
公开(公告)日:2019-08-16
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN105893157A
公开(公告)日:2016-08-24
申请号:CN201610282320.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种开放分布式系统资源管理与任务调度系统与方法,本发明通过将开放分布式系统资源管理与任务调度系统分为任务管理器、资源策略优化调度器、资源管理器、以及多个节点管理器,简化中央调度功能,解决了现有技术中的资源管理与调度系统较难直接应用在异构硬件资源环境下管理执行异构任务的问题,能够提供一种管理异构硬件资源并调度执行异构任务的框架,可支持硬件资源的动态变化与不同类型任务的调度管理。
-
公开(公告)号:CN117633543A
公开(公告)日:2024-03-01
申请号:CN202311359555.0
申请日:2023-10-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/22 , G06F18/25 , G06F40/30 , G06F40/289 , G06F40/216
Abstract: 一种基于融合向量的短文本相似度计算方法,主要包括以下步骤:根据短文本所在的业务场景,积累相关的业务语料;基于业务语料,得到短文本所在语境的主题、各主题的主题词和主题词的权重信息,构造词汇权重关系模型;基于该模型对短文本中包含的词汇进行权重计算;利用短文本词汇的权重信息和使用word2vec生成的词汇语义信息,构造基于权重的文本语义向量;根据短文本语义向量的余弦相似度进行短文本相似度比较。该方法充分考虑了每个词对相似度贡献的区别,从基于权重的文本语义融合向量化表示的角度,定义了一种新的短文本相似度的计算方法。
-
公开(公告)号:CN105893157B
公开(公告)日:2019-08-30
申请号:CN201610282320.X
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种开放分布式系统资源管理与任务调度系统与方法,本发明通过将开放分布式系统资源管理与任务调度系统分为任务管理器、资源策略优化调度器、资源管理器、以及多个节点管理器,简化中央调度功能,解决了现有技术中的资源管理与调度系统较难直接应用在异构硬件资源环境下管理执行异构任务的问题,能够提供一种管理异构硬件资源并调度执行异构任务的框架,可支持硬件资源的动态变化与不同类型任务的调度管理。
-
公开(公告)号:CN105846982B
公开(公告)日:2019-03-15
申请号:CN201610285419.5
申请日:2016-04-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出了一种跨域传输的方法,该方法包括:在发送终端,按顺序对每个待发送信息进行编号,并对经过编号的每个待发送信息进行分解得到多个数据包,并按顺序为每个数据包编号;为任一待发送信息中的首个数据包添加包头信息,为所述任一待发送信息中的其他数据包添加编号信息;将经过编号的待发送信息中的数据包通过用户数据报协议UDP传输至接收终端。在接收终端,接收发送终端传输来的数据包,并按照所述数据包的包头信息或编号信息对所述数据包进行重组,形成接收信息。该方法能够减少数据反馈量、提高传输速率、增强可靠性。
-
公开(公告)号:CN106059807A
公开(公告)日:2016-10-26
申请号:CN201610368038.3
申请日:2016-05-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/24
CPC classification number: H04L41/5009
Abstract: 本发明公开了一种基于用户感知的网络内容访问效果自动验证方法及系统。该方法包括以下步骤:通过行为层、应用层、和/或网络层对用户操作进行录制;将录制的用户操作进行回放,向服务器端发送服务器请求;接收所述服务器返回的请求内容,通过捕获与所述请求内容相关的数据包、通过图像识别、和/或通过通知栏识别对所述请求内容进行网络内容访问效果的验证。借助于本发明的技术方案,能够以用户感知的最终体验作为评价访问效果的唯一标准,访问效果验证的准确性得到极大提高。
-
-
-
-
-
-
-
-
-