-
公开(公告)号:CN116821747A
公开(公告)日:2023-09-29
申请号:CN202310439834.1
申请日:2023-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于图文多模态信息融合的互联网不良应用分类识别方法,针对不良应用具有识别效果佳的优点。互联网不良应用分类识别方法包括:收集网站应用,并对网络应用进行类别标注;提取网站应用的应用名称并基于此构建第一向量;对网络应用进行沙盒运行,以获取网络应用的访问信息以及运行界面截图;基于访问信息构建第二向量;从运行界面截图中提取有效文本字符并基于此构建第三向量;融合第一向量、第二向量、第三向量,以获得融合向量;将融合向量作为输入,训练互联网不良应用分类识别模型,互联网不良应用分类识别模型包括全连接层、Softmax层、损失函数;基于训练完成的互联网不良应用分类识别模型对待识别的网站应用进行分类识别。