一种基于TextCNN-Bert融合模型算法的不良信息识别方法

    公开(公告)号:CN116796740A

    公开(公告)日:2023-09-22

    申请号:CN202310832134.9

    申请日:2023-07-07

    Abstract: 本发明提供一种基于TextCNN‑Bert融合模型算法的不良信息识别方法,属于基于模型算法的不良信息识别技术领域;所要解决的技术问题为:提供一种采用TextCNN‑Bert融合模型算法进行不良信息识别方法的改进;解决该技术问题采用的技术方案为:对待识别的文本进行分词、词性标注、去除停用词的预处理,将经过预处理的文本按照序列输入融合模型进行识别处理;将预处理文本输入融合模型中的敏感领域主题识别模块进行处理:若对敏感领域主题识别为假,则判定与敏感领域无关,作为一般文本信息进行输出;若对敏感领域主题识别为真,则输入情感隐喻识别模块,做进一步判定;本发明应用于不良信息识别。

    一种改进apriori的频繁有序项集挖掘方法

    公开(公告)号:CN117633092A

    公开(公告)日:2024-03-01

    申请号:CN202311358101.1

    申请日:2023-10-19

    Abstract: 一种改进apriori的频繁有序项集挖掘方法,包括:采取项为首、特征为尾拼接的方式生成新项集,以发现数据中频繁出现的连续有序项集,而不是无序的关联规则;在候选项筛选中,加入项预判断,减少对事务集的扫描次数;另外,还采用记录项事务集的方式避免了对全部数据集的频繁扫描,提高了算法的时间性能。该方法有效解决了Apriori算法无法用于发现频繁有序项集,以及候选集筛选过程中频繁扫描整个事务集带来的时间开销巨大的问题。

    一种不平衡条件下的文本分类器构建方法和装置

    公开(公告)号:CN117371423A

    公开(公告)日:2024-01-09

    申请号:CN202311076561.5

    申请日:2023-08-24

    Abstract: 本发明公开了一种不平衡条件下的文本分类器生成方法和装置,所述方法包括:获取不平衡数据,基于所述不平衡数据构建训练集;生成特征向量,将特征向量作为输入数据;将输入数据输入分类网络,分类网络包括依次相连的卷积层、池化层、LSTM层、GRU层、全连接层;输入数据经所述分类网络处理,得到中间分类结果,所述中间分类结果是未经完全训练,但是已有分类效果的结果;将中间分类结果与真实标签输入损失函数,得到中间结果对应的损失值,若损失值小于预定义的损失值,则当前的分类网络结合当前的权重作为构建完毕的分类器。本方法能在训练过程中减少分对样本的损失在总的损失中的权重,使得分类器的优化更偏向分错的样本。

Patent Agency Ranking