基于网络表示学习的垃圾评论用户群组检测方法

    公开(公告)号:CN110442798B

    公开(公告)日:2021-10-08

    申请号:CN201910601396.8

    申请日:2019-07-03

    Abstract: 本发明公开了一种基于网络表示学习的垃圾评论用户群组检测方法,该方法包括以下步骤:1)采集用户对商品的评论并存储;2)垃圾评论活动信息建模,获得用户之间的共谋一致性;3)根据用户之间的共谋一致性,构造用户关系网络;4)根据用户关系网络估计用户之间的低阶关联性和高阶关联性;5)基于低阶关联性和高阶关联性,获得一个完整的模型来对用户的表示进行学习;6)根据学习到包含用户行为关系信息和网络拓扑结构信息的用户低维表示,从而计算两个用户的共谋可能性得分,通过计算ScoreF(ui,*)中最大的n个分数的平均值来获得用户ui的分数,并根据用户分数的排序获得最终的检测结果。本发明能有效提升垃圾评论群组检测的准确率。

    基于网络表示学习的垃圾评论用户群组检测方法

    公开(公告)号:CN110442798A

    公开(公告)日:2019-11-12

    申请号:CN201910601396.8

    申请日:2019-07-03

    Abstract: 本发明公开了一种基于网络表示学习的垃圾评论用户群组检测方法,该方法包括以下步骤:1)采集用户对商品的评论并存储;2)垃圾评论活动信息建模,获得用户之间的共谋一致性;3)根据用户之间的共谋一致性,构造用户关系网络;4)根据用户关系网络估计用户之间的低阶关联性和高阶关联性;5)基于低阶关联性和高阶关联性,获得一个完整的模型 来对用户的表示进行学习;6)根据学习到包含用户行为关系信息和网络拓扑结构信息的用户低维表示,从而计算两个用户的共谋可能性得分,通过计算ScoreF(ui,*)中最大的n个分数的平均值来获得用户ui的分数,并根据用户分数的排序获得最终的检测结果。本发明能有效提升垃圾评论群组检测的准确率。

    一种基于位置感知自注意力机制的序列标注模型与标注方法

    公开(公告)号:CN110334339A

    公开(公告)日:2019-10-15

    申请号:CN201910362637.8

    申请日:2019-04-30

    Abstract: 本发明公开了一种基于位置感知自注意力机制的序列标注模型与标注方法,该序列标注模型将自注意上下文融合层作为BiLSTM-CRF模型的扩展,构造新的序列标注模型;该模型包括自注意上下文融合层和BiLSTM组成的编码器,以及作为解码器的CRF层;所述自注意上下文融合层,用于以词的特征向量表示序列作为输入,通过位置感知自注意力机制建立结合位置信息后序列中各词语与设定特定词语间的关联,得到序列中所有词语特征向量表示的加权和作为该特定词的输出特征。本发明提出的方法通过引入自注意上下文融合层,能够充分提取单词之间的潜在关系,从而可以在Bi-LSTM的基础上提供互补的上下文信息。

    一种基于位置感知自注意力机制的序列标注模型与标注方法

    公开(公告)号:CN110334339B

    公开(公告)日:2021-04-13

    申请号:CN201910362637.8

    申请日:2019-04-30

    Abstract: 本发明公开了一种基于位置感知自注意力机制的序列标注模型与标注方法,该序列标注模型将自注意上下文融合层作为BiLSTM‑CRF模型的扩展,构造新的序列标注模型;该模型包括自注意上下文融合层和BiLSTM组成的编码器,以及作为解码器的CRF层;所述自注意上下文融合层,用于以词的特征向量表示序列作为输入,通过位置感知自注意力机制建立结合位置信息后序列中各词语与设定特定词语间的关联,得到序列中所有词语特征向量表示的加权和作为该特定词的输出特征。本发明提出的方法通过引入自注意上下文融合层,能够充分提取单词之间的潜在关系,从而可以在Bi‑LSTM的基础上提供互补的上下文信息。

    一种基于机器学习和深度学习的中文自然语言处理工具系统

    公开(公告)号:CN110705296A

    公开(公告)日:2020-01-17

    申请号:CN201910867399.6

    申请日:2019-09-12

    Abstract: 本发明公开了一种基于机器学习和深度学习的中文自然语言处理工具系统,包括:数据处理模块,用于获取待处理中文文本和处理任务类型,并根据处理任务类型将接收的中文文本转换为计算机可读的数据格式;任务应用模块,用于根据数据处理模块获取的数据和自然语言处理需求,使用统一接口调用算法模型库,完成全流程模型训练;并根据保存的自然语言处理模型,对外提供规范统一的任务调用接口,以完成相应自然语言处理任务;算法模型库,用于保存自然语言处理任务的算法及根据算法训练得到的模型。本发明构造了合理的系统架构,通过所有功能训练接口统一、训练流程统一、调用接口统一、调用流程统一,作为自然语言处理工具使用更加简单高效。

Patent Agency Ranking