一种基于序贯神经网络模型的社交媒体用户文本分类方法

    公开(公告)号:CN117131190A

    公开(公告)日:2023-11-28

    申请号:CN202310856800.2

    申请日:2023-07-13

    Abstract: 本发明涉及文本分类的技术领域,特别是涉及一种基于序贯神经网络模型的社交媒体用户文本分类方法,通过用户分类关键词、训练集数据和序贯模板模型构建社交媒体用户分类序贯神经网络模型,对采集的用户社交媒体发文文本进行相关特征提取,根据社交媒体中文用户分类序贯神经网络模型返回的权重值对用户进行分类;包括以下步骤:首先搜寻典型用户的post文本,收集相关关键词和停用词分别创建关键词词库和停用词词库,通过关键词词库和停用词词库结合典型用户文本构建神经网络训练矩阵,根据训练集和序贯模型创建神经网络模型,然后对采集到的中文用户post文本进行处理,最后通过序贯神经网络模型判定出用户的类型。

    基于机器学习的微信公众号推荐方法及系统

    公开(公告)号:CN110990711B

    公开(公告)日:2023-05-12

    申请号:CN201910392858.X

    申请日:2019-05-13

    Abstract: 本发明公开了基于机器学习的微信公众号推荐算法,包括:为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;根据目标用户的历史行为确定目标用户的喜好标签;从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。本发明还提供了基于机器学习的微信公众号推荐系统。本发明能够根据分析用户喜好,进而自动推荐合适的公众号,避免用户受各种良莠不齐的公众号干扰,避免花费过多时间用于挑选公众号文章。

    社交账号区域位置信息的识别方法和装置

    公开(公告)号:CN115357631A

    公开(公告)日:2022-11-18

    申请号:CN202210668005.6

    申请日:2022-06-14

    Abstract: 本发明公开了一种社交账号区域位置信息的识别方法,其包括:采集社交账号的基本信息,所述基本信息至少包括:所在区域、个人简介;提取所在区域字段的内容,根据所在区域字段的内容得出位置信息,若无法得出位置信息,则采集社交账号的言论信息,提取言论信息发表时的定位经纬度,根据定位经纬度的地得出位置信息,若无法得出位置信息,则提取个人简介字段的内容,基于预设的位置匹配词在个人简介字段的内容中得出位置信息,若无法得出位置信息,则采集社交账号发表的文本信息,基于预设的位置匹配词在文本信息中得出位置信息。本发明可以通过账号注册时提供的位置信息、个人简介、经纬度、文本信息这四个维度进行区域位置分析。

    一种基于自注意力的观点及其持有者的联合抽取方法

    公开(公告)号:CN108628828B

    公开(公告)日:2022-04-01

    申请号:CN201810347840.3

    申请日:2018-04-18

    Abstract: 本发明一种基于自注意力的观点及其持有者的联合抽取方法:S1.构建提取观点及其持有者的语料集;S2.识别包含观点的语句;S3.联合抽取观点及其持有者。本发明优点:1、文本分类模型避免了抽取出的句子不包含观点的情况;2、观点及其持有者联合抽取模型摆脱了词性标注、命名实体识别和句法依存分析等自然语言处理环节,避免这些环节出现误差对模型提取效果的影响,且该模型有很高灵活度和覆盖面;3、本发明包含构建提取观点及其持有者的语料集,识别包含观点的语句,联合抽取观点及其持有者。4、本发明在双向LSTM的基础上使用self‑attention有效结合两者优点,使词语序列的表示语义更丰富,训练的模型准确率更高。

    一种基于异质数据的人物相似度刻画方法

    公开(公告)号:CN107577782B

    公开(公告)日:2021-04-30

    申请号:CN201710827978.9

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于异质数据的人物相似度刻画方法,属于数据挖掘领域。本发明首先搜集用户的微博文本,获取用户之间的关注关系以及各用户的基本信息,针对不同类型数据的特点个性化选择处理方式,并对于微博文本采用Doc2vec模型,结合上下文信息将文本表示成向量,再根据定义的相似度函数衡量相似度,最后将不同维度得到的矩阵进行融合,刻画用户最终的相似度。本发明引入了多种社交网络信息,包括社交关系数据、用户属性数据和用户文本数据等,通过对不同类型的信息加以综合考虑,以得到更全面的人物相似度刻画方法;同时本发明提供了对于多种数据的处理和计算方案,利用完整的数据和加权融合方法,个性化计算不同偏好的人物相似度。

Patent Agency Ranking