基于语义扩充的文本主题识别方法、系统、设备及介质

    公开(公告)号:CN116842959A

    公开(公告)日:2023-10-03

    申请号:CN202310501361.3

    申请日:2023-05-06

    Abstract: 本发明公开一种基于语义扩充的文本主题识别方法、系统、设备及介质,涉及文本主题识别领域,该方法包括:确定客服文本的扩展词集和扩展系数;将客服文本中名词对应的词向量通过自注意力层计算,得到引入上下文信息后的词向量;根据各引入上下文信息后的词向量与扩展词集中每个词语的余弦相似度,确定扩展词语;扩展词语和客服文本中名词构成扩充后文本词集;基于扩充后文本词集,计算加权词共现矩阵;确定客服文本的先验主题分布;根据加权词共现矩阵和先验主题分布,结合分层狄利克雷过程模型对客服文本进行主题识别,得到主题识别结果。本发明提高了主题识别的准确性。

    装备领域知识图谱构建方法、检索方法、系统及电子设备

    公开(公告)号:CN116523041A

    公开(公告)日:2023-08-01

    申请号:CN202310497796.5

    申请日:2023-05-06

    Abstract: 本发明公开了一种装备领域知识图谱构建方法、检索方法、系统及电子设备,涉及知识图谱技术领域,该装备领域知识图谱构建方法,包括:基于装备领域原始数据集,构建装备领域本体;基于装备领域原始数据集与装备领域本体,将实体与关系抽取合并为一个整体的信息抽取任务来处理,并以端到端的方式输出三元组数据;根据三元组数据,构建装备领域知识图谱。本发明能够在建立相应的装备知识体系,结合知识抽取、信息检索等技术,提供更加智能化、个性化的服务,以促进装备领域的数字化、可视化发展。

Patent Agency Ranking