一种基于大语言模型驱动的主题聚类方法与存储介质

    公开(公告)号:CN119782526A

    公开(公告)日:2025-04-08

    申请号:CN202411824197.0

    申请日:2024-12-12

    Abstract: 本申请发明涉及人工智能自然语言处理领域,尤其涉及基于大语言模型驱动的主题聚类方法;包括步骤如下:S1)文档集合数据整理:S2)使用HDBSCAN聚类算法对所述文档集合D进行初步聚类,得到多个聚类簇{Ck};S3)利用LDA主题模型对文档主题建模,得到每篇文档的主题分布;S4)由LDA模型得到的结果调整聚类结果;S5)利用LLM进一步细化精炼每一簇的主题;S6)在生成的主题列表和数据集中的文档之间建立有效和可解释性的关联。本发明的大语言模型驱动的主题聚类系统,通过整合HDBSCAN聚类、LDA以及大语言模型,实现了文档主题的深度理解和精细聚类,为后续的信息检索、文本挖掘和知识图谱的构建等应用提供坚实的基础。

    一种生成文章标题的方法及装置

    公开(公告)号:CN113919328B

    公开(公告)日:2025-04-01

    申请号:CN202111163578.5

    申请日:2021-09-30

    Abstract: 本申请公开了一种生成文章标题的方法。该方法可以由第一设备执行,第一设备可以是终端设备也可以是服务器。具体地:第一设备可以获取目标正文,而后,确定目标风格,目标风格可以是为目标正文生成的标题的风格。而后,第一设备可以输出所述目标正文对应的所述目标风格的风格化标题。此处提及的风格化标题指的是具有一定风格的标题。该风格化标题具有比较大的吸引力。由此可见,利用本方案,可以为目标正文确定具有吸引力的文章标题,从而提升了确定具有吸引力的文章标题的效率。

    一种设计素材采集方法
    6.
    发明公开

    公开(公告)号:CN119722180A

    公开(公告)日:2025-03-28

    申请号:CN202510220200.6

    申请日:2025-02-27

    Abstract: 本发明涉及数据采集领域,尤其涉及一种设计素材采集方法,其包括:获取设计方案,提取设计方案各部分对应的主题词;依据主题词进行素材的搜索采集,将搜索采集后的素材划分为若干素材组;基于素材组的设计素材特征确定素材契合表征值,以对素材组进行标记;调用设计方案各部分对应的被标记素材组,依据各被标记素材组对应的素材契合表征值对各被标记素材组进行排序,构建排序序列;根据设计方案各部分对应的排序序列筛选被标记素材组并进行整合,确定整合后的初步素材集合的素材整体特征,分析初步素材集合的整体搭配表征参数;以适应性地选用初步素材集合,本发明能够在保证素材搜索采集效率的前提下,提高素材的适配性。

    一种基于双知识图谱的新闻标题短文本分类方法

    公开(公告)号:CN114996455B

    公开(公告)日:2025-03-04

    申请号:CN202210643031.3

    申请日:2022-06-08

    Abstract: 一种基于双知识图谱的新闻标题短文本分类方法,包含:对新闻标题短文本进行预处理,去除特殊字符;通过jieba分词工具提取新闻标题中的关键词,去除停用词;通过CNDBPedia外部知识库提供的API,将关键词链接到外部知识库获取实体集合;通过余弦相似度对实体集合进行消岐,得到候选实体集合;基于全局关键词共现信息,构建领域知识图,解决OOV问题;通过链接到外部知识库获取与实体相关的解释信息,丰富上下文语义信息;使用BERT获取原始新闻标题和实体链接的解释信息的字符级向量表示,并融合这两部分的向量表示,以弥补短文本信息不足的缺点;使用TextCNN来提取多个连续单词之间的N‑grams特征,捕捉深层次的语义信息;最后通过Softmax函数进行分类,得到最终的分类结果。

    一种基于大语言模型和范文模板的文章智能生成方法

    公开(公告)号:CN119538896A

    公开(公告)日:2025-02-28

    申请号:CN202411695441.8

    申请日:2024-11-25

    Inventor: 刘通 陈梦曦

    Abstract: 本发明公开一种基于大语言模型和范文模板的文章智能生成方法,涉及人工智能技术领域。基于待生成文章的文章标题和文章类型,从范文模板库中匹配出多个范文模板;基于待生成文章的任一级标题与各范文模板中各层级标题的匹配度,确定出用于生成任一级标题的下一级标题的候选参考标题;基于候选参考标题的下一级标题,生成任一级标题的下一级标题;从文档资料库中查找出与待生成文章的各级叶子标题匹配的文档素材;基于题匹配的文档素材,通过大语言模型生成各级叶子标题的正文内容;将待生成文章的各级标题及各级叶子标题的正文内容组合,得到待生成文章的文章内容。本发明公开方法可提升AI辅助写作生成内容的质量。

Patent Agency Ranking