基于类别引导与词汇增强的农业病害命名实体识别方法

    公开(公告)号:CN118643832A

    公开(公告)日:2024-09-13

    申请号:CN202410731098.1

    申请日:2024-06-06

    Abstract: 本发明公开了基于类别引导与词汇增强的农业病害命名实体识别方法,包括:根据原始文本,构建关于实体类型的Trie词典树和问题模板;将问题模板和原始文本分别输入预训练语言模型,获取文本嵌入和问题模板嵌入;将原始文本在Trie词典树中进行词汇匹配,并与问题模板嵌入进行拼接,获取词汇增强的问题模板嵌入;将词汇增强的问题模板嵌入和文本嵌入输入标签信息注意力计算模型,并利用指针网络预测实体标签,获取目标实体。本发明应用前缀匹配算法获取相关词汇,将相关词汇向量与问题模板嵌入表达拼接实现外部词汇信息的增强,丰富了上下文信息;在推理过程中,采用标签信息注意力计算模型,相较原有方法计算复杂度高的问题有了显著改善。

    一种用于网络行为分析的辖区网站敏感信息快速爬取方法

    公开(公告)号:CN118410225A

    公开(公告)日:2024-07-30

    申请号:CN202410184119.2

    申请日:2024-02-19

    Abstract: 本发明公开了一种用于网络行为分析的辖区网站敏感信息快速爬取方法,属于信息检索和数据挖掘技术领域。通过Scrapy框架实现,1)获取辖区网站信息,并分为政府类型网站和其他类型网站;2)一次性读取辖区网站的链接和数据库中记录的爬取次数信息;3)对辖区网站链接进行清洗和验证:在爬虫时,对链接域名不完整或缺失协议字段的链接不进行访问,并对不完整或缺失的链接进行审核和补全;4)将处理过的链接送入爬虫程序,分别获取政府类型网站和其他类型网站的文本内容;5)设置定时任务,实现增量爬取。本发明通过对政府类型网站和其他类型网站的区分和差异化处理,能够快速、全面的爬取辖区网站内容,实现辖区网站敏感信息的高效监测。

    一种基于异构知识融合的农业病害知识问答检索方法及系统

    公开(公告)号:CN118550991A

    公开(公告)日:2024-08-27

    申请号:CN202410606689.6

    申请日:2024-05-16

    Abstract: 本发明公开了一种基于异构知识融合的农业病害知识问答检索方法及系统,包括:构建异构知识库,对问题文本进行处理,获取问题向量和目标实体;将所述问题向量与所述知识文档向量库进行匹配,获取上下文匹配信息;将所述目标实体分别与所述农业病害知识图谱进行匹配,获取三元组匹配信息;将所述问题文本、所述上下文匹配信息和所述三元组匹配信息进行整合,获取提示词;将所述提示词输入大语言模型,获取农业病害知识问答检索结果。面对简单的问题,本发明能够自动化的从知识文档中检索到答案,能够实现深层语义理解;而针对复杂问题,本发明能够进行知识推理,实现对复杂问题的综合分析,从而提升知识问答系统的智能化水平和服务质量。

Patent Agency Ranking