融合图卷积神经网络和胶囊图神经网络的多模态分类方法

    公开(公告)号:CN119397371A

    公开(公告)日:2025-02-07

    申请号:CN202411432290.7

    申请日:2024-10-14

    Abstract: 本申请公开了融合图卷积神经网络和胶囊图神经网络的多模态分类方法,解决如何将人工智能技术应用在外观专利上的问题。通过利用BERT对专利文本序列编码,利用PCNN分段语义图卷积,利用语法图卷积构造依赖树,进行交互注意与关系分类,最后通过胶囊网络进行图像特征提取。本发明研究融合异质多模态信息的外观专利分类技术,解决文字、图像、网络等多模态信息的特征提取和融合问题,构建异质多模态的外观设计专利分类模型,实现相对于单纯文本内容在分类准确率上的较大提升。同时在知识产权超图网络的基础上构建外观设计专利AI标准数据集,填补传统洛迦诺分类体系中专利类型的空白,从而突破传统外观专利分类方法的瓶颈。

    特定人员的信用评估模型的训练方法、装置、介质及设备

    公开(公告)号:CN119722099A

    公开(公告)日:2025-03-28

    申请号:CN202411735292.3

    申请日:2024-11-29

    Abstract: 本申请公开了一种特定人员的信用评估模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量特定人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用信用评估模型获取各个维度的特征阈值,根据特征阈值将每个维度的特征划分为正样本和负样本,根据正负样本计算WOE值和IV值,将最大IV值对应的特征阈值作为模型参数。本申请能使用大语言模型量化数据,并根据WOE值和IV值确定信用评估模型的模型参数,提高模型的准确率。

    文本检索方法、装置、存储介质及服务器

    公开(公告)号:CN114090799B

    公开(公告)日:2022-07-26

    申请号:CN202111404155.8

    申请日:2021-11-24

    Abstract: 本申请公开了一种文本检索方法、装置、存储介质及服务器,属于数据检索技术领域。所述方法包括:获取待检索的第一专利文本的第一词袋组合和第一专利信息;获取专利数据库中每个第二专利文本的第二词袋组合和第二专利信息;根据第一词袋组合、第二词袋组合和词条的IPC权重,筛选与第一专利文本相似的n个第二专利文本,得到粗选集;根据第一词袋组合、粗选集中的第二词袋组合、各个词条之间的余弦距离和IPC权重,从粗选集中筛选与第一专利文本相似的m个第二专利文本,得到细选集;根据第一专利信息与第二专利信息的匹配度,对细选集中的各个第二专利文本的排序进行调整,得到检索结果。本申请可以提高检索效率和准确率。

    一种基于共享内存的数据载入加速方法、装置、电子设备及存储介质

    公开(公告)号:CN112256457A

    公开(公告)日:2021-01-22

    申请号:CN202011227889.9

    申请日:2020-11-06

    Abstract: 本发明提供一种基于共享内存的数据载入加速方法、装置、电子设备及存储介质,属于数据处理技术领域。所述方法应用于服务器,方法包括:将共享内存用作默认的内存池,在共享内存中创建对象并命名,使用带偏移量的智能指针指向共享内存,导出偏移地址到文件,在共享内存中创建动态数组(Vector)和容器(Map),构建自定义哈希容器(Customized Hashmap),加载创建好的内存对象,实现不同进程间的数据通讯。本发明自定义了一套基于共享内存的哈希容器,在数据静态使用方式的前提下又做了一系列优化,实现了其它数据载入方式不具备、但在实际工程应用时不可或缺的功能,如多类型支持、嵌套容器的实现、内存校验、内存动态管理导入等,并提出了采用记录哈希值到哈希桶的内存存储结构,加快了共享内存容器的插入查找速度。

    一种面向政府领域新词自动发现的实现方法、分析模型及其系统

    公开(公告)号:CN111476025B

    公开(公告)日:2021-01-08

    申请号:CN202010133406.2

    申请日:2020-02-28

    Abstract: 本发明提供一种面向政府领域新词自动发现的实现方法、分析模型及其系统,所述方法包括:对网络信息去除杂数据后得到纯文本,通过HanLP分词器对纯文本进行分词获得带有词性的单词集合,对单词集合进行常用词、垃圾词的初步过滤,对过滤结果进行单词多元匹配形成组合词汇,根据组合规则判断词性,运用TF/IDF算法统计词频得到加权分数,根据分数进行筛选和专家鉴定形成最优规则,系统依据最优规则进行循环训练和全文模式匹配后输出目标结果得到分析模型。本技术将多元匹配规则、智能过滤、加权统计、规则判断和专家鉴定技术相融合,收录大量专业词典,借鉴语言学家研究成果,形成了最优的分析模型从而输出新的词汇,有效提高了新词发现效率和新词识别的准确性,同时可查询到具有更高语义专指度的复合词,提升了政府网站新词发现的专业度和准确性。

Patent Agency Ranking