-
公开(公告)号:CN119474428A
公开(公告)日:2025-02-18
申请号:CN202411482279.1
申请日:2024-10-23
Applicant: 开普云信息科技股份有限公司 , 青岛智能产业技术研究院
Abstract: 本申请公开了一种大数据超图网络建模方法、装置、计算机设备和产品,旨在解决现有技术中处理知识产权的大规模数据时,效率和准确性难以兼顾的问题,同时针对知识产权数据高增量、高时效、多模态的特点,通过对已经通过的知识产权类文件进行分析归纳,根据相应的专业进行分类,建立相应的知识产权文本库;利用BERT算法模型构建基于知识产权的文字语料库,对相应类别的图像信息进行胶囊图神经网络处理,获取图像对象及其文本属性的相互关系,构建图像数据库;利用图卷积神经网络的特性,捕捉文本中复杂的关联特性;构建超图神经网络模型。提出了一种能够处理高增量、高时效、多模态数据的大数据超图网络建模方法。
-
公开(公告)号:CN119397371A
公开(公告)日:2025-02-07
申请号:CN202411432290.7
申请日:2024-10-14
Applicant: 开普云信息科技股份有限公司 , 青岛智能产业技术研究院
IPC: G06F18/2411 , G06F18/213 , G06F18/25 , G06N3/042 , G06N3/08
Abstract: 本申请公开了融合图卷积神经网络和胶囊图神经网络的多模态分类方法,解决如何将人工智能技术应用在外观专利上的问题。通过利用BERT对专利文本序列编码,利用PCNN分段语义图卷积,利用语法图卷积构造依赖树,进行交互注意与关系分类,最后通过胶囊网络进行图像特征提取。本发明研究融合异质多模态信息的外观专利分类技术,解决文字、图像、网络等多模态信息的特征提取和融合问题,构建异质多模态的外观设计专利分类模型,实现相对于单纯文本内容在分类准确率上的较大提升。同时在知识产权超图网络的基础上构建外观设计专利AI标准数据集,填补传统洛迦诺分类体系中专利类型的空白,从而突破传统外观专利分类方法的瓶颈。
-
公开(公告)号:CN119722099A
公开(公告)日:2025-03-28
申请号:CN202411735292.3
申请日:2024-11-29
Applicant: 开普云信息科技股份有限公司
IPC: G06Q30/018 , G06N5/04
Abstract: 本申请公开了一种特定人员的信用评估模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量特定人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用信用评估模型获取各个维度的特征阈值,根据特征阈值将每个维度的特征划分为正样本和负样本,根据正负样本计算WOE值和IV值,将最大IV值对应的特征阈值作为模型参数。本申请能使用大语言模型量化数据,并根据WOE值和IV值确定信用评估模型的模型参数,提高模型的准确率。
-
公开(公告)号:CN117436927A
公开(公告)日:2024-01-23
申请号:CN202311764691.8
申请日:2023-12-21
Applicant: 开普云信息科技股份有限公司
IPC: G06Q30/0201 , G06N20/00 , G06Q50/06
Abstract: 本申请公开了一种虚拟电厂调峰市场价格预测方法及系统。本方法首先分析特征贡献度,筛选输入数据;然后利用XGBoost模型预测调峰市场价格,定期更新模型超参数,MAPE指标评估预测精度;最后利用已训练好的XGBoost模型对调峰市场价格进行预测。可以看出,本发明构建调峰市场价格预测模型以筛选过的预测数据为输入,为实时调峰报价提供先决条件,保证虚拟电厂报价满足调峰调度电价要求。
-
公开(公告)号:CN115757827A
公开(公告)日:2023-03-07
申请号:CN202211452940.5
申请日:2022-11-21
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F16/36 , G06F40/284 , G06F40/289 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本申请公开了一种专利文本的知识图谱创建方法、装置、存储介质及设备,属于机器学习技术领域。方法包括:获取中医药领域的多篇专利文本中的字段,字段包括发明名称、摘要、权利要求书和说明书;利用训练好的实体提取模型从字段中提取实体,实体提取模型是基于Sentence‑BERT‑BiGRU‑CRF创建并训练的;基于整体概念‑成分概念以及物体概念‑效果概念的语言规则,从字段中提取实体和关系;基于实体提取模型提取到的实体以及语言规则提取到的实体和关系创建知识图谱。本申请通过实体识别模型提高了识别出实体的准确率;通过语言规则提取实体和关系,提高了知识获取的覆盖度,扩充了知识图谱的规模。
-
公开(公告)号:CN114090799B
公开(公告)日:2022-07-26
申请号:CN202111404155.8
申请日:2021-11-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F16/383 , G06F16/33 , G06F16/338 , G06F16/31 , G06F16/36
Abstract: 本申请公开了一种文本检索方法、装置、存储介质及服务器,属于数据检索技术领域。所述方法包括:获取待检索的第一专利文本的第一词袋组合和第一专利信息;获取专利数据库中每个第二专利文本的第二词袋组合和第二专利信息;根据第一词袋组合、第二词袋组合和词条的IPC权重,筛选与第一专利文本相似的n个第二专利文本,得到粗选集;根据第一词袋组合、粗选集中的第二词袋组合、各个词条之间的余弦距离和IPC权重,从粗选集中筛选与第一专利文本相似的m个第二专利文本,得到细选集;根据第一专利信息与第二专利信息的匹配度,对细选集中的各个第二专利文本的排序进行调整,得到检索结果。本申请可以提高检索效率和准确率。
-
公开(公告)号:CN114092743A
公开(公告)日:2022-02-25
申请号:CN202111405840.2
申请日:2021-11-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06V10/764 , G06V10/74 , G06V10/766 , G06V10/82 , G06V10/25 , G06V40/16 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本申请公开了一种敏感图片的合规性检测方法、装置、存储介质及设备,属于图片处理技术领域。所述方法用于合规性检测网络中,所述合规性检测网络中包括目标检测网络和至少一个检测分支,每个检测分支对应于一种合规性检测策略;包括:获取待检测的敏感图片;利用所述目标检测网络,从所述敏感图片中识别出敏感区域和敏感类别,所述敏感区域中包含敏感目标,所述敏感类别是所述敏感目标所属的类别;从所述至少一个检测分支中选择与所述敏感类别对应的目标检测分支;利用所述目标检测分支的合规性检测策略检测所述敏感图片是否合规。本申请可以实现对敏感图片的合规性检测,且可以提高检测的准确性。
-
公开(公告)号:CN112256457A
公开(公告)日:2021-01-22
申请号:CN202011227889.9
申请日:2020-11-06
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
Abstract: 本发明提供一种基于共享内存的数据载入加速方法、装置、电子设备及存储介质,属于数据处理技术领域。所述方法应用于服务器,方法包括:将共享内存用作默认的内存池,在共享内存中创建对象并命名,使用带偏移量的智能指针指向共享内存,导出偏移地址到文件,在共享内存中创建动态数组(Vector)和容器(Map),构建自定义哈希容器(Customized Hashmap),加载创建好的内存对象,实现不同进程间的数据通讯。本发明自定义了一套基于共享内存的哈希容器,在数据静态使用方式的前提下又做了一系列优化,实现了其它数据载入方式不具备、但在实际工程应用时不可或缺的功能,如多类型支持、嵌套容器的实现、内存校验、内存动态管理导入等,并提出了采用记录哈希值到哈希桶的内存存储结构,加快了共享内存容器的插入查找速度。
-
公开(公告)号:CN111476025B
公开(公告)日:2021-01-08
申请号:CN202010133406.2
申请日:2020-02-28
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/284 , G06F40/247 , G06F16/951 , G06Q50/26
Abstract: 本发明提供一种面向政府领域新词自动发现的实现方法、分析模型及其系统,所述方法包括:对网络信息去除杂数据后得到纯文本,通过HanLP分词器对纯文本进行分词获得带有词性的单词集合,对单词集合进行常用词、垃圾词的初步过滤,对过滤结果进行单词多元匹配形成组合词汇,根据组合规则判断词性,运用TF/IDF算法统计词频得到加权分数,根据分数进行筛选和专家鉴定形成最优规则,系统依据最优规则进行循环训练和全文模式匹配后输出目标结果得到分析模型。本技术将多元匹配规则、智能过滤、加权统计、规则判断和专家鉴定技术相融合,收录大量专业词典,借鉴语言学家研究成果,形成了最优的分析模型从而输出新的词汇,有效提高了新词发现效率和新词识别的准确性,同时可查询到具有更高语义专指度的复合词,提升了政府网站新词发现的专业度和准确性。
-
公开(公告)号:CN112149523A
公开(公告)日:2020-12-29
申请号:CN202010919839.0
申请日:2020-09-04
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
Abstract: 本发明提供基于深度学习和并查集算法的OCR识别并抽取图片的方法、装置、电子设备及存储介质,属于图片处理技术领域。所述方法应用于服务器,方法包括:采用深度学习算法对图片进行OCR处理,得到文本信息BOX;运用并查集分类算法对文本信息进行抽取,得到段落分类;筛选后得到纯文本段落;利用OpenCV对纯文本段落做白色BOX覆盖,得到TMP格式图片;做像素横纵扫描找到分割线并切分,抽取出最终图片。本技术将深度学习算法与并查集分类算法相融合,通过深度学习算法实现了OCR对图片文本的高效识别,通过并查集分类算法提高了OpenCV对图片的精准切割,大大提高了OCR识别和抽取图像的准确性和正确率。
-
-
-
-
-
-
-
-
-