-
公开(公告)号:CN119669763A
公开(公告)日:2025-03-21
申请号:CN202411836060.7
申请日:2024-12-13
Applicant: 开普云信息科技股份有限公司
IPC: G06F18/214 , G06N3/044 , G06N3/08 , G06N3/0499 , G06N3/006 , G06Q10/04 , G06Q50/26 , G06Q40/00 , G06Q50/40
Abstract: 本申请公开了一种特定人员的聚集场所模型的训练方法、装置、介质及设备,属于机器学习技术领域。获取特定人群的金融行为特征、交通行为特征和地理区域特征;根据金融行为特征和交通行为特征生成第一训练集,训练样本包括第一时段内的金融行为特征和交通行为特征、第二时段内的金融行为特征和交通行为特征,第二时段晚于第一时段;根据第一训练集训练RNN模型;根据金融行为特征、交通行为特征和地理区域特征生成第二训练集,训练样本包括金融行为特征、交通行为特征、地理区域特征以及标注信息,标注信息表示特定人员在某个时间出现在某个地理区域内的某个聚集场所的概率;根据第二训练集训练PSO‑ELM模型,以提高预测的准确率。
-
公开(公告)号:CN116843515A
公开(公告)日:2023-10-03
申请号:CN202310626537.8
申请日:2023-05-30
Applicant: 开普云信息科技股份有限公司
Abstract: 本申请公开了一种跨语种的专利文本检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的第一查询文本;利用转换模型将第一查询文本转换为第二查询文本,第一查询文本是基于第一语言的文本,第二查询文本是基于第二语言的文本;利用BERT模型从分类号库中筛选与第二查询文本相似的多个IPC分类号;利用BERT模型从专利文本库中筛选与多个IPC分类号对应的多篇专利文本,专利文本是基于第二语言的文本;利用BERT模型对第二查询文本和多篇专利文本进行检索,得到检索结果。本申请可以先进行语种转换,再利用IPC分类号对专利文本进行初选,以缩小专利文本的检索范围,从而提高了检索效率。
-
公开(公告)号:CN114444470A
公开(公告)日:2022-05-06
申请号:CN202210081976.0
申请日:2022-01-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/211 , G06F40/295 , G06K9/62
Abstract: 本申请公开了一种专利文本中的领域命名实体识别方法、装置、介质及设备,属于计算机技术领域。所述方法包括:获取训练数据,训练数据中包含多篇专利文本的至少一个字段和已经标注好的领域命名实体;利用训练数据对BART预训练模型进行训练;根据预设的Prompt模板和训练数据生成Prompt数据,其中,Prompt模板是针对同一专利领域中领域命名实体的特点创建的,且不同专利领域的Prompt模板不同;利用Prompt数据对训练后的BART模型进行调优,得到领域命名实体识别模型;利用领域命名实体识别模型识别各个专利文本中的领域命名实体。本申请既降低了专利文本中的领域命名实体的识别难度,也提高了识别的准确率。
-
公开(公告)号:CN112257419A
公开(公告)日:2021-01-22
申请号:CN202011227890.1
申请日:2020-11-06
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/242 , G06F40/289 , G06K9/62 , G06F16/33
Abstract: 本发明提供一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质,对专利数据库中的所有文献进行词袋统计和词向量计算,得到对应的词袋数据和词距离数据;建立模型,输入内容或考题号,在题库数据中获取待审专利的标题、摘要、权利要求书、说明书进行多种组合,并分别根据词袋算法和语义算法进行粗选和细选,针对选择后数据进行文本相似度分析,将分析结果融合排序得到综合相似度,经查重筛选,给出待查专利的可疑答案集合。本发明提升了检索速度,采用两轮筛选,第一轮粗选旨在快速缩小对比范围,第二轮细选旨在兼顾提高准确率;可以有效节省人力和时间,帮助专利审查员缩减相关专利审查范围,提高审查效率。
-
公开(公告)号:CN114444470B
公开(公告)日:2022-12-02
申请号:CN202210081976.0
申请日:2022-01-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/211 , G06F40/295 , G06K9/62
Abstract: 本申请公开了一种专利文本中的领域命名实体识别方法、装置、介质及设备,属于计算机技术领域。所述方法包括:获取训练数据,训练数据中包含多篇专利文本的至少一个字段和已经标注好的领域命名实体;利用训练数据对BART预训练模型进行训练;根据预设的Prompt模板和训练数据生成Prompt数据,其中,Prompt模板是针对同一专利领域中领域命名实体的特点创建的,且不同专利领域的Prompt模板不同;利用Prompt数据对训练后的BART模型进行调优,得到领域命名实体识别模型;利用领域命名实体识别模型识别各个专利文本中的领域命名实体。本申请既降低了专利文本中的领域命名实体的识别难度,也提高了识别的准确率。
-
公开(公告)号:CN119862545A
公开(公告)日:2025-04-22
申请号:CN202411836063.0
申请日:2024-12-13
Applicant: 开普云信息科技股份有限公司
IPC: G06F18/27 , G06F18/213 , G06F17/18 , G06Q50/26 , G06N20/00
Abstract: 本申请公开了一种重点人员的守信评价模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量重点人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用基尼系数的计算公式对特征进行计算,得到第一数值;利用卡方检验的计算公式对特征进行计算,得到第二数值;根据第一数值和第二数值训练守信评价模型的模型参数。本申请能使用大语言模型量化数据,并根据基尼系数和卡方检验确定守信评价模型的模型参数,提高模型的准确率。
-
公开(公告)号:CN119005132A
公开(公告)日:2024-11-22
申请号:CN202410989589.6
申请日:2024-07-23
Applicant: 开普云信息科技股份有限公司
Abstract: 本申请公开了一种生成式大模型的质量评估方法、装置、存储介质及设备,属于深度学习技术领域。获取三元组,三元组包括问题、标准答案和生成式大模型生成的待评估答案;对于n个评估维度中的每个评估维度,根据评估维度对应的提示词模板对三元组生成一个提示词,n≥2;利用质量评估模型分别对每个评估维度对应的提示词进行处理,生成每个评估维度对应的一个文本等级,将文本等级转化成对应的评分;对n个评分进行综合计算,得到待评估答案的质量评分,质量评分用于反映生成式大模型生成的答案的质量。本申请能从多个评估维度进行评分,使得最终的质量评估更加稳定和全面,提高了质量评估的准确性。
-
公开(公告)号:CN116843516A
公开(公告)日:2023-10-03
申请号:CN202310626631.3
申请日:2023-05-30
Applicant: 开普云信息科技股份有限公司
IPC: G06Q50/18 , G06F16/332 , G06F16/38 , G06F16/532 , G06F16/58 , G06F18/22
Abstract: 本申请公开了一种基于专利文本的图文检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的查询文本;利用CLIP模型从分类号库中筛选与所述查询文本相似的多个IPC分类号;利用所述CLIP模型从专利图片库中筛选与所述多个IPC分类号对应的多张专利图片;利用所述CLIP模型对所述查询文本和所述多张专利图片进行图文检索,得到检索结果。本申请可以先利用IPC分类号对专利图片进行初选,以缩小专利图片的检索范围,从而提高了检索效率。
-
公开(公告)号:CN112257419B
公开(公告)日:2021-05-28
申请号:CN202011227890.1
申请日:2020-11-06
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/242 , G06F40/289 , G06K9/62 , G06F16/33
Abstract: 本发明提供一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质,对专利数据库中的所有文献进行词袋统计和词向量计算,得到对应的词袋数据和词距离数据;建立模型,输入内容或考题号,在题库数据中获取待审专利的标题、摘要、权利要求书、说明书进行多种组合,并分别根据词袋算法和语义算法进行粗选和细选,针对选择后数据进行文本相似度分析,将分析结果融合排序得到综合相似度,经查重筛选,给出待查专利的可疑答案集合。本发明提升了检索速度,采用两轮筛选,第一轮粗选旨在快速缩小对比范围,第二轮细选旨在兼顾提高准确率;可以有效节省人力和时间,帮助专利审查员缩减相关专利审查范围,提高审查效率。
-
公开(公告)号:CN119722099A
公开(公告)日:2025-03-28
申请号:CN202411735292.3
申请日:2024-11-29
Applicant: 开普云信息科技股份有限公司
IPC: G06Q30/018 , G06N5/04
Abstract: 本申请公开了一种特定人员的信用评估模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量特定人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用信用评估模型获取各个维度的特征阈值,根据特征阈值将每个维度的特征划分为正样本和负样本,根据正负样本计算WOE值和IV值,将最大IV值对应的特征阈值作为模型参数。本申请能使用大语言模型量化数据,并根据WOE值和IV值确定信用评估模型的模型参数,提高模型的准确率。
-
-
-
-
-
-
-
-
-