-
公开(公告)号:CN119669763A
公开(公告)日:2025-03-21
申请号:CN202411836060.7
申请日:2024-12-13
Applicant: 开普云信息科技股份有限公司
IPC: G06F18/214 , G06N3/044 , G06N3/08 , G06N3/0499 , G06N3/006 , G06Q10/04 , G06Q50/26 , G06Q40/00 , G06Q50/40
Abstract: 本申请公开了一种特定人员的聚集场所模型的训练方法、装置、介质及设备,属于机器学习技术领域。获取特定人群的金融行为特征、交通行为特征和地理区域特征;根据金融行为特征和交通行为特征生成第一训练集,训练样本包括第一时段内的金融行为特征和交通行为特征、第二时段内的金融行为特征和交通行为特征,第二时段晚于第一时段;根据第一训练集训练RNN模型;根据金融行为特征、交通行为特征和地理区域特征生成第二训练集,训练样本包括金融行为特征、交通行为特征、地理区域特征以及标注信息,标注信息表示特定人员在某个时间出现在某个地理区域内的某个聚集场所的概率;根据第二训练集训练PSO‑ELM模型,以提高预测的准确率。
-
公开(公告)号:CN116843515A
公开(公告)日:2023-10-03
申请号:CN202310626537.8
申请日:2023-05-30
Applicant: 开普云信息科技股份有限公司
Abstract: 本申请公开了一种跨语种的专利文本检索方法、装置、存储介质及设备,属于数据处理技术领域。所述方法包括:获取输入的第一查询文本;利用转换模型将第一查询文本转换为第二查询文本,第一查询文本是基于第一语言的文本,第二查询文本是基于第二语言的文本;利用BERT模型从分类号库中筛选与第二查询文本相似的多个IPC分类号;利用BERT模型从专利文本库中筛选与多个IPC分类号对应的多篇专利文本,专利文本是基于第二语言的文本;利用BERT模型对第二查询文本和多篇专利文本进行检索,得到检索结果。本申请可以先进行语种转换,再利用IPC分类号对专利文本进行初选,以缩小专利文本的检索范围,从而提高了检索效率。
-
公开(公告)号:CN114896362A
公开(公告)日:2022-08-12
申请号:CN202210398933.5
申请日:2022-04-15
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/194 , G06F40/211 , G06F40/295 , G06Q50/18
Abstract: 本申请公开了一种专利文本的相似度分析方法、装置、存储介质及设备,属于机器学习技术领域。方法包括:从第一专利文本和第二专利文本中提取n个片段组,每个片段组中的两个片段分别来自于两个专利文本中相同的段落;获取分析模型,其包括模型参数相同的n个K‑BERT模型;利用每个K‑BERT模型,将从特定领域筛选的领域命名实体的三元组分别注入到n个片段组中,得到n个句子树;利用每个K‑BERT模型分别对每个句子树进行处理,并输出第一专利文本和第二专利文本的相似度。本申请可以结合特定领域知识进行分析,且三元组的质量较高,避免产生知识噪声,还可以处理n个片段组以提取出更多的核心特征,提高了相似度分析的准确性。
-
公开(公告)号:CN114444470A
公开(公告)日:2022-05-06
申请号:CN202210081976.0
申请日:2022-01-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/211 , G06F40/295 , G06K9/62
Abstract: 本申请公开了一种专利文本中的领域命名实体识别方法、装置、介质及设备,属于计算机技术领域。所述方法包括:获取训练数据,训练数据中包含多篇专利文本的至少一个字段和已经标注好的领域命名实体;利用训练数据对BART预训练模型进行训练;根据预设的Prompt模板和训练数据生成Prompt数据,其中,Prompt模板是针对同一专利领域中领域命名实体的特点创建的,且不同专利领域的Prompt模板不同;利用Prompt数据对训练后的BART模型进行调优,得到领域命名实体识别模型;利用领域命名实体识别模型识别各个专利文本中的领域命名实体。本申请既降低了专利文本中的领域命名实体的识别难度,也提高了识别的准确率。
-
公开(公告)号:CN112257419A
公开(公告)日:2021-01-22
申请号:CN202011227890.1
申请日:2020-11-06
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/216 , G06F40/30 , G06F40/242 , G06F40/289 , G06K9/62 , G06F16/33
Abstract: 本发明提供一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质,对专利数据库中的所有文献进行词袋统计和词向量计算,得到对应的词袋数据和词距离数据;建立模型,输入内容或考题号,在题库数据中获取待审专利的标题、摘要、权利要求书、说明书进行多种组合,并分别根据词袋算法和语义算法进行粗选和细选,针对选择后数据进行文本相似度分析,将分析结果融合排序得到综合相似度,经查重筛选,给出待查专利的可疑答案集合。本发明提升了检索速度,采用两轮筛选,第一轮粗选旨在快速缩小对比范围,第二轮细选旨在兼顾提高准确率;可以有效节省人力和时间,帮助专利审查员缩减相关专利审查范围,提高审查效率。
-
公开(公告)号:CN112150806A
公开(公告)日:2020-12-29
申请号:CN202010919837.1
申请日:2020-09-04
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
Abstract: 本发明提供基于SUMO分析模型的单路口信号灯最优配时实现方法、控制装置、电子设备及存储介质,方法包括:建立单路口SUMO分析模型;采集车辆在车道上的位置和速度数据,代入跟车模型运用模拟退火算法进行计算,得到单路口最优配时解决方案;采集路口间车流量数据,代入SUMO分析模型进行实时信号周期配时,动态地修改调整单路口最优配时解决方案;建立固定配时方案并进行比较;定量分析得到全局最优配时解决方案。本发明关键技术是对于车辆流动的整体数学建模,数学建模的准确与否直接影响最终效果。建模过程采用了实时分析的方法,更精确的计算出每秒每个车辆的速度和位置情况,实时计算出一个信号周期内全局的最优配时解决方案。
-
公开(公告)号:CN108989427B
公开(公告)日:2019-07-16
申请号:CN201810795450.2
申请日:2018-07-20
Applicant: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
Abstract: 本发明通过对多源异构系统的结构进行接口分析、接口采集、接口数据封装、提供多源数据聚合服务,多聚合数据进行展示,构建一个基于多源信息聚合的公共服务系统,系统可以提供多数据源的一键注册,复杂流程简洁化,低成本聚合第三方服务,快速集成,提高服务分类及检索的效率,并且提供网络动态代理机制,高效地保证服务的快速响应,很好的解决了数据孤岛、信息孤岛、数据碎片化的问题。
-
公开(公告)号:CN119862545A
公开(公告)日:2025-04-22
申请号:CN202411836063.0
申请日:2024-12-13
Applicant: 开普云信息科技股份有限公司
IPC: G06F18/27 , G06F18/213 , G06F17/18 , G06Q50/26 , G06N20/00
Abstract: 本申请公开了一种重点人员的守信评价模型的训练方法、装置、介质及设备,属于深度学习技术领域。获取大量重点人员的个人数据,个人数据中的直接量化数据包括人口学统计数据、家庭与社会背景数据、经济数据;间接量化数据包括社交数据、特定行为数据、心理和认知数据、管理表现数据;将直接量化数据量化成特征;利用大语言模型将间接量化数据量化成特征;利用基尼系数的计算公式对特征进行计算,得到第一数值;利用卡方检验的计算公式对特征进行计算,得到第二数值;根据第一数值和第二数值训练守信评价模型的模型参数。本申请能使用大语言模型量化数据,并根据基尼系数和卡方检验确定守信评价模型的模型参数,提高模型的准确率。
-
公开(公告)号:CN119336908A
公开(公告)日:2025-01-21
申请号:CN202411386146.4
申请日:2024-09-30
Applicant: 开普云信息科技股份有限公司
IPC: G06F16/35 , G06F18/241 , G06F40/16
Abstract: 本申请公开了一种基于CBOW和skip‑gram词向量的多层级多分类文本分类方法。本方法构建了包含多层级标签的专利文本数据集,为后续分类提供丰富的标注数据;利用CBOW模型对文本进行预处理,生成词频向量,降低数据维度并提取关键信息。然后通过BiLSTM网络对词频向量进行聚合,捕捉文本中的长距离依赖关系,并使用skip‑gram模型提取文本的语义特征,最后将BiLSTM和skip‑gram生成的文本表示向量进行加权平均,得到文本的最终表示,用于训练多层级分类模型。该技术通过结合上下文信息和语义信息,有效提高了文本分类的精度,提高了分类效率。
-
公开(公告)号:CN114757168B
公开(公告)日:2025-01-17
申请号:CN202210079245.2
申请日:2022-01-24
Applicant: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC: G06F40/232 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种文本纠错模型的训练方法、设备、介质及产品,所述方法包括如下步骤:通过获取样本文本列表,对样本文本列表中任一样本文本进行切分处理,得到样本片段;将任一样本片段输入至预设的文本纠错模型中,获取第一损失函数值和第二损失函数值并基于一损失函数值和第二损失函数值,获取总损失函数值;能够以总损失函数值对文本纠错模型进行调整,直到文本纠错模型进行收敛,进而提高了文本纠错模型对文本纠错准确性,在保证对文本进行正确纠错的同时,减少所述纠错模型对文本的错误纠错和增强对正确文本的复制,从而减少文本纠错时的误报。
-
-
-
-
-
-
-
-
-