-
公开(公告)号:CN117633156A
公开(公告)日:2024-03-01
申请号:CN202311660975.2
申请日:2023-12-05
Applicant: 中国农业银行股份有限公司
Abstract: 本发明实施例公开了一种多源数据的查询方法、装置、设备及存储介质。该方法包括:获取目标系统发送的查询请求;其中所述查询请求包括查询语句、查询条件及多个目标数据源;对所述查询语句进行分词处理,获得多个查询词;将所述多个查询词分别输入类目分析模型,获得各查询词的类目分析结果;基于所述类目分析结果确定各所述目标数据源的查询权重;基于所述查询权重、所述查询语句及所述查询条件从所述多个目标数据源中查询目标数据,并将所述目标数据返回至所述目标系统。根据各目标数据源的查询权重、查询语句和查询条件从多个目标数据源中查询目标数据,能够提高多源数据的查询速率及准确率。
-
公开(公告)号:CN114595410A
公开(公告)日:2022-06-07
申请号:CN202210294037.4
申请日:2022-03-24
Applicant: 中国农业银行股份有限公司
IPC: G06F16/955 , G06F16/958 , G06F16/953
Abstract: 本申请公开了一种网页解析方法、系统及电子设备,从待采集网页列表中确定第一待采集网页,确定第一待采集网页的地址信息,待采集网页列表中包括多个待采集网页,每个待采集网页对应一个地址信息;基于第一待采集网页的地址信息确定第一待采集网页的特性信息,基于第一待采集网页的特性信息确定符合特性信息的采集模式,基于采集模式采集第一待采集网页的网页信息,解析并存储网页信息。
-
公开(公告)号:CN112699098A
公开(公告)日:2021-04-23
申请号:CN202011640278.7
申请日:2020-12-31
Applicant: 中国农业银行股份有限公司
Abstract: 本申请实施例公开了一种索引数据迁移方法、装置及设备,先获取待迁移索引数据的目标字段数据段,对目标字段数据段进行切分,得到多个待处理任务数据段;再建立与待处理任务数据段对应的待执行迁移任务,根据待执行迁移任务确定待迁移队列;从待迁移队列中获取目标迁移任务,根据目标迁移任务获取目标任务数据段;最后,将目标任务数据段分配至目标线程;调用目标线程根据目标任务数据段,从原始索引数据库中获取待迁移索引数据;通过目标线程将待迁移索引数据写入目标索引数据库。如此,通过多线程和分布式架构,可以提高迁移索引数据的迁移效率。部分线程迁移出现问题时不会影响到其他线程的迁移过程。在保证了容错性的基础上,提高迁移效率。
-
公开(公告)号:CN119669439A
公开(公告)日:2025-03-21
申请号:CN202411747871.X
申请日:2024-11-29
Applicant: 中国农业银行股份有限公司
IPC: G06F16/334 , G06F16/35 , G06N3/047 , G06N3/092 , G06N3/094
Abstract: 本申请实施例提供了一种防御对抗样本攻击的方法、系统及存储介质,用于增强对抗样本攻击的防御效果,所述方法包括:获取组合不确定性表达式;所述组合不确定性表达式为对神经网络模型的认知不确定性和偶然不确定性进行组合的表达式;基于所述组合不确定性表达式进行模型训练,得到对抗样本检测模型;在接收到待搜索文本时,将所述待搜索文本输入至所述对抗样本检测模型,确定待搜索文本类型;所述待搜索文本类型包括:正常文本和非正常文本;若所述待搜索文本类型为所述非正常文本,则拒绝搜索请求。
-
公开(公告)号:CN114691834A
公开(公告)日:2022-07-01
申请号:CN202210355598.0
申请日:2022-04-06
Applicant: 中国农业银行股份有限公司
IPC: G06F16/33 , G06F16/2453 , G06F40/284 , G06F40/237
Abstract: 本申请提供了同义词检索方法和装置,方法包括:获取来自第一应用系统的查询语句;从同义词缓存维护的若干应用系统分别对应的同义词列表中,确定第一应用系统对应的同义词列表,作为目标同义词列表;从目标同义词列表中获取检索词对应的同义词和同义词权重,并根据检索词、检索词对应的同义词和同义词权重,生成新的查询语句;基于新的查询语句和第一应用系统对应的索引信息,对第一应用系统上的信息进行检索。本申请在同义词缓存中维护同义词列表,从而在建立索引时仅需针对分词器词库中包含的每个词建立索引信息即可,节省了索引信息占用的磁盘空间,并且基于同义词权重能够区分原词与同义词的重要程度,且提高了检索结果的召回率。
-
公开(公告)号:CN112699098B
公开(公告)日:2024-08-02
申请号:CN202011640278.7
申请日:2020-12-31
Applicant: 中国农业银行股份有限公司
Abstract: 本申请实施例公开了一种索引数据迁移方法、装置及设备,先获取待迁移索引数据的目标字段数据段,对目标字段数据段进行切分,得到多个待处理任务数据段;再建立与待处理任务数据段对应的待执行迁移任务,根据待执行迁移任务确定待迁移队列;从待迁移队列中获取目标迁移任务,根据目标迁移任务获取目标任务数据段;最后,将目标任务数据段分配至目标线程;调用目标线程根据目标任务数据段,从原始索引数据库中获取待迁移索引数据;通过目标线程将待迁移索引数据写入目标索引数据库。如此,通过多线程和分布式架构,可以提高迁移索引数据的迁移效率。部分线程迁移出现问题时不会影响到其他线程的迁移过程。在保证了容错性的基础上,提高迁移效率。
-
公开(公告)号:CN112632083A
公开(公告)日:2021-04-09
申请号:CN202011640212.8
申请日:2020-12-31
Applicant: 中国农业银行股份有限公司
Abstract: 本申请实施例公开了一种实现索引数据更新的方法、装置及设备,先接收用户终端发送的待写入索引数据,选取一个备用索引库作为待写入索引库,备用索引库是未提供服务的索引库。将待写入索引库的索引库信息发送至集群节点,以便集群节点根据索引库信息确定待写入索引库;将待写入索引数据传输至集群节点。控制集群节点将待写入索引数据写入待写入索引库中。最后,若完成本次待写入索引数据的更新,将待写入索引库切换为提供服务的索引库。从而实现在不影响搜索引擎的查询性能的基础上,减少对不同的更新需要的索引数据进行更新的复杂程度。基于获取用户终端发送的待写入索引数据,可以实现对索引数据的自动触发更新,提高了索引数据的更新效率。
-
公开(公告)号:CN114691834B
公开(公告)日:2025-04-15
申请号:CN202210355598.0
申请日:2022-04-06
Applicant: 中国农业银行股份有限公司
IPC: G06F16/3332 , G06F16/2453 , G06F40/284 , G06F40/237
Abstract: 本申请提供了同义词检索方法和装置,方法包括:获取来自第一应用系统的查询语句;从同义词缓存维护的若干应用系统分别对应的同义词列表中,确定第一应用系统对应的同义词列表,作为目标同义词列表;从目标同义词列表中获取检索词对应的同义词和同义词权重,并根据检索词、检索词对应的同义词和同义词权重,生成新的查询语句;基于新的查询语句和第一应用系统对应的索引信息,对第一应用系统上的信息进行检索。本申请在同义词缓存中维护同义词列表,从而在建立索引时仅需针对分词器词库中包含的每个词建立索引信息即可,节省了索引信息占用的磁盘空间,并且基于同义词权重能够区分原词与同义词的重要程度,且提高了检索结果的召回率。
-
公开(公告)号:CN114328521A
公开(公告)日:2022-04-12
申请号:CN202111605264.6
申请日:2021-12-24
Applicant: 中国农业银行股份有限公司
Abstract: 本申请实施例提供一种索引库的更新方法及装置,该方法包括:接收终端设备发送的索引库的更新文件,更新文件中包含有索引库的全量更新数据;将写入索引库设置为默认索引库并在写入索引库中写入索引库的全量更新数据;在索引库的全量更新数据成功写入该写入索引库后,将检索数据源由查询索引库切换为写入索引库;其中,写入索引库在写入索引库的全量更新数据前为空索引库,查询索引库中包含更新前的原始索引数据。通过该方式,在写入索引库更新索引库的全量更新数据时,使用原有的查询索引库提供查询服务,从而避免了在索引库更新时对于查询性能的影响。
-
公开(公告)号:CN112632083B
公开(公告)日:2024-07-09
申请号:CN202011640212.8
申请日:2020-12-31
Applicant: 中国农业银行股份有限公司
Abstract: 本申请实施例公开了一种实现索引数据更新的方法、装置及设备,先接收用户终端发送的待写入索引数据,选取一个备用索引库作为待写入索引库,备用索引库是未提供服务的索引库。将待写入索引库的索引库信息发送至集群节点,以便集群节点根据索引库信息确定待写入索引库;将待写入索引数据传输至集群节点。控制集群节点将待写入索引数据写入待写入索引库中。最后,若完成本次待写入索引数据的更新,将待写入索引库切换为提供服务的索引库。从而实现在不影响搜索引擎的查询性能的基础上,减少对不同的更新需要的索引数据进行更新的复杂程度。基于获取用户终端发送的待写入索引数据,可以实现对索引数据的自动触发更新,提高了索引数据的更新效率。
-
-
-
-
-
-
-
-
-