-
公开(公告)号:CN119091429A
公开(公告)日:2024-12-06
申请号:CN202411197357.3
申请日:2024-08-29
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06V20/62 , G06V30/16 , G06V30/146 , G06V10/56 , G06V10/82
Abstract: 本申请实施例提供了一种卡证文本识别方法、装置及电子设备,属于图像检测领域。该方法包括:获取目标卡证图像;对目标卡证图像进行预处理,得到预处理卡证图像;预处理包括边缘处理、图像分割及矫正处理的至少一种;根据卡证文本标识类型对预处理卡证图像进行文本识别。本申请实施例对卡证图像进行边缘检测、图像分割以及矫正处理中的至少一种操作,可以生成边缘清晰、连续和/或矫正后的卡证图像,有助于后续提高卡证文本识别的准确率;并根据不同的卡证文本标识类型进行卡证文本识别,能够针对不同卡证文本标识类型识别出卡证文本,提高了卡证文本识别的准确率。
-
公开(公告)号:CN116384339B
公开(公告)日:2024-07-02
申请号:CN202310366987.8
申请日:2023-04-04
Applicant: 华润数字科技有限公司
IPC: G06F40/126 , G06F40/216 , G06F40/166 , G06N3/084 , G06N3/092 , G06N3/0455
Abstract: 本申请实施例涉及自然语言处理技术领域,特别涉及一种文本生成领域的解码方法、装置、设备及介质,不同于top‑k通过固定窗口采样,本方法在解码器每个解码的时间步内,不再是选取固定长度的词作为解码时的候选集合,而是选择那些出现概率超过概率阈值的词作为候选集合,候选集合内包含着核心词,确保解码词还是从头部候选词中进行筛选,而且随着每次时间步的解码词的概率分布不同,概率阈值也可进行动态调整,候选词集合的大小会动态变化,这样不仅能够保证解码后生成的文本的连贯,也能够实现较好的文本多样性。
-
公开(公告)号:CN117093688A
公开(公告)日:2023-11-21
申请号:CN202311024993.1
申请日:2023-08-14
Applicant: 华润数字科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N3/048 , G06N3/08
Abstract: 本申请提供了一种问答方法、问答装置、电子设备及存储介质,属于人工智能技术领域,通过获取问题数据,基于问题数据对多个预设的候选回答动作进行动作选取,得到目标回答动作,执行目标回答动作,得到与问题数据匹配的初始答案数据,将初始答案数据发送给预设对象,并接收预设对象根据初始答案数据反馈的第一动作评分数据,通过预设强化学习网络对目标回答动作进行动作评分,得到第二动作评分数据,根据第一动作评分数据和第二动作评分数据调整目标回答动作,得到目标答案数据,能够提高生成答案的准确性。
-
公开(公告)号:CN116415598A
公开(公告)日:2023-07-11
申请号:CN202310367067.8
申请日:2023-04-04
Applicant: 华润数字科技有限公司
IPC: G06F40/58 , G06F40/279 , G06F16/36 , G06F16/33 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本发明实施例提供文本翻译方法、装置、设备和存储介质,涉及人工智能技术领域。该方法首先得到初始文本的第一文本特征向量,然后对初始文本进行实体识别得到实体信息构建的实体集,再利用实体信息映射到目标知识图谱的映射实体得到实体特征向量,接着获取掩码后得到的第二文本特征向量,根据实体特征向量和第二文本特征向量生成输入向量信息后,将输入向量信息送入输入翻译模型得到翻译文本。利用知识图谱引入丰富的结构化信息,消除实体信息的歧义后,将文本嵌入的文本特征和经过知识图谱映射之后的实体特征结合起来作为文本翻译的输入特征,从而在翻译过程中更好地学习到文本的完整语义表示,进而提升文本翻译的结果准确率。
-
公开(公告)号:CN116384339A
公开(公告)日:2023-07-04
申请号:CN202310366987.8
申请日:2023-04-04
Applicant: 华润数字科技有限公司
IPC: G06F40/126 , G06F40/216 , G06F40/166 , G06N3/084 , G06N3/092 , G06N3/0455
Abstract: 本申请实施例涉及自然语言处理技术领域,特别涉及一种文本生成领域的解码方法、装置、设备及介质,不同于top‑k通过固定窗口采样,本方法在解码器每个解码的时间步内,不再是选取固定长度的词作为解码时的候选集合,而是选择那些出现概率超过概率阈值的词作为候选集合,候选集合内包含着核心词,确保解码词还是从头部候选词中进行筛选,而且随着每次时间步的解码词的概率分布不同,概率阈值也可进行动态调整,候选词集合的大小会动态变化,这样不仅能够保证解码后生成的文本的连贯,也能够实现较好的文本多样性。
-
公开(公告)号:CN116070627A
公开(公告)日:2023-05-05
申请号:CN202310025477.4
申请日:2023-01-09
Applicant: 华润数字科技有限公司
IPC: G06F40/289 , G06F40/284 , G06N20/00 , G06F16/332
Abstract: 本申请实施例提供了一种基于自然语言处理的联邦学习方法、装置、电子设备及计算机可读存储介质,方法包括:对本地自然语言模型进行初始化处理;在接收到第二训练参与节点发送过来的消息报文符合预设策略的情况下,向第二训练参与节点反馈回答消息;接收第二训练参与节点响应于回答消息发送过来的第一梯度信息,其中,第一梯度信息由第二训练参与节点根据第一本地数据训练而得到;根据第一梯度消息对本地自然语言模型的网络参数进行更新处理。通过上述技术方案,可以避免传统联邦学习的消息拥塞的问题,提高了联邦学习的训练效率。
-
公开(公告)号:CN116050423A
公开(公告)日:2023-05-02
申请号:CN202211537050.4
申请日:2022-12-02
Applicant: 华润数字科技有限公司
IPC: G06F40/30 , G06F40/295 , G06N3/0455
Abstract: 本申请实施例提供了一种信息抽取方法、系统、电子设备及存储介质,属于自然语言处理技术领域。信息抽取方法包括:获取输入信息,输入信息包括待抽取文本;将待抽取文本输入到预先训练后的信息抽取模型中,根据不同的信息抽取任务类型对待抽取文本进行编码,得到第一编码数据;在信息抽取模型中对第一编码数据进行解码,解码得到多个语义单元,并根据多个语义单元建立待抽取文本的第一统一格式结构信息;从第一统一格式结构信息中确定待抽取文本的信息抽取结果。本申请中可以通过一个模型实现多种不同的信息抽取任务,能够提高系统的通用性,降低信息抽取的成本和难度。
-
-
-
-
-
-