-
公开(公告)号:CN116415569B
公开(公告)日:2024-08-13
申请号:CN202310442988.6
申请日:2023-04-14
Applicant: 华润数字科技有限公司
IPC: G06F40/232 , G06F40/30 , G06F18/22 , G06N3/0455 , G06N3/0442
Abstract: 本申请实施例提供了一种文本纠错方法和装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取包括:待纠错字符和待纠错字符的原始字音信息、原始字形信息、原始语义信息和相关词窗口的待纠错文本;将原始字音信息、原始字形信息分别输入至预训练语言模型进行编码得到原始字音嵌入向量、原始字形嵌入向量;根据原始字音嵌入向量、原始字形嵌入向量和原始语义信息构建原始上下文信息向量;根据原始字音嵌入向量、原始字形嵌入向量和原始上下文信息向量构建原始字符键;根据原始字符键、相关词窗口在字符字典中进行字符筛选处理,得到选定字符;将待纠错字符替换为选定字符得到目标文本。本申请实施例能够提高文本纠错精度。
-
公开(公告)号:CN116645624A
公开(公告)日:2023-08-25
申请号:CN202310212067.0
申请日:2023-02-27
Applicant: 华润数字科技有限公司 , 广东润联信息技术有限公司
IPC: G06V20/40 , G06V10/56 , G06V10/762 , G06V10/74
Abstract: 本申请实施例提供了一种视频内容理解方法和系统、计算机设备、存储介质,属于人工智能技术领域。该方法包括:获取初始视频、初始视频的视频标题文本和初始视频的发布属性信息;对初始视频进行视频镜头分割处理,得到候选镜头视频;对候选镜头视频进行关键帧提取处理,得到关键帧图像;根据预设的目标检测模型对关键帧图像进行目标信息检测处理,得到目标关键信息;根据预先训练的文本提取模型对关键帧图像进行文本信息提取,得到文本关键信息;对视频标题文本进行关键词抽取,得到目标关键词。本申请实施例能够提高对视频内容理解的准确率和识别效率。
-
公开(公告)号:CN116415569A
公开(公告)日:2023-07-11
申请号:CN202310442988.6
申请日:2023-04-14
Applicant: 华润数字科技有限公司
IPC: G06F40/232 , G06F40/30 , G06F18/22 , G06N3/0455 , G06N3/0442
Abstract: 本申请实施例提供了一种文本纠错方法和装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取包括:待纠错字符和待纠错字符的原始字音信息、原始字形信息、原始语义信息和相关词窗口的待纠错文本;将原始字音信息、原始字形信息分别输入至预训练语言模型进行编码得到原始字音嵌入向量、原始字形嵌入向量;根据原始字音嵌入向量、原始字形嵌入向量和原始语义信息构建原始上下文信息向量;根据原始字音嵌入向量、原始字形嵌入向量和原始上下文信息向量构建原始字符键;根据原始字符键、相关词窗口在字符字典中进行字符筛选处理,得到选定字符;将待纠错字符替换为选定字符得到目标文本。本申请实施例能够提高文本纠错精度。
-
公开(公告)号:CN116186243A
公开(公告)日:2023-05-30
申请号:CN202310001249.3
申请日:2023-01-03
Applicant: 华润数字科技有限公司
IPC: G06F16/34 , G06F40/289 , G06F40/211 , G06N3/047 , G06N3/048 , G06N3/092
Abstract: 本发明实施例提供文本摘要生成方法、装置、设备和存储介质,涉及人工智能技术领域。该方法利用语句权重模型获取目标语句的语句贡献度,然后根据语句贡献度选取用于生成文本摘要的语句集合,使得文本摘要模型更倾向于利用贡献度高语句生成文本摘要,提高生成的文本摘要的准确度,克服了相关技术中在进行文本摘要生成时不考虑语句的先验信息,选择冗长的或者信息量低的句子作为文本摘要,导致文本摘要的准确度较低的问题。
-
公开(公告)号:CN117787220A
公开(公告)日:2024-03-29
申请号:CN202311768374.3
申请日:2023-12-20
Applicant: 华润数字科技有限公司 , 华润数字科技(成都)有限公司
IPC: G06F40/16 , G06F40/126 , G06F16/332
Abstract: 本申请实施例提供大语言模型训练方法、文本生成方法和相关装置,涉及人工智能技术领域。该方法利用大语言模型得到包含位置标记的问答对的第一标记向量和第一答案向量,再利用位置标记得到掩码问答句,得到掩码问答句的第二标记向量和第二答案向量;根据第一标记向量和第二标记向量计算第一损失值,根据第一答案向量和第二答案向量计算第二损失值,从而根据损失值得到目标大语言模型。将问答句的位置标记融入编码器的表达过程实现对比学习,在损失函数中融入位置信息,将问答对的生成结果进行对齐,捕捉问题与答案之间的映射关系,在整体上进行指令微调,提升大语言模型在指令遵循方面的能力,提升大语言模型的文本生成准确率。
-
公开(公告)号:CN116432705A
公开(公告)日:2023-07-14
申请号:CN202310312753.5
申请日:2023-03-20
Applicant: 华润数字科技有限公司
IPC: G06N3/0455 , G06N3/047 , G06N3/0475 , G06N3/0985 , G06F40/216 , G06F40/284 , G06F18/22
Abstract: 本申请实施例提供了一种文本生成模型构建、文本生成方法和装置、设备及介质,属于人工智能技术领域。方法包括:获取并将原始文本序列和重复文本序列输入至包括编码器、解码器、重复感知网络和全连接层的文本生成模型;通过编码器对原始文本序列进行编码得到文本向量序列;通过解码器对文本向量序列和重复文本序列进行解码得到候选文本序列;通过重复感知网络对候选文本序列进行重复字识别得到预测文本序列;通过全连接层对预测文本序列进行归一化得到预测字符概率序列;对预测字符概率序列和参考文本序列进行损失计算得到目标损失数据;根据目标损失数据对文本生成模型的参数调整。本申请实施例构建生成重复内容少的文本生成模型。
-
公开(公告)号:CN116362234A
公开(公告)日:2023-06-30
申请号:CN202310123940.9
申请日:2023-02-03
Applicant: 华润数字科技有限公司
IPC: G06F40/279 , G06F40/216
Abstract: 本发明实施例提供汉字词向量生成方法、装置、设备和存储介质,涉及人工智能技术领域。该方法包括:对初始汉字进行汉字结构拆解得到字形树,根据字形树最下层级的第一偏旁结构计算第一叶子节点的第一向量以及根据第二偏旁结构计算第二节点的第二向量;根据最下层级的第一向量、第二向量和父节点的字形向量计算得到上一个层级的第二向量,按照层级自下而上的顺序,基于每一层级的第一向量和第二向量逐层计算得到根节点向量,得到初始汉字的词向量。基于二叉树对初始汉字进行汉字拆解,得到汉字对应的偏旁结构,对偏旁结构进行向量编码,降低词嵌入矩阵的参数,提升词向量生成效率。同时融合汉字本身的结构形态信息,提高词向量蕴含的信息量。
-
公开(公告)号:CN116311205A
公开(公告)日:2023-06-23
申请号:CN202310212915.8
申请日:2023-02-27
Applicant: 华润数字科技有限公司 , 广东润联信息技术有限公司
IPC: G06V20/62 , G06V30/14 , G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0442
Abstract: 本申请提供了一种车牌识别方法、车牌识别装置、电子设备及存储介质,属于人工智能技术领域,通过获取目标车辆的初始车牌图像,初始车牌图像包括目标车辆的车牌,计算初始车牌图像中车牌的长宽比,得到车牌长宽比数据,根据车牌长宽比数据确定车牌的车牌类型,车牌类型包括双行车牌,若车牌类型为双行车牌,则对初始车牌图像进行裁剪,得到第一中间车牌图像和第二中间车牌图像,对第一中间车牌图像和第二中间车牌图像进行图像拼接,得到目标车牌图像,对目标车牌图像进行特征提取,得到第一车牌特征图,将第一车牌特征图输入至预设的双向长短时记忆网络进行车牌识别,得到车牌的车牌信息,提高了对双行车牌进行车牌识别的准确性。
-
公开(公告)号:CN115905512A
公开(公告)日:2023-04-04
申请号:CN202211696681.0
申请日:2022-12-28
Applicant: 华润数字科技有限公司
IPC: G06F16/34 , G06F16/35 , G06F40/268 , G06F40/295 , G06N3/126
Abstract: 本申请实施例涉及文本处理技术领域,特别涉及一种抽取式文本摘要生成方法、装置、设备及存储介质。本申请将句子中有效的信息特征作为选择摘要句子的重要指标,然后通过遗传算法迭代训练的方式得到文本摘要,减少了需要通过训练得到文本摘要的开销,也提升了摘要生成的准确性和客观程度,在实践中具有更好的适用性。
-
公开(公告)号:CN119962642A
公开(公告)日:2025-05-09
申请号:CN202510025150.6
申请日:2025-01-07
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06N5/022 , G06N3/042 , G06N3/048 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种大模型推理方法,包括以下步骤:S100)获取一语言模式提示;和S200)根据所述语言模式提示预测一响应结果的长度和逻辑结构。如果步骤S200预测到所述响应结果的长度大于一预设长度且所述响应结果的逻辑结构为金字塔结构,则进行以下步骤:S300)构建所述响应结果的金字塔主干,运用段落树并行解码技术生成所述响应结果的多个金字塔次要分支,以生成所述响应结果;如果步骤S200预测到所述响应结果的长度小于等于所述预设长度或所述响应结果的逻辑结构非金字塔结构,则进行以下步骤:S400)通过块并行解码技术生成所述响应结果。
-
-
-
-
-
-
-
-
-