-
公开(公告)号:CN119885120A
公开(公告)日:2025-04-25
申请号:CN202411918869.4
申请日:2024-12-23
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06F21/16 , G06F40/216 , G06F40/237 , G06F40/284
Abstract: 本发明提供一种文本水印生成方法,包括以下步骤:S100)生成一水印私钥和一包括多个稀疏标记词的稀疏词汇表;S200)利用大语言模型随机采样技术生成或扩展一文本;S300)随机采样过程中实时检测该文本中的词元,直至该文本中开始出现该稀疏词汇表中的稀疏标记词,则进行以下步骤:S400)随机种子生成器基于该水印私钥生成可验证随机种子;和S500)传递该可验证随机种子至多个水印函数,以通过竞技场评分算法选出符合水印要求的词元作为水印词元嵌入该文本;其中步骤S500后继续进行步骤S200,直至遇到结束符或者超过上下文窗口限制。
-
公开(公告)号:CN119886358A
公开(公告)日:2025-04-25
申请号:CN202510063650.9
申请日:2025-01-15
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06N5/04 , G06N3/045 , G06N3/08 , G06F40/284 , G06F40/12
Abstract: 本发明实施例提供一种智能问答方法、装置、设备及存储介质,该方法包括:对待答文本进行分词处理,得到待答文本对应的序号向量;将待答文本对应的序号向量输入到智能问答模型中,得到回复文本,其中,智能问答模型由问题样本进行训练得到,智能问答模型包括嵌入层、自注意力层和解码层,自注意力层的自注意力计算方式根据嵌入层对所述问题样本对应的序号向量的输出表征和解码层对问题样本的序号向量的输出表征确定。本发明实施例中通过引入嵌入层和解码层的信息到自注意力计算中,不仅加强了层与层之间的信息交流,还使得智能问答模型能够更全面地理解上下文信息,因此智能问答模型能更加深入地理解上下文,从而提高回复文本的准确度和连贯度。
-
公开(公告)号:CN118658105B
公开(公告)日:2024-11-26
申请号:CN202411125358.7
申请日:2024-08-16
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06V20/40 , G06N3/0464 , G06N3/082 , G06N5/04 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本申请提供了一种视频理解方法、装置、计算机设备及计算机可读存储介质,属于图像处理技术领域。视频理解方法方法包括:通过空间金字塔模型确定待理解视频中每一帧图像在多个空间尺度上的表观特征;通过时序金字塔模型对所述待理解视频中至少部分图像在所述多个空间尺度上的表观特征进行分组处理,得到所述待理解视频的多个行为时序关系;所述多个行为时序关系各自的时间尺度不同;对所述多个行为时序关系进行融合,得到所述待理解视频的理解结果。通过采用本申请能够对视频内容进行更加高效和准确的理解。
-
公开(公告)号:CN118658105A
公开(公告)日:2024-09-17
申请号:CN202411125358.7
申请日:2024-08-16
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06V20/40 , G06N3/0464 , G06N3/082 , G06N5/04 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本申请提供了一种视频理解方法、装置、计算机设备及计算机可读存储介质,属于图像处理技术领域。视频理解方法方法包括:通过空间金字塔模型确定待理解视频中每一帧图像在多个空间尺度上的表观特征;通过时序金字塔模型对所述待理解视频中至少部分图像在所述多个空间尺度上的表观特征进行分组处理,得到所述待理解视频的多个行为时序关系;所述多个行为时序关系各自的时间尺度不同;对所述多个行为时序关系进行融合,得到所述待理解视频的理解结果。通过采用本申请能够对视频内容进行更加高效和准确的理解。
-
公开(公告)号:CN119962642A
公开(公告)日:2025-05-09
申请号:CN202510025150.6
申请日:2025-01-07
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06N5/022 , G06N3/042 , G06N3/048 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种大模型推理方法,包括以下步骤:S100)获取一语言模式提示;和S200)根据所述语言模式提示预测一响应结果的长度和逻辑结构。如果步骤S200预测到所述响应结果的长度大于一预设长度且所述响应结果的逻辑结构为金字塔结构,则进行以下步骤:S300)构建所述响应结果的金字塔主干,运用段落树并行解码技术生成所述响应结果的多个金字塔次要分支,以生成所述响应结果;如果步骤S200预测到所述响应结果的长度小于等于所述预设长度或所述响应结果的逻辑结构非金字塔结构,则进行以下步骤:S400)通过块并行解码技术生成所述响应结果。
-
公开(公告)号:CN119886092A
公开(公告)日:2025-04-25
申请号:CN202411923207.6
申请日:2024-12-23
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06F40/186 , G06N3/045
Abstract: 本申请提供一种提示模板自动优化方法,用于优化完成一任务的一原始任务提示模板。该提示模板自动优化方法包括以下步骤:S100)修改该原始任务提示模板,以得到一修改后的任务提示模板;S200)优化该修改后的任务提示模板前面的连续提示符,以得到优化连续提示符,其中使用随机线性投影将所述原始任务提示模板的空间投影到一个比所述原始任务提示模板的空间更小的子空间上,然后在所述子空间中使用无导数的优化器来解决所述连续提示符的最优化问题;和S300)结合所述优化连续提示符与所述修改后的任务提示模板,输入大语言模型,以得到一优化提示模板。
-
公开(公告)号:CN119862854A
公开(公告)日:2025-04-22
申请号:CN202411852595.3
申请日:2024-12-16
Applicant: 华润数字科技有限公司 , 华润智算科技(广东)有限公司
IPC: G06F40/126 , G06F40/216
Abstract: 本发明实施例公开了一种文本对象的编码方法、装置、计算机设备以及存储介质。涉及文本处理技术领域,主要目的在于解决文本对象编码效率低导致的文本处理模型训练效果差的问题。包括:获取文本标识符序列;确定所述文本标识符序列中各标识符对以及目标文本对象;基于所述标识符对确定与所述目标文本对象对应的相邻对数以及非相邻对数,并基于所述相邻对数以及所述非相邻对数对所述目标文本对象进行编码,得到编码信息。
-
公开(公告)号:CN114781611B
公开(公告)日:2025-05-06
申请号:CN202210423601.8
申请日:2022-04-21
Applicant: 华润数字科技有限公司
Abstract: 本申请涉及人工智能技术领域,揭露了自然语言处理方法、语言模型训练方法及其相关设备,所述语言模型训练方法包括:获取语料集;利用多种特征提取模型对语料集进行特征提取,得到语料集中各文档对应的多个特征向量;基于各文档对应的多个特征向量,得到各文档对应的语义向量;将语料集中各文档对应的语义向量利用聚类模型进行聚类,得到多个语义簇;根据各语义簇分别对语言模型采用强化学习进行训练,最终得到各语义簇对应的训练后的语言模型的参数;根据各语义簇对应的训练后的语言模型的参数,以确定最终语言模型。本申请实现了提高语言模型的训练效率以及降低了训练过程中的资源消耗。
-
公开(公告)号:CN114781395B
公开(公告)日:2025-04-11
申请号:CN202210433528.2
申请日:2022-04-24
Applicant: 华润数字科技有限公司
IPC: G06F40/30 , G06N3/084 , G06N3/0985 , G06N3/045 , G06N3/092
Abstract: 本申请涉及人工智能技术,揭露了一种词向量维度的确定方法、装置、设备及存储介质,所述方法包括获取基础词向量;基于第一子词向量,确定初始词向量及维度;利用初始词向量,进行自然语言处理任务,得到各任务的第一性能指标;根据第二子词向量进行强化学习训练,得到本轮训练增加的第一维度,根据第一维度与初始词向量对应的维度,确定第一词向量,利用第一词向量,进行自然语言处理任务,得到各任务的第二性能指标,根据第一性能指标与第二性能指标的关系,给予奖励;根据奖励更新总奖励值,通过进行多轮训练直至所述总奖励值收敛,得到总奖励值收敛时最后一轮训练的最终词向量对应的维度。本申请减少了训练开销,并获得表达能力更强的词向量。
-
公开(公告)号:CN114925202B
公开(公告)日:2025-02-25
申请号:CN202210524671.2
申请日:2022-05-13
Applicant: 华润数字科技有限公司
Abstract: 本申请属于人工智能领域,涉及一种文本分类方法、装置、计算机设备及存储介质,方法包括:分割训练文本得到多个语义块;将各语义块输入初始分类价值评估模型得到分类价值分数;根据分类价值分数筛选语义块得到语义块队列,再输入初始文本分类模型得到分类预测结果;确定语义块队列中各语义块的语义块标签;基于语义块标签和分类价值分数计算第一损失,基于分类预测结果和训练文本的分类标签计算第二损失;根据第一损失调整初始分类价值评估模型得到分类价值评估模型,根据第二损失调整初始文本分类模型得到文本分类模型;通过分类价值评估模型和文本分类模型对待分类文本进行处理得到文本分类结果。本申请提高了文本分类的准确性。
-
-
-
-
-
-
-
-
-