-
公开(公告)号:CN111368078B
公开(公告)日:2024-07-09
申请号:CN202010129552.8
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/279 , G06N3/045
Abstract: 本申请公开了一种模型训练的方法,包括:获取待训练文本;获取待训练文本中每个词语所对应的第一深度标签;基于每个词语的词嵌入,通过文本分类模型中的深度值分类器获取每个词语所对应的深度概率分布向量;基于每个词语所对应的第二深度标签以及每个词语所对应的词嵌入,通过文本分类模型获取类别概率分布向量;根据待训练文本所对应的真实分类标签、类别概率分布向量、第一深度标签以及深度概率分布向量,采用目标损失函数对文本分类模型的模型参数进行更新。本申请还公开了一种基于人工智能的文本分类方法。本申请可以独立预测每个词语对应的深度值,而不会受到下游任务类型和数据集的干扰,从而提升模型的鲁棒性。
-
公开(公告)号:CN116663575A
公开(公告)日:2023-08-29
申请号:CN202210141490.1
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F40/44 , G06F40/211 , G06F40/284 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本申请提供了一种视频对话的翻译方法、装置、设备、存储介质及程序产品;方法包括:获取视频的对话文本,从对话文本中获取待翻译语句;从视频中提取与待翻译语句同步的图像;对图像和待翻译语句进行第一编码处理,得到与待翻译语句对应的多模态上下文,其中,多模态上下文包括待翻译语句中的每个词分别对应的多模态词向量;基于多模态上下文进行解码处理,得到待翻译语句中每个词的翻译结果;其中,待翻译语句中的后序词是根据前序词的翻译结果、以及多模态上下文中后序词对应的多模态词向量进行解码处理得到。通过本申请能够有效提高视频对话翻译的准确性。
-
公开(公告)号:CN116663574A
公开(公告)日:2023-08-29
申请号:CN202210141138.8
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F40/205 , G06F40/284 , G06V20/50 , G06V10/40 , G06V10/80
Abstract: 本申请提供一种多模态对话翻译方法、装置、电子设备及存储介质,涉及计算机技术领域。在基于源语言获取到待翻译对话文本和历史对话文本后,可以确定待翻译对话文本和历史对话文本之间的上下文关系,以及发言对象的对话表达特征,并分别对待翻译对话文本对应的至少一个场景图像进行特征提取,得到相应的图像特征集合,将上下文关系、对话表达特征和图像特征集合进行融合,得到多模态对话特征,并基于目标语言对多模态对话特征进行翻译,获得目标翻译对话文本。由于引入了相应的场景图像,并从场景图像中提取出有效的图像信息,从而可以得到更加准确的目标翻译文本,且得到的目标翻译文本能更好地切合当前的对话场景。
-
公开(公告)号:CN116663571A
公开(公告)日:2023-08-29
申请号:CN202210142644.9
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例提供了一种翻译方法、装置、电子设备以及计算机可读存储介质,涉及人工智能、自然语言处理、多媒体及云技术领域。该方法包括:获取源语言的待翻译文本,通过训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;该翻译模型是通过以下方式训练得到的:获取包括源语言的第一文本和第一文本对应于目标语言的第二文本的多个训练样本;根据每个样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定每个样本对应的训练损失权重;基于多个样本及其对应的训练损失权重对初始神经网络模型进行迭代训练得到翻译模型。基于该方法,能够有效提升翻译效果。
-
公开(公告)号:CN111444338A
公开(公告)日:2020-07-24
申请号:CN202010129518.0
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/126 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种文本处理、装置、存储介质及设备,属于人工智能技术领域。方法包括:获取待处理文本,对待处理文本执行向量化处理得到共享特征向量;分别对共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的第二编码处理和与方面级别情感分类任务对应的第三编码处理,依次得到第一特征向量、第二特征向量和第三特征向量;基于第一特征向量、第二特征向量和第三特征向量执行信息传递处理,信息传递处理是指在任意上述两两任务间进行双向特征信息传递;基于信息传递处理后得到的特征向量,对待处理文本进行方面词抽取和方面级别的情感极性分类。本申请显著提升了情感分析效果。
-
公开(公告)号:CN117763135A
公开(公告)日:2024-03-26
申请号:CN202211122113.X
申请日:2022-09-15
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/34 , G06F16/54 , G06F16/957 , G06N3/0464 , G06N3/047 , G06N3/08 , G06V10/40 , G06V10/82
Abstract: 提供了摘要模型训练方法、摘要生成方法、计算设备和介质。摘要模型用于生成文本摘要,所述训练方法包括:获取训练数据集,所述训练数据集包括的每个训练数据包括文本样本、图片样本以及对应的摘要样本,对于每个训练数据,基于所述训练数据包括的文本样本和图片样本得到第一预测输出,并且基于所述训练数据包括的图片样本得到第二预测输出;以及基于每个训练数据对应的第一预测输出和第二预测输出,对所述摘要模型进行训练。经该训练方法训练后的摘要模型可以结合文本和图片比较精准地生成摘要。
-
公开(公告)号:CN117271759A
公开(公告)日:2023-12-22
申请号:CN202211024211.X
申请日:2022-08-24
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/34 , G06F40/126 , G06F40/194 , G06F18/25 , G06N3/0499 , G06N3/0455 , G06N3/084
Abstract: 本申请涉及一种文本摘要生成模型训练方法、文本摘要生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将训练文本和对应的训练图像集合输入初始文本摘要生成模型,得到预测文本摘要,基于预测文本摘要和标签文本摘要之间的差异生成目标损失;将训练文本对应的掩码训练数据和第一训练数据输入初始文本摘要生成模型,得到掩码预测数据,基于掩码标签数据和掩码预测数据之间的差异生成重构损失;基于目标损失和重构损失调整初始文本摘要生成模型的模型参数,直至满足收敛条件,得到目标文本摘要生成模型;目标文本摘要生成模型用于生成文本的文本摘要。采用本方法能够提高模型的预测准确性,提高生成的文本摘要的质量。
-
公开(公告)号:CN116681091A
公开(公告)日:2023-09-01
申请号:CN202210161770.9
申请日:2022-02-22
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例提供了一种生成对抗样本的方法、装置、设备、存储介质及程序产品,涉及人工智能领域,应用场景包括但不限于机器翻译等场景。该方法包括:获取待翻译的源文本和源文本对应的目标文本;确定源文本对应的待识别对抗样本,以及目标文本对应的待识别对抗样本;基于源文本和源文本对应的待识别对抗样本,确定第一相似度下降率;并基于源文本、目标文本和目标文本对应的待识别对抗样本,确定第二相似度下降率;若第一相似度下降率大于预设第一相似度下降率阈值,且第二相似度下降率小于预设第二相似度下降率阈值,则确定源文本对应的待识别对抗样本为源文本的对抗样本,以及目标文本对应的待识别对抗样本为目标文本的对抗样本。
-
公开(公告)号:CN116663572A
公开(公告)日:2023-08-29
申请号:CN202210143195.X
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/49 , G06F40/45 , G06F40/58 , G06N3/0499 , G06N3/08
Abstract: 本申请公开了数据处理方法、装置、计算机设备及计算机可读存储介质,应用于计算机技术领域。该方法包括:获取待处理数据序列;调用数据转换模型对待处理数据序列进行处理,得到待处理数据序列中各个待处理数据对应的目标数据,该数据转换模型对应的训练样本包括源词序列以及对应的目标词序列,该数据转换模型是基于训练样本以及目标词序列中的每个目标词的对齐偏置进行训练得到的,该对齐偏置为每个目标词相对于源词序列中对应源词的偏移数据;输出各个待处理数据对应的目标数据。本申请可以应用于同步机器翻译等各种数据转换场景,能够提高数据转换的准确性。
-
公开(公告)号:CN116644762A
公开(公告)日:2023-08-25
申请号:CN202210138704.X
申请日:2022-02-15
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/42 , G06F18/25 , G06F18/2413 , G06F18/2415 , G06N3/047 , G06N3/08
Abstract: 本申请实施例公开了一种翻译模型训练方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取样本数据集合;调用待训练的翻译模型,基于第一历史语句,对第一样本语句进行翻译,得到第一样本语句对应的第一翻译语句,基于翻译模型的第一损失函数和第一翻译语句,确定第一梯度参数;调用辅助模型,基于样本数据集合中的辅助历史语句进行处理,得到辅助模型的输出结果,基于辅助模型的第二损失函数和辅助模型的输出结果,确定第二梯度参数;基于第一梯度参数和第二梯度参数,更新翻译模型对应的模型参数。该方法能够增强翻译模型所翻译出的翻译语句与位于该翻译语句之前的语句之间的连贯性,从而提高了翻译模型的准确性。
-
-
-
-
-
-
-
-
-