数据处理方法、装置、系统、介质以及程序产品

    公开(公告)号:CN117827418A

    公开(公告)日:2024-04-05

    申请号:CN202211194263.1

    申请日:2022-09-28

    Abstract: 本公开涉及一种神经网络模型的数据处理方法、装置、系统、介质以及程序产品,神经网络模型包括P个专家模块并且部署于多个节点中,其中第一节点包括第一计算单元,第一计算单元包括神经网络模型中的Q个专家模块,其中Q≤P,该方法包括:第一计算单元获取待处理数据,其中待处理数据包括Q个专家模块的输入数据;将待处理数据分别发送给第一处理资源和第二处理资源;第一处理资源对待处理数据进行切分,得到由第一处理资源上的专家模块进行处理的数据;以及第二处理资源对待处理数据进行切分,得到由第二处理资源上的专家模块进行处理的数据。根据本公开的实施例的数据处理方案,显著减少了处理资源或混合专家系统中数据分发和收集的通信开销和参数冗余,提高了处理效率。

    构建AI集成模型的方法、AI集成模型的推理方法及装置

    公开(公告)号:CN115964632A

    公开(公告)日:2023-04-14

    申请号:CN202110977566.X

    申请日:2021-08-24

    Abstract: 本申请提供了一种构建人工智能(AI)集成模型的方法,包括:获取训练数据集、初始图网络模型和多个基模型,然后利用训练数据集中的训练数据和多个基模型,迭代训练初始图网络模型,获得图网络模型,接着将图网络模型和多个基模型构建为AI集成模型,其中,图网络模型的输入为由多个基模型的输出构成的图结构。由于图网络模型在对图结构进行处理时,会考虑图结构中各节点的邻居节点,因此,图网络模型在对多个基模型的输出进行融合时,充分考虑了各个基模型之间的差异性和相关性,由此根据AI集成模型中的多个基模型和图网络模型获得的特征在用于AI任务的处理时,可以提高AI任务的执行结果的精度。

    一种模型训练方法、图像处理方法及相关装置

    公开(公告)号:CN117437440A

    公开(公告)日:2024-01-23

    申请号:CN202210801213.9

    申请日:2022-07-08

    Abstract: 一种模型训练方法,应用于人工智能领域,能够提高模型的领域泛化能力。该方法中,模型在训练过程中基于输入图像的特征统计信息和其他域的图像的特征统计信息来预测输入图像所在域的特征统计信息,进而基于输入图像所在域的特征统计信息对输入图像进行处理。由于模型在预测特征统计信息的过程中,既考虑了输入图像与其他域的图像之间的共性,还结合了输入图像本身的特征分布独特性,因此模型能够有效地预测得到输入图像所在域的特征分布信息。这样一来,在模型学会预测输入图像所在域的特征分布的基础上,能够基于输入图像所在域的特征分布对输入图像进行处理,有效地提高了模型的领域泛化能力。

    一种翻译系统及其训练、应用方法以及相关设备

    公开(公告)号:CN116796760A

    公开(公告)日:2023-09-22

    申请号:CN202210244066.X

    申请日:2022-03-11

    Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。

Patent Agency Ranking