模型参数调整方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN116644791A

    公开(公告)日:2023-08-25

    申请号:CN202210134765.9

    申请日:2022-02-14

    Abstract: 本申请提供了一种模型参数调整方法、装置、设备及计算机可读存储介质;方法包括:获取训练好的预训练模型和所述训练好的预训练模型的待调整参数的第一参数维度;获取训练好的第一网络模型和预训练好的参数调整向量;其中,参数调整向量的参数个数小于待调整参数的参数个数;基于目标任务和训练好的第一网络模型对预训练好的参数调整向量继续训练,得到训练好的参数调整向量;基于训练好的第一网络模型和训练好的参数调整向量确定待调整参数的调整值;基于待调整参数的调整值对训练好的预训练模型的参数进行调整,得到所述目标任务对应的训练好的目标模型。通过本申请,能够提高模型参数的调整效率。

    机器翻译模型生成方法和装置
    82.
    发明公开

    公开(公告)号:CN116522963A

    公开(公告)日:2023-08-01

    申请号:CN202310369491.6

    申请日:2023-04-07

    Applicant: 清华大学

    Abstract: 本发明提供一种机器翻译模型生成方法和装置,包括:获取训练数据;基于预存的深度神经网络利用训练数据训练得到机器翻译模型;机器翻译模型用于将待翻译文本翻译为文本译文;机器翻译模型包括存储器增强适配器层、第一存储器和第二存储器;存储器增强适配器层用于在第一存储器和/或第二存储器中检索信息并加以利用;第一存储器用于保存训练数据经反向翻译及前向计算处理后得到的源语言数据;第二存储器用于保存训练数据经反向翻译及前向计算处理后得到的目标语言数据。本发明把训练数据以模型可以接受的形式保存,执行翻译任务时从中读取信息对模型进行辅助,实现兼顾较低的算法时间复杂度和较好的模型表现的同时,适应多种翻译场景的效果。

    多源端机器翻译方法及装置
    83.
    发明公开

    公开(公告)号:CN116187352A

    公开(公告)日:2023-05-30

    申请号:CN202211612530.2

    申请日:2022-12-14

    Applicant: 清华大学

    Abstract: 本发明提供一种多源端机器翻译方法及装置,其中的方法包括:基于预先训练的多源机器翻译模型,根据待翻译的多源端语句,结合每一源端对应的预先训练的编码器附加参数,获取编码器输入数据;根据所述多源机器翻译模型中的编‑解码器,对所述编码器输入数据依次进行编码处理和解码处理,得到目标端语句。该方法通过在多源机器翻译模型的编‑解码器中添加编码器附加参数和解码器对应的附加前缀参数,训练时该多源机器翻译模型中的其他参数被固定,只需要对编码器附加参数和附加前缀参数进行训练,能够有效减少训练的参数量,降低训练成本,并且,通过提升附加参数模块的可组合性,能有效提升多源机器翻译的翻译效果。

    一种立柱式人体温度自动测量机器人及测量方法

    公开(公告)号:CN111337134B

    公开(公告)日:2023-04-07

    申请号:CN202010137189.4

    申请日:2020-03-02

    Applicant: 清华大学

    Abstract: 一种立柱式人体温度自动测量机器人及测量方法,包括传动装置、可伸缩机构、测温架、测温装置、基座、摄像机和连接件;传动装置固定安装在基座上,可伸缩机构的一端与传动装置转动连接,另一端与连接件的一端可枢转连接或固接;连接件的另一端与测温架固定连接,测温架上可拆卸地安装了至少一个测温装置。本发明可自动对进入各种办公楼、商场、小区、餐厅、酒店、医院、考场、火车站、航站楼、公共汽车站、地铁站等入口的人员以及高速路口等重要交通关卡的通行车辆内人员进行体温测量,避免了人员间的直接接触进而降低了交叉感染风险,并显著提高测量效率。该机器人测量的部位是衣物覆盖的手腕脉搏区域表皮,能代表人体的真实体温,测量数据准确度高。

    基于遮挡感知的无监督光场视差估计系统及方法

    公开(公告)号:CN114511609B

    公开(公告)日:2022-09-02

    申请号:CN202210407317.1

    申请日:2022-04-18

    Applicant: 清华大学

    Abstract: 本申请涉及图像处理技术领域,特别涉及一种基于遮挡感知的无监督光场视差估计系统及方法,其中,系统包括:神经网络输入模块,用于从光场图像的多个方向输入子孔径图像;特征提取模块,用于采用权重共享的空间特征金字塔结构提取每个方向的子孔径图像的不同尺度特征;特征融合模块,用于采用注意力机制分别对每个方向的子孔径的不同尺度特征进行特征融合,得到多个特征融合后的图像特征;视差回归模块,用于将多个特征融合后的图像特征映射到视差图像,得到预测视差图,并基于预测视差图得到无监督光场视差估计结果。由此,解决了相关技术中光场视差精度差、效率低的问题,从而在保证精度的情况下快速收敛,提升光场视差估计的精度与效率。

    基于遮挡感知的无监督光场视差估计系统及方法

    公开(公告)号:CN114511609A

    公开(公告)日:2022-05-17

    申请号:CN202210407317.1

    申请日:2022-04-18

    Applicant: 清华大学

    Abstract: 本申请涉及图像处理技术领域,特别涉及一种基于遮挡感知的无监督光场视差估计系统及方法,其中,系统包括:神经网络输入模块,用于从光场图像的多个方向输入子孔径图像;特征提取模块,用于采用权重共享的空间特征金字塔结构提取每个方向的子孔径图像的不同尺度特征;特征融合模块,用于采用注意力机制分别对每个方向的子孔径的不同尺度特征进行特征融合,得到多个特征融合后的图像特征;视差回归模块,用于将多个特征融合后的图像特征映射到视差图像,得到预测视差图,并基于预测视差图得到无监督光场视差估计结果。由此,解决了相关技术中光场视差精度差、效率低的问题,从而在保证精度的情况下快速收敛,提升光场视差估计的精度与效率。

    一种基于六维力信号的机器人遥操作方法和装置

    公开(公告)号:CN114310974A

    公开(公告)日:2022-04-12

    申请号:CN202111517093.1

    申请日:2021-12-08

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于六维力信号的机器人遥操作方法和装置,其中,该方法包括:使用遥控器采集遥操作六维力信号,其中遥控器至少包含力矩传感器;利用滤波算法对六维力信号进行滤波;对过滤后的六维力信号进行限幅处理,求得机器人在笛卡尔空间中的末端速度,以及计算求得机器人的关节角速度;根据控制器实时系统的指令下发周期,结合当前机器人的关节位置,将关节角速度积分计算得到关节期望位置,下发给各关节驱动器,各关节驱动器通过位置控制的方式,实现对机器人的遥操作。本发明利用六维力信号直接对应机器人末端在笛卡尔空间中的位姿,操作机器人的移动,对力信号有抗干扰和限幅的作用,且可以对遥操作调速,使遥操作更稳定、简单和直观。

Patent Agency Ranking