用于改善机器学习模型泛化能力的合成训练数据生成

    公开(公告)号:CN114155402A

    公开(公告)日:2022-03-08

    申请号:CN202110965176.0

    申请日:2021-08-20

    Abstract: 本发明题为“用于改善机器学习模型泛化能力的合成训练数据生成”。本发明提供了促进合成训练数据生成以实现改善的机器学习泛化能力的系统和技术。在各种实施方案中,元素增强部件可基于带注释的源图像生成一组带注释的初步训练图像。在各个方面,可通过将至少一个感兴趣元素或至少一个背景元素插入到带注释的源图像中来形成带注释的初步训练图像。在各种情况下,模态增强部件可基于该组带注释的初步训练图像生成一组带注释的中间训练图像。在各种情况下,可通过改变带注释的初步训练图像的至少一个基于模态的特性来形成带注释的中间训练图像。在各个方面,几何增强部件可基于该组带注释的中间训练图像生成一组带注释的可部署训练图像。在各种情况下,可通过改变带注释的中间训练图像的至少一个几何特性来形成带注释的可部署训练图像。在各种实施方案中,训练部件可在该组带注释的可部署训练图像上训练机器学习模型。

Patent Agency Ranking