用于数据增强的方法、设备和计算机程序产品
Abstract:
本公开的实施例涉及用于数据增强的方法、设备和计算机程序产品。该方法包括基于非结构化文档中的图像,生成图像嵌入,并且基于非结构化文档中的与图像相关联的文本,生成文本嵌入。该方法还包括基于所生成的图像嵌入和文本嵌入,从存储库中获取描述性信息。该方法还包括将所获取的描述性信息添加到非结构化文档中。以此方式,不仅能够跨模态地理解和分析非结构化文档,还能够利用非结构化文档中的多模态数据的表征来丰富非结构化文档,从而提高数据数量和多样性。
Patent Agency Ranking
0/0