Invention Publication
- Patent Title: 用于数据增强的方法、设备和计算机程序产品
-
Application No.: CN202311332977.9Application Date: 2023-10-13
-
Publication No.: CN119832562APublication Date: 2025-04-15
- Inventor: 倪嘉呈 , 何斌 , 王子嘉 , 贾真
- Applicant: 戴尔产品有限公司
- Applicant Address: 美国得克萨斯州
- Assignee: 戴尔产品有限公司
- Current Assignee: 戴尔产品有限公司
- Current Assignee Address: 美国得克萨斯州
- Agency: 北京市金杜律师事务所
- Agent 成城
- Main IPC: G06V30/19
- IPC: G06V30/19 ; G06V30/40 ; G06V10/82

Abstract:
本公开的实施例涉及用于数据增强的方法、设备和计算机程序产品。该方法包括基于非结构化文档中的图像,生成图像嵌入,并且基于非结构化文档中的与图像相关联的文本,生成文本嵌入。该方法还包括基于所生成的图像嵌入和文本嵌入,从存储库中获取描述性信息。该方法还包括将所获取的描述性信息添加到非结构化文档中。以此方式,不仅能够跨模态地理解和分析非结构化文档,还能够利用非结构化文档中的多模态数据的表征来丰富非结构化文档,从而提高数据数量和多样性。
Information query