基于表格型数据生成文本的方法、装置、设备及存储介质

    公开(公告)号:CN111651970B

    公开(公告)日:2022-07-22

    申请号:CN202010675938.9

    申请日:2020-07-14

    Applicant: 华侨大学

    Abstract: 本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。

    基于表格型数据生成文本的方法、装置、设备及存储介质

    公开(公告)号:CN111651970A

    公开(公告)日:2020-09-11

    申请号:CN202010675938.9

    申请日:2020-07-14

    Applicant: 华侨大学

    Abstract: 本发明提供一种基于表格型数据生成文本的方法、装置、设备及存储介质,包括:构建数据特征表示空间,其中,所述数据特征表示空间包括记录编码层、内容选择层以及内容规划层,以实现层次化的特征表示;通过训练特征表示空间到输出向量的映射关系,构建深度生成网络;构建表格型数据到文本的生成模型;基于所述生成模型将输入的待转换的表格型数据转换为文本输出。本发明将基于层次化结构的数据特征表示与深度生成的文本生成技术融合,能够对整个表格型数据中的每条样本数据记录进行理解与推理,能够实现将结构化数据转换为全局语义连贯长文本,丰富了输入数据推理方式与输出文本表达多样性,有效提升数据到文本生成模型中BLEU与PPL等性能评测指标。

Patent Agency Ranking