-
公开(公告)号:CN113626566B
公开(公告)日:2023-07-18
申请号:CN202110763112.2
申请日:2021-07-06
Applicant: 暨南大学
IPC: G06F16/332 , G06F40/211 , G06F40/295 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于合成数据的知识对话跨域学习方法。该方法针对知识对话系统跨域学习时数据资源不充分的问题,提出了以下策略:针对问答,闲聊提出模板和多轮对话生成模型共同构造合成数据方法;针对灾难性遗忘提出知识保留和模板方法构造合成数据方法;为了利用不匹配对话语料,我们提出了使用检索、过滤、排序等方法构建合成数据方法。使用该合成数据训练的模型性能可近似使用人工标注数据进行训练的模型,有效缓解了知识对话系统跨域学习对数据资源的依赖。
-
公开(公告)号:CN113626566A
公开(公告)日:2021-11-09
申请号:CN202110763112.2
申请日:2021-07-06
Applicant: 暨南大学
IPC: G06F16/332 , G06F40/211 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于合成数据的知识对话跨域学习方法。该方法针对知识对话系统跨域学习时数据资源不充分的问题,提出了以下策略:针对问答,闲聊提出模板和多轮对话生成模型共同构造合成数据方法;针对灾难性遗忘提出知识保留和模板方法构造合成数据方法;为了利用不匹配对话语料,我们提出了使用检索、过滤、排序等方法构建合成数据方法。使用该合成数据训练的模型性能可近似使用人工标注数据进行训练的模型,有效缓解了知识对话系统跨域学习对数据资源的依赖。
-