基于预训练语言模型的上下文敏感的释义生成方法及系统

    公开(公告)号:CN112364639B

    公开(公告)日:2021-09-07

    申请号:CN202011121675.3

    申请日:2020-10-19

    Abstract: 本发明公开了一种基于预训练语言模型的上下文敏感的释义生成方法及系统,该方法包括:获取训练数据集;其中,训练数据集中包括被释义词、被释义词所在的上下文,以及被释义词对应的释义;构建用于为被释义词生成释义的释义模型;其中,释义模型基于编码器‑解码器框架,释义模型的编码器为预训练的语言模型;基于所述训练数据集,对所述释义模型进行训练;通过训练好的释义模型,基于待释义的被释义词和所述待释义的被释义词的上下文的分布式向量表示,生成所述待释义的被释义词的释义。本发明具有逻辑清晰、效率高、准确率高的优点,解决了现有技术无法为被释义词准确生成释义的问题。

    一种基于知识库进行释义生成的方法及系统

    公开(公告)号:CN110287333A

    公开(公告)日:2019-09-27

    申请号:CN201910507994.9

    申请日:2019-06-12

    Abstract: 本发明提供一种基于知识库进行释义生成的方法及系统,包括:获得训练数据集,该训练数据集中包括训练词语和训练词语对应的释义,以及知识库中的知识信息;基于训练数据集,构建用于为待释义词生成释义的释义模型,并对释义模型进行训练;通过训练好的释义模型,基于待释义词的分布式向量表示和知识库中与待释义词相关的知识信息的分布式向量表示,生成待释义词的释义。本发明中的释义模型包含自适应自注意力机制,在生成释义中的每个词时,通过自适应自注意力机制可对知识库中的知识信息进行选择,并判断是否将知识信息应用于当前词的生成。具有逻辑清晰、效率高、准确率高的优点,解决了现有技术无法为词语准确生成释义的问题。

    一种根据关键词生成对应的目标生成句子的方法及装置

    公开(公告)号:CN115965014A

    公开(公告)日:2023-04-14

    申请号:CN202310261875.6

    申请日:2023-03-17

    Abstract: 本发明涉及文本生成技术领域,特别是指一种根据关键词生成对应的目标生成句子的方法及装置。构建初始文本生成模型;获取训练样本,通过训练样本对初始文本生成模型进行训练,得到训练完毕的待评测文本生成模型;基于预设的基线模型,对待评测文本生成模型进行评测,确定通过评测的文本生成模型;获取目标生成句子的关键词以及词汇复杂度等级;将关键词以及词汇复杂度等级输入到文本生成模型中,生成关键词对应的目标生成句子。采用本发明,可以生成词汇复杂度可控且具有较好的流利度和语义一致性的句子文本,提高文本生成的实用性。

    一种基于多任务框架进行简单释义生成的方法与系统

    公开(公告)号:CN114139532B

    公开(公告)日:2022-04-19

    申请号:CN202210113483.0

    申请日:2022-01-30

    Abstract: 本发明公开了一种基于多任务框架进行简单释义生成的方法与系统,所述方法包括:构建训练数据集,所述训练数据集中包含待释义词、待释义词所在上下文的知识信息、待释义词对应的释义以及简单句的知识信息;构建释义生成模型,用于为待释义词生成释义;使用所述训练数据集对所述释义生成模型进行训练;利用训练好的释义生成模型对未包含在所述训练数据集中的待释义词进行释义生成,同时生成复杂释义和简单释义。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有技术在生成释义时没有考虑释义复杂度,不能生成对二语学习者友好的简单释义的问题。

    一种基于多任务框架进行简单释义生成的方法与系统

    公开(公告)号:CN114139532A

    公开(公告)日:2022-03-04

    申请号:CN202210113483.0

    申请日:2022-01-30

    Abstract: 本发明公开了一种基于多任务框架进行简单释义生成的方法与系统,所述方法包括:构建训练数据集,所述训练数据集中包含待释义词、待释义词所在上下文的知识信息、待释义词对应的释义以及简单句的知识信息;构建释义生成模型,用于为待释义词生成释义;使用所述训练数据集对所述释义生成模型进行训练;利用训练好的释义生成模型对未包含在所述训练数据集中的待释义词进行释义生成,同时生成复杂释义和简单释义。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有技术在生成释义时没有考虑释义复杂度,不能生成对二语学习者友好的简单释义的问题。

    用于辅助语言学习的口语对话方法和装置、对话机器人

    公开(公告)号:CN117910481A

    公开(公告)日:2024-04-19

    申请号:CN202410317012.0

    申请日:2024-03-20

    Abstract: 本发明公开了用于辅助语言学习的口语对话方法和装置、对话机器人,属于自然语言处理技术领域,所述方法包括:构建口语对话数据集;构建用于辅助语言学习的对话语言模型;使用所述口语对话数据集对所述对话语言模型进行指令微调,得到目标语言模型;构建用于口语教学任务的智能体框架;为所述智能体框架中各所述智能体设置角色任务;在口语对话过程中,依据所述智能体框架中各智能体对应的角色任务和所述目标语言模型,生成口语对话文本。本发明提供的用于辅助语言学习的口语对话方案,能够提升语言学习效果、灵活使用多种场景的辅助语言学习。

    一种用于多种编辑意图的文本修订方法及装置

    公开(公告)号:CN116484811B

    公开(公告)日:2023-09-19

    申请号:CN202310714039.9

    申请日:2023-06-16

    Abstract: 本发明公开了一种用于多种编辑意图的文本修订方法及装置,涉及自然语言处理技术领域。包括:获取包含多种修订需求且无编辑意图的待修订的句子文本;将句子文本输入到训练好的文本修订任务模型;根据句子文本以及文本修订任务模型进行编辑意图预测,并生成满足多种修订需求的句子文本。本发明具有逻辑清晰、适配性强、准确率高、效率高的优点,妥善解决了现有技术在进行文本修订时只能进行单需求的修订、无法兼顾多种修订意图进行综合修订的问题。

    一种基于增量式片段预测的端到端词汇受限文本生成方法

    公开(公告)号:CN114282515B

    公开(公告)日:2022-07-08

    申请号:CN202210148591.1

    申请日:2022-02-18

    Abstract: 本发明公开了一种基于增量式片段预测的端到端词汇受限文本生成方法,所述方法包括:构建训练数据集,所述训练数据集中包含给定的单个或多个受限词汇和包含所述受限词汇的文本,所述受限词汇也称为关键词;构建词汇受限文本生成模型,用于对给定的关键词生成包含所述关键词的文本;使用所述训练数据集对所述词汇受限文本生成模型进行训练;将训练后的词汇受限文本生成模型应用于给定的任意关键词,生成包含所有给定的任意关键词的文本。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有端到端词汇受限文本生成技术无法保证包含所有关键词的技术问题。

    一种基于增量式片段预测的端到端词汇受限文本生成方法

    公开(公告)号:CN114282515A

    公开(公告)日:2022-04-05

    申请号:CN202210148591.1

    申请日:2022-02-18

    Abstract: 本发明公开了一种基于增量式片段预测的端到端词汇受限文本生成方法,所述方法包括:构建训练数据集,所述训练数据集中包含给定的单个或多个受限词汇和包含所述受限词汇的文本,所述受限词汇也称为关键词;构建词汇受限文本生成模型,用于对给定的关键词生成包含所述关键词的文本;使用所述训练数据集对所述词汇受限文本生成模型进行训练;将训练后的词汇受限文本生成模型应用于给定的任意关键词,生成包含所有给定的任意关键词的文本。本发明具有逻辑清晰、效率高、准确率高的优点,妥善解决了现有端到端词汇受限文本生成技术无法保证包含所有关键词的技术问题。

    一种用于多种编辑意图的文本修订方法及装置

    公开(公告)号:CN116484811A

    公开(公告)日:2023-07-25

    申请号:CN202310714039.9

    申请日:2023-06-16

    Abstract: 本发明公开了一种用于多种编辑意图的文本修订方法及装置,涉及自然语言处理技术领域。包括:获取包含多种修订需求且无编辑意图的待修订的句子文本;将句子文本输入到训练好的文本修订任务模型;根据句子文本以及文本修订任务模型进行编辑意图预测,并生成满足多种修订需求的句子文本。本发明具有逻辑清晰、适配性强、准确率高、效率高的优点,妥善解决了现有技术在进行文本修订时只能进行单需求的修订、无法兼顾多种修订意图进行综合修订的问题。

Patent Agency Ranking