用于自然语言处理的多因素建模
    1.
    发明公开

    公开(公告)号:CN116802629A

    公开(公告)日:2023-09-22

    申请号:CN202280010693.5

    申请日:2022-01-19

    Abstract: 公开了用于系统的技术,包括用于训练和利用聊天机器人系统进行自然语言处理的多因素建模的技术。在实施例中,一种方法包括:接收与基于自然语言的查询相对应的一组话语数据;为聊天机器人确定一个或多个意图,所述一个或多个意图对应于基于自然语言的查询的可能上下文并且与聊天机器人的技能相关联;生成一个或多个意图分类数据集,每个意图分类数据集与自然语言查询对应于一个或多个意图中的意图的概率相关联;生成一个或多个变换后的数据集,每个变换后的数据集对应于一个或多个技能中的技能;基于一个或多个变换后的数据集来确定一个或多个技能中的第一技能;以及基于所确定的第一技能来处理该组话语数据以解析基于自然语言的查询。

    用于自然语言处理的关键词数据扩充工具

    公开(公告)号:CN116615727A

    公开(公告)日:2023-08-18

    申请号:CN202180079816.6

    申请日:2021-11-29

    Abstract: 用于针对在自然语言处理中训练聊天机器人系统进行关键词数据扩充的技术。在一个特定方面,提供了一种方法,该方法包括:接收训练话语集,该训练话语集用于训练机器学习模型以识别一个或多个话语的一个或多个意图;利用域外(OOD)示例来扩充该训练话语集。扩充包括:识别训练话语集中的话语内的关键词,生成具有识别出的关键词的OOD示例集,从该OOD示例集中过滤掉上下文与该训练话语集中的话语的上下文基本相似的OOD示例,以及将不具有被过滤掉的OOD示例的OOD示例集并入训练话语集中以生成经扩充的训练话语集。此后,使用该经扩充的训练话语集来训练该机器学习模型。

    聊天机器人的范围外自动转变
    4.
    发明公开

    公开(公告)号:CN116235164A

    公开(公告)日:2023-06-06

    申请号:CN202180067442.6

    申请日:2021-09-30

    Abstract: 用于在同一领域中的聊天机器人技能之间进行自动切换的技术。在一个特定方面,提供了一种方法,所述方法包括:在聊天机器人会话内接收来自用户的话语,其中,当前技能上下文是第一技能并且当前群组上下文是第一群组;将所述话语输入到针对所述第一群组的候选技能模型中;使用所述候选技能模型获得所述第一群组内的技能的排名;基于所述技能的排名确定第二技能是排名最高的技能;将所述聊天机器人会话的当前技能上下文改变为所述第二技能;将所述话语输入到针对所述第二技能的候选流模型中;使用所述候选流模型获得所述第二技能内与所述话语相匹配的意图的排名;以及基于所述意图的排名确定作为排名最高的意图的意图。

    用于基于目标的超参数调优的方法和系统

    公开(公告)号:CN115398419A

    公开(公告)日:2022-11-25

    申请号:CN202180025698.0

    申请日:2021-03-30

    Abstract: 公开了用于对机器学习模型的超参数进行调优的技术。选择要为其对机器学习模型的超参数进行调优的多个度量。每个度量与包括目标分数、惩罚因子和奖励因子的多个规范参数相关联。根据第一准则为每个度量配置所述多个规范参数。使用一个或多个验证数据集评估机器学习模型以获得度量分数。基于度量分数与每个度量的目标分数之间的差、惩罚因子或奖励因子来制定加权损失函数。对与机器学习模型相关联的超参数进行调优以便优化加权损失函数。响应于加权损失函数被优化,提供机器学习模型作为经验证的机器学习模型。

    减少的训练意图识别技术
    7.
    发明公开

    公开(公告)号:CN114365120A

    公开(公告)日:2022-04-15

    申请号:CN202080063758.3

    申请日:2020-07-30

    Inventor: M·E·约翰逊

    Abstract: 本公开一般而言涉及使用对话系统基于言语输入来确定意图。更具体地,描述了使用基于匹配的机器学习技术来识别与对话系统中的言语输入对应的意图的技术。当从可能的意图集合中添加或移除意图时,这些过程不需要训练。

    使用可生性对抗网络训练对话系统的语义解析器

    公开(公告)号:CN119670726A

    公开(公告)日:2025-03-21

    申请号:CN202411731914.5

    申请日:2020-08-13

    Abstract: 本公开涉及使用可生性对抗网络训练对话系统的语义解析器。本文公开了用于使用可生性对抗网络(GAN)来训练对话系统的语义解析器的技术。本文描述的方法涉及访问包括种子元组的种子数据。每个种子元组包括相应的种子话语和与相应的种子话语对应的相应的种子逻辑形式。该方法还包括在GAN中训练语义解析器和鉴别器。语义解析器基于来自鉴别器的输出进行学习以将话语映射到逻辑形式,并且鉴别器基于来自语义解析器的输出进行学习以识别真实的逻辑形式。然后可以将语义解析器集成到对话系统中。

Patent Agency Ranking