-
公开(公告)号:CN116802629A
公开(公告)日:2023-09-22
申请号:CN202280010693.5
申请日:2022-01-19
Applicant: 甲骨文国际公司
IPC: G06F16/332
Abstract: 公开了用于系统的技术,包括用于训练和利用聊天机器人系统进行自然语言处理的多因素建模的技术。在实施例中,一种方法包括:接收与基于自然语言的查询相对应的一组话语数据;为聊天机器人确定一个或多个意图,所述一个或多个意图对应于基于自然语言的查询的可能上下文并且与聊天机器人的技能相关联;生成一个或多个意图分类数据集,每个意图分类数据集与自然语言查询对应于一个或多个意图中的意图的概率相关联;生成一个或多个变换后的数据集,每个变换后的数据集对应于一个或多个技能中的技能;基于一个或多个变换后的数据集来确定一个或多个技能中的第一技能;以及基于所确定的第一技能来处理该组话语数据以解析基于自然语言的查询。
-
公开(公告)号:CN116615727A
公开(公告)日:2023-08-18
申请号:CN202180079816.6
申请日:2021-11-29
Applicant: 甲骨文国际公司
IPC: G06F40/284
Abstract: 用于针对在自然语言处理中训练聊天机器人系统进行关键词数据扩充的技术。在一个特定方面,提供了一种方法,该方法包括:接收训练话语集,该训练话语集用于训练机器学习模型以识别一个或多个话语的一个或多个意图;利用域外(OOD)示例来扩充该训练话语集。扩充包括:识别训练话语集中的话语内的关键词,生成具有识别出的关键词的OOD示例集,从该OOD示例集中过滤掉上下文与该训练话语集中的话语的上下文基本相似的OOD示例,以及将不具有被过滤掉的OOD示例的OOD示例集并入训练话语集中以生成经扩充的训练话语集。此后,使用该经扩充的训练话语集来训练该机器学习模型。
-
公开(公告)号:CN116490879A
公开(公告)日:2023-07-25
申请号:CN202180077947.0
申请日:2021-11-17
Applicant: 甲骨文国际公司
Inventor: C·D·V·黄 , T·T·乌 , P·扎雷莫迪 , Y·许 , V·布利诺夫 , Y-H·洪 , Y·D·T·S·达马西里 , V·韦氏诺一 , E·L·贾拉勒丁 , M·帕里克 , T·L·董 , M·E·约翰逊
IPC: G06N3/047 , G06N3/048 , G06N3/08 , G06F16/332 , G06F40/35
Abstract: 本文公开了用于解决与聊天机器人系统中的机器学习模型相关联的过度自信问题的技术。对于机器学习模型的多个层中的每个层,关于输入的话语,为多个预测生成置信度分数的分布。基于为层生成的置信度分数的分布来确定要指派给机器学习模型的每个层的预测。基于这些预测,确定机器学习模型的总体预测。所述多个层的子集被迭代处理以识别其指派的预测满足准则的层。与机器学习模型的该层的被指派的预测相关联的置信度分数被指派为要与机器学习模型的总体预测相关联的总体置信度分数。
-
公开(公告)号:CN116235164A
公开(公告)日:2023-06-06
申请号:CN202180067442.6
申请日:2021-09-30
Applicant: 甲骨文国际公司
IPC: G06F16/35
Abstract: 用于在同一领域中的聊天机器人技能之间进行自动切换的技术。在一个特定方面,提供了一种方法,所述方法包括:在聊天机器人会话内接收来自用户的话语,其中,当前技能上下文是第一技能并且当前群组上下文是第一群组;将所述话语输入到针对所述第一群组的候选技能模型中;使用所述候选技能模型获得所述第一群组内的技能的排名;基于所述技能的排名确定第二技能是排名最高的技能;将所述聊天机器人会话的当前技能上下文改变为所述第二技能;将所述话语输入到针对所述第二技能的候选流模型中;使用所述候选流模型获得所述第二技能内与所述话语相匹配的意图的排名;以及基于所述意图的排名确定作为排名最高的意图的意图。
-
公开(公告)号:CN115485690A
公开(公告)日:2022-12-16
申请号:CN202180026697.8
申请日:2021-03-30
Applicant: 甲骨文国际公司
IPC: G06F40/30
Abstract: 本公开涉及聊天机器人系统,并且更具体地,涉及用于在训练模型时处置不平衡的训练数据的分批技术,从而在执行推理时去除经训练的机器学习模型中的偏向性。在实施例中,获取多个原始话语。确定偏向性消除分布,并且根据偏向性减少分布对多个原始话语的子集进行分批。可以将所得的无偏训练数据输入到预测模型中以训练预测模型。可以获取经训练的预测模型并将其用于根据经训练的预测模型接收的新输入来预测无偏的结果。
-
公开(公告)号:CN115398419A
公开(公告)日:2022-11-25
申请号:CN202180025698.0
申请日:2021-03-30
Applicant: 甲骨文国际公司
IPC: G06F16/332 , G06N20/00
Abstract: 公开了用于对机器学习模型的超参数进行调优的技术。选择要为其对机器学习模型的超参数进行调优的多个度量。每个度量与包括目标分数、惩罚因子和奖励因子的多个规范参数相关联。根据第一准则为每个度量配置所述多个规范参数。使用一个或多个验证数据集评估机器学习模型以获得度量分数。基于度量分数与每个度量的目标分数之间的差、惩罚因子或奖励因子来制定加权损失函数。对与机器学习模型相关联的超参数进行调优以便优化加权损失函数。响应于加权损失函数被优化,提供机器学习模型作为经验证的机器学习模型。
-
公开(公告)号:CN114365120A
公开(公告)日:2022-04-15
申请号:CN202080063758.3
申请日:2020-07-30
Applicant: 甲骨文国际公司
Inventor: M·E·约翰逊
IPC: G06F16/33 , G06F16/332 , G06K9/62
Abstract: 本公开一般而言涉及使用对话系统基于言语输入来确定意图。更具体地,描述了使用基于匹配的机器学习技术来识别与对话系统中的言语输入对应的意图的技术。当从可能的意图集合中添加或移除意图时,这些过程不需要训练。
-
公开(公告)号:CN119790387A
公开(公告)日:2025-04-08
申请号:CN202380060894.0
申请日:2023-08-21
Applicant: 甲骨文国际公司
Inventor: C·D·V·黄 , S·迈克瑞切 , M·E·约翰逊 , S·萨布拉玛尼安 , A·D·卡努加 , N·马图尔 , G·唐加瑞 , S·W-C·苏 , P·扎雷莫迪 , V·拉格哈文德拉 , T·L·董 , S·P·K·加德 , V·韦氏诺一 , C·M·布罗德本特 , P·阿瑟 , S·N·A·扎伊迪
IPC: G06F16/2452 , G06F16/21 , G06F40/253 , G06F16/33 , G06F16/332 , H04L51/02 , G06N3/08 , G06N3/045 , G06N3/0895
Abstract: 本文公开了用于将自然语言话语转换成中间数据库查询表示的技术。通过将自然语言话语与数据库的数据库模式表示级联来生成输入字符串。基于该输入字符串,第一编码器生成自然语言话语和数据库模式表示的一个或多个嵌入。第二编码器基于所述一个或多个嵌入对数据库模式表示中的元素与自然语言话语中的单词之间的关系进行编码。基于语法的解码器基于编码的关系和所述一个或多个嵌入生成中间数据库查询表示。基于中间数据库查询表示和接口规范,以数据库查询语言生成数据库查询。
-
公开(公告)号:CN119670726A
公开(公告)日:2025-03-21
申请号:CN202411731914.5
申请日:2020-08-13
Applicant: 甲骨文国际公司
IPC: G06F40/205 , G10L15/16 , G06F40/226 , G10L15/18 , G06F40/30 , G10L15/22
Abstract: 本公开涉及使用可生性对抗网络训练对话系统的语义解析器。本文公开了用于使用可生性对抗网络(GAN)来训练对话系统的语义解析器的技术。本文描述的方法涉及访问包括种子元组的种子数据。每个种子元组包括相应的种子话语和与相应的种子话语对应的相应的种子逻辑形式。该方法还包括在GAN中训练语义解析器和鉴别器。语义解析器基于来自鉴别器的输出进行学习以将话语映射到逻辑形式,并且鉴别器基于来自语义解析器的输出进行学习以识别真实的逻辑形式。然后可以将语义解析器集成到对话系统中。
-
公开(公告)号:CN119183573A
公开(公告)日:2024-12-24
申请号:CN202380040141.3
申请日:2023-04-12
Applicant: 甲骨文国际公司
Inventor: A·A·A·阿博巴克尔 , S·萨布拉玛尼安 , Y·许 , V·布利诺夫 , U·比斯塔 , T·Q·彭 , T·L·董 , M·E·约翰逊 , E·L·贾拉勒丁 , V·斯瑞达兰 , 徐新 , S·P·K·加德 , V·韦氏诺一
IPC: G06N20/20 , G06F40/295 , G06F18/214 , G06F18/10
Abstract: 在一些实施例中,通过首先应用一种或多种数据增强技术,然后应用附加增强技术对第一阶段结果进行后处理,来将两阶段增强技术应用于意图预测模型的第一组训练数据;将第一组训练数据和后处理的增强训练数据组合来训练意图预测模型。在另一个实施例中,将实体感知(“EA”)技术和两阶段增强技术一起应用以产生第二组训练数据;将第一组训练数据和第二组训练数据组合来训练意图预测模型。在另一个实施例中,将一种或多种负向实体感知数据增强技术应用于第一组训练数据以产生第二组训练数据;将第一组训练数据和第二组训练数据组合来训练意图预测模型。
-
-
-
-
-
-
-
-
-