-
公开(公告)号:CN115809361A
公开(公告)日:2023-03-17
申请号:CN202211088438.0
申请日:2022-09-07
Applicant: 株式会社斯库林集团
IPC: G06F16/93 , G06F16/903 , G06F16/906 , G06N3/0455 , G06N3/08
Abstract: 本发明由训练数据获取部获取对从作为检索对象的多个文档文件中提取的一部分的文档文件分配了标签信息的训练数据。通过在使用语料库预先进行了学习的Transformer型的机器学习模型中应用所获取的训练数据,由构建部构建用于推定应该对文档文件分配的标签信息的标签推定模型。使用所构建的标签推定模型,由分配部对作为检索对象的多个文档文件分别分配标签信息。
-
公开(公告)号:CN114239842A
公开(公告)日:2022-03-25
申请号:CN202111043529.8
申请日:2021-09-07
Applicant: 株式会社斯库林集团
IPC: G06N20/00
Abstract: 本发明涉及信息处理装置、信息处理系统以及信息处理方法。在信息处理装置中,由获取部获取表示解释变量与目标变量的关系的学习用数据。在由获取部获取到的学习用数据中,由层级决定部决定目标变量所含的多个项目的层级关系。基于由层级决定部决定的层级关系,由算法决定部决定用于构建学习模型的多个构建算法中应该执行的构建算法。通过由学习部执行由算法决定部决定的构建算法,从而构建第一学习模型。
-
公开(公告)号:CN113326686B
公开(公告)日:2024-05-10
申请号:CN202110213132.2
申请日:2021-02-24
Applicant: 株式会社斯库林集团
IPC: G06F40/194 , G06F40/247 , G06F40/30
Abstract: 本发明提供一种相似度计算装置,即使在创建多个同义词组的情况下,也能够有效地实现术语的统一。相似度计算装置包括:名称获取部,获取属于第一同义词组的各个单词所属的第一组名称和属于第二同义词组的各个单词所属的第二组名称;名称集合生成部,生成第一组名称集合和第二组名称集合;以及相似度计算部,计算第一组名称集合与第二组名称集合之间的相似度。
-
公开(公告)号:CN115081638A
公开(公告)日:2022-09-20
申请号:CN202210248213.0
申请日:2022-03-14
Applicant: 株式会社斯库林集团
IPC: G06N20/00 , G06K9/62 , G06F40/205
Abstract: 本申请提供一种矢量获取方法、矢量获取装置以及记录介质,能够提高与单词对应的矢量的分类精度。矢量获取方法将能够分割成多个单词的单词作为复合词,并包括:将包含从复合词分割出的单词中的至少两个的至少一个语句输入到学习完毕模型中的工序;从学习完毕模型输出与输入的语句中的、从复合词分割出的单词中的至少一个对应的调整矢量的工序;使用从学习完毕模型输出的调整矢量,获取与复合词对应的矢量即复合矢量的工序。
-
公开(公告)号:CN113326686A
公开(公告)日:2021-08-31
申请号:CN202110213132.2
申请日:2021-02-24
Applicant: 株式会社斯库林集团
IPC: G06F40/194 , G06F40/247 , G06F40/30
Abstract: 本发明提供一种相似度计算装置,即使在创建多个同义词组的情况下,也能够有效地实现术语的统一。相似度计算装置包括:名称获取部,获取属于第一同义词组的各个单词所属的第一组名称和属于第二同义词组的各个单词所属的第二组名称;名称集合生成部,生成第一组名称集合和第二组名称集合;以及相似度计算部,计算第一组名称集合与第二组名称集合之间的相似度。
-
公开(公告)号:CN113268963A
公开(公告)日:2021-08-17
申请号:CN202110182057.8
申请日:2021-02-09
Applicant: 株式会社斯库林集团
IPC: G06F40/169 , G06F16/35 , G06N3/08
Abstract: 本发明提供一种参数更新装置,其能够抑制分类精度的降低并对构成层级结构的多个数据项进行分类。参数更新装置具有:输入部,输入训练数据;以及更新部,通过使用神经网络对输入的训练数据的多个数据项进行多任务学习,从而更新用于赋予与各数据项对应的至少一个推定标签的参数,更新部以使所赋予的推定标签与训练数据中的对应的正解标签之间的误差在多个数据项中的总和最小化的方式来更新参数。
-
-
-
-
-