-
公开(公告)号:CN119301599A
公开(公告)日:2025-01-10
申请号:CN202280096573.1
申请日:2022-06-02
Applicant: 富士通株式会社
IPC: G06F40/166 , G06F40/216 , G06F40/232 , G06F40/253 , G06F40/44
Abstract: 本发明涉及信息处理程序、信息处理方法以及信息处理装置。信息处理装置分别计算连续的多个句子并且是在前后句子中具有关系性的多个句子的向量。信息处理装置通过将多个句子的向量依次输入到机器学习模型并进行训练来生成机器学习模型,在向机器学习模型输入某个句子的向量时,该机器学习模型预测在某个句子的下次输入的句子的句子向量。信息处理装置计算第一句子的向量和紧接着第一句子的第二句子的向量。信息处理装置通过将第一句子的向量输入到机器学习模型,从而计算被预测为紧接着第一句子的句子的向量,并判定第二句子的向量是否适当。
-
公开(公告)号:CN118043801A
公开(公告)日:2024-05-14
申请号:CN202180102907.7
申请日:2021-10-04
Applicant: 富士通株式会社
Abstract: 本发明提供一种处理方法、处理程序以及信息处理装置。信息处理装置若接收登记于数据库的多个字符或者字符串,则计算与多个字符或者字符串分别相应的多个向量。信息处理装置将计算出的多个向量根据向量间距离分类为多个集群。信息处理装置对多个集群中的每个集群,求出代表各集群所包含的一个向量或者多个向量的代表向量、和与从各集群的代表向量到各集群所包含的一个向量或者多个向量的大小相应的距离。信息处理装置将词典信息存储于存储部,该词典信息是将计算出的代表向量和求出的距离与识别各集群的集群识别信息建立了对应关系的信息。
-
公开(公告)号:CN111046659B
公开(公告)日:2024-04-16
申请号:CN201910949442.3
申请日:2019-10-08
Applicant: 富士通株式会社
IPC: G06F40/284 , G06N20/00 , G06N3/08
Abstract: 上下文信息生成方法、上下文信息生成装置及计算机可读记录介质。存储单元内存储文档和作为针对多个单词分别计算出的单词嵌入的多个单词向量。处理单元针对单词中的一个单词,从文档中提取位于从所述一个单词出现的一个出现位置起的规定范围内的两个或更多个周边单词,并通过将分别对应于周边单词的单词向量相加来计算和向量。处理单元确定参数,以使用机器学习模型,根据和向量和该参数来预测周边单词。处理单元将参数作为所述一个出现位置的上下文信息,与对应于一个单词的单词向量相关联地存储。
-
-
公开(公告)号:CN115917521A
公开(公告)日:2023-04-04
申请号:CN202080102120.6
申请日:2020-07-03
Applicant: 富士通株式会社
IPC: G06F16/00
Abstract: 信息处理装置基于利用共用概念对在多个空间中定义的空间固有的多个基本信息进行分类而得的共用概念表,对多个基本信息进行庞加莱嵌入,由此计算多个基本信息的矢量。信息处理装置基于多个基本信息的矢量,计算与基本信息相比粒度较大的结构信息的矢量。信息处理装置生成对与相同的空间对应的文件中的基本信息的位置与基本信息的矢量的关系、以及文件中的结构信息的位置与结构信息的矢量的关系进行定义的转置索引。
-
公开(公告)号:CN115668385A
公开(公告)日:2023-01-31
申请号:CN202080101632.0
申请日:2020-06-05
Applicant: 富士通株式会社
IPC: G16C20/40
Abstract: 信息处理装置将表示化合物的示性式的排列分割为排列的最小单位的字符串以及表示化合物的分支部分的分支符号。信息处理装置通过基于表示化合物的示性式的排列与压缩代码之间的关系的基团词典,对最小单位的字符串分配压缩代码,并对分支符号分配与分支部分的种类对应的压缩代码,来生成对排列进行编码后的第一代码排列。信息处理装置基于表示化合物的示性式的排列的基团一次结构与压缩代码之间的关系的基团一次结构词典,生成以基团一次结构的单位对第一代码排列所包含的压缩代码进行编码后的第二代码排列。
-
公开(公告)号:CN107305586B
公开(公告)日:2021-10-15
申请号:CN201710249150.X
申请日:2017-04-17
Applicant: 富士通株式会社
IPC: G06F16/31 , G06F16/14 , G06F40/284
Abstract: 本发明公开了索引生成方法、索引生成装置及搜索方法。在对多个输入文件进行词汇分析的过程中,索引生成装置生成关于存在或不存在多个关键字以及存在关键字时所述关键字针对相应文件的存在位置的各条信息。该索引生成装置基于所生成的各条信息,生成关于关键字以及关键字针对相应文件的位置的索引信息。
-
公开(公告)号:CN108694159A
公开(公告)日:2018-10-23
申请号:CN201810240597.5
申请日:2018-03-22
Applicant: 富士通株式会社
CPC classification number: H03M7/3088 , G06F17/2252 , G06F17/2735 , H03M7/30 , H03M7/3066 , H03M7/6011 , H03M7/707 , G06F17/2217 , G06F17/2276 , G06F17/277
Abstract: 本发明涉及编码方法和编码装置。根据本发明的编码装置包括编码单元,被配置成:获取文本数据;基于文本数据中所包括的第一单词的属性信息来指定多个动态词典中的第一动态词典;将与第一动态代码相关联的第一单词登记在第一动态词典中;以及将第一单词编码为第一动态代码。
-
-
公开(公告)号:CN104025080B
公开(公告)日:2017-05-03
申请号:CN201180074532.4
申请日:2011-11-04
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F16/90344 , G06F16/13
Abstract: 对照控制程序使计算机(300)执行在与符号信息建立关联地存储在存储部中的文字信息包含于所输入的输入文字信息的情况下,将控制信息与符号信息建立关联地存储于存储部的处理。另外,对照控制程序使计算机(300)执行在包含于被编码的数据的某个符号信息与控制信息建立关联地存储在存储部中的情况下,执行包含被编码的数据内的某个符号信息的数据与输入文字信息的对照处理的处理。
-
-
-
-
-
-
-
-
-