-
公开(公告)号:CN103532565B
公开(公告)日:2016-12-28
申请号:CN201310269060.9
申请日:2013-06-28
Applicant: 富士通株式会社
IPC: H03M7/30
CPC classification number: G06F17/30292 , H03M7/4031
Abstract: 所公开的短语树的数据结构包括数据块作为所述短语树中的每个节点的数据,该数据块包括:第一区域,用于保存字符或字符串的码;第二区域,用于针对将要使用的每个字符,保存接着该字符或字符串下一个出现的第二字符的出现序号;以及第三区域,用于根据出现序号来保存出现次数,或者当出现次数超过阈值时,保存与包括该字符或字符串和该第二字符的字符串对应的码。
-
-
公开(公告)号:CN103797480A
公开(公告)日:2014-05-14
申请号:CN201180073519.7
申请日:2011-09-14
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30106 , G06F17/30321 , G06F17/30598 , G06F17/30613
Abstract: 本发明提供提取方法、提取程序、提取装置、以及提取系统。对段(sg2(1))进行字符信息“人”的压缩符号(P(人))的汇集出现映射、字符信息“形”的压缩符号(P(形))的汇集出现映射、以及汇集删除映射的AND运算。AND结果为“1100”,可知在段(sg1(1))、(sg1(2))中有可能存在字符信息“人”和“形”。由于根据该AND结果指定了段(sg1(1))、(sg1(2)),因此执行AND运算。由此指定段(sg0(1))、段(sg0(5)),执行AND运算。由此从段(sg0(1))指定文件编号3,从段(sg0(5))指定文件编号19。因此可知在压缩文件(f3)、(f19)存在字符信息“人”和“形”这双方。
-
公开(公告)号:CN117355825A
公开(公告)日:2024-01-05
申请号:CN202180098641.3
申请日:2021-06-14
Applicant: 富士通株式会社
IPC: G06F16/33
Abstract: 信息处理装置按类似的矢量对储存于文件的多个句子的矢量进行分类,生成将句子的矢量与句子的文件上的位置建立了对应关系的转置索引。信息处理装置在受理包含多个句子的检索查询的情况下,从检索查询所包含的多个句子确定出特征句子。信息处理装置基于特征句子的矢量、转置索引的各矢量、以及分类的结果确定出表示与特征句子的矢量类似的矢量的多个类似矢量。信息处理装置针对多个类似矢量,基于类似矢量以及转置索引确定出第1推移数据,该第1推移数据表示类似矢量的前后的位置的矢量的推移。信息处理装置从多个类似矢量的第1推移数据确定出与第2推移数据类似的推移数据,该第2推移数据表示检索查询中的特征句子的前后的句子的矢量的推移。
-
公开(公告)号:CN115989543A
公开(公告)日:2023-04-18
申请号:CN202080102744.8
申请日:2020-07-08
Applicant: 富士通株式会社
IPC: G16B20/20
Abstract: 信息处理装置获取作为特定的个人的基因组信息的被断开为多个的断开基因组数据。信息处理装置基于将密码子和代码建立对应的密码子变换表,生成将多个断开基因组数据分别以密码子为单位进行编码的多个断开密码子数据。信息处理装置基于将成为基准的基准基因组数据以密码子为单位进行编码的基准密码子数据、和多个断开密码子数据的每一个断开密码子数据,确定出现在多个断开密码子数据中的代码中的与出现在基准密码子数据中的代码不同的基因变异出现的位置和种类。信息处理装置生成将基因变异和基因变异出现的位置及种类建立对应的基因变异转置索引。
-
公开(公告)号:CN113811949A
公开(公告)日:2021-12-17
申请号:CN201980096262.3
申请日:2019-05-13
Applicant: 富士通株式会社
IPC: G16B30/10
Abstract: 评价装置通过移位而生成新的碱基序列数据。评价装置确定通过将新的碱基序列数据中所含的多个碱基从新的碱基序列数据上的基准位置以规定规则划分而生成的多个部分碱基序列中的包含推测产生了基因变异的碱基的部分碱基序列。评价装置根据在所确定的部分碱基序列以及多个部分碱基序列中的与所确定的部分碱基序列具有规定的位置关系的部分碱基序列的排列在通过将规定的碱基序列数据中所含的多个碱基从规定的碱基序列数据上的基准位置以规定规则划分而生成的多个部分碱基序列中出现的出现状况进行评价。
-
公开(公告)号:CN119301599A
公开(公告)日:2025-01-10
申请号:CN202280096573.1
申请日:2022-06-02
Applicant: 富士通株式会社
IPC: G06F40/166 , G06F40/216 , G06F40/232 , G06F40/253 , G06F40/44
Abstract: 本发明涉及信息处理程序、信息处理方法以及信息处理装置。信息处理装置分别计算连续的多个句子并且是在前后句子中具有关系性的多个句子的向量。信息处理装置通过将多个句子的向量依次输入到机器学习模型并进行训练来生成机器学习模型,在向机器学习模型输入某个句子的向量时,该机器学习模型预测在某个句子的下次输入的句子的句子向量。信息处理装置计算第一句子的向量和紧接着第一句子的第二句子的向量。信息处理装置通过将第一句子的向量输入到机器学习模型,从而计算被预测为紧接着第一句子的句子的向量,并判定第二句子的向量是否适当。
-
-
公开(公告)号:CN103532565A
公开(公告)日:2014-01-22
申请号:CN201310269060.9
申请日:2013-06-28
Applicant: 富士通株式会社
IPC: H03M7/30
CPC classification number: G06F17/30292 , H03M7/4031
Abstract: 所公开的短语树的数据结构包括数据块作为所述短语树中的每个节点的数据,该数据块包括:第一区域,用于保存字符或字符串的码;第二区域,用于针对将要使用的每个字符,保存接着该字符或字符串下一个出现的第二字符的出现序号;以及第三区域,用于根据出现序号来保存出现次数,或者当出现次数超过阈值时,保存与包括该字符或字符串和该第二字符的字符串对应的码。
-
公开(公告)号:CN105846825B
公开(公告)日:2019-06-18
申请号:CN201610059698.3
申请日:2016-01-28
Applicant: 富士通株式会社
IPC: H03M7/30
CPC classification number: H03M7/30 , H03M7/3084 , H03M7/3091
Abstract: 本公开涉及一种压缩方法、解压缩方法、压缩装置以及解压缩装置。所述压缩方法包括使计算机执行处理,所述处理包括:确定目标字符串是否记录在第一字典中,目标字符串为包含在输入数据中的压缩目标,第一字典使压缩码与对应的字符串相关;当目标字符串被记录在第一字典中时,输出与目标字符串对应的压缩码;当目标字符串未记录在第一字典中时,在第一数据中搜索目标字符串,第一数据所积累的字符串是输入数据的一部分并且已经被确定为未记录在第一字典中;当在第一数据中检索到目标字符串时,在与第一字典不同的第二字典中记录匹配的字符串;以及输出与目标字符串在第二字典中的记录号对应的压缩码。
-
-
-
-
-
-
-
-
-