-
公开(公告)号:CN117355826A
公开(公告)日:2024-01-05
申请号:CN202180098616.5
申请日:2021-05-28
Applicant: 富士通株式会社
IPC: G06F16/383
Abstract: 信息处理装置按每一单词分割文本数据。信息处理装置基于定义了静态单词与矢量的关系的静态词典,确定出文本数据所包含的多个单词中表示不与静态词典的静态单词对应的单词的未知词。信息处理装置根据定义了基于类似的固有单词彼此设定有类似的矢量这样的条件生成的矢量与固有单词的关系的定义信息,来判定与未知词对应的固有单词是否包含于定义信息。信息处理装置在与未知词对应的固有单词包含于定义信息的情况下,将与固有单词对应的矢量分配至未知词。信息处理装置在与未知词对应的固有单词不包含于定义信息的情况下,根据配置于未知词的前后的单词对未知词分配矢量。
-
-
-
公开(公告)号:CN108694229A
公开(公告)日:2018-10-23
申请号:CN201810310516.4
申请日:2018-04-03
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/2775 , G06F17/277 , G06F17/2785
Abstract: 本公开涉及串数据分析装置以及串数据分析方法。串数据分析装置包括存储器和处理器,处理器耦接至存储器并且处理器被配置成执行以下处理,所述处理包括:生成关于包括多个词或短语的第一串数据的索引信息,该索引信息指示字符中的每一个的出现位置;对索引信息设置标志信息,该标志信息指示多个词或短语的开头位置以及多个词或短语中的每一个的结尾位置;以及通过使用设置有标志信息的索引信息从第二串数据中提取与多个词或短语对应的多个可划分的词或短语。
-
-
公开(公告)号:CN105808513A
公开(公告)日:2016-07-27
申请号:CN201610017815.X
申请日:2016-01-12
Applicant: 富士通株式会社
IPC: G06F17/22
CPC classification number: H03M7/3084 , G06F17/2223 , H03M5/145 , H03M7/30 , H03M7/40 , G06F17/2252 , G06F17/227
Abstract: 本发明涉及转换装置和转换方法。信息处理设备接收压缩文件,在该压缩文件中,以包括单个字符或多个字符的字符串为单位对具有第一字符代码的字符串数据进行压缩。信息处理设备将被包括在压缩文件中的压缩信息转换成经转换的压缩信息,所述压缩信息将所述压缩文件中的经压缩的字符串数据中的每一个映射至具有所述第一字符代码的字符串的相应单位中的每一个,从而所述经转换的压缩信息将所述压缩文件中的经压缩的字符串数据中的每一个映射至具有第二字符代码的字符串的相应单位中的每一个。信息处理设备根据被映射至经压缩和编码的字符数据串的压缩和编码的单位以及经转换的字符数据串的压缩和编码的单位的压缩信息来生成扩展文件。
-
公开(公告)号:CN105282554A
公开(公告)日:2016-01-27
申请号:CN201510367308.4
申请日:2015-06-29
Applicant: 富士通株式会社
IPC: H04N19/40 , H04N19/423
CPC classification number: H03M7/3086 , H03M7/425 , H03M7/6005
Abstract: 本发明提供了解码方法及解码装置,所述解码装置包括解码单元、检测单元和转换单元。解码单元将包括在编码数据中的第一编码数据解码成第一部分数据,所述编码数据从具有第一字符码的第一数据编码而来。检测单元基于所述编码数据从具有第一字符码的第一数据编码而来的字符码信息来检测第一部分数据中的字符边界。转换单元基于将第一字符码与第二字符码相关联的信息,利用检测到的字符边界将第一部分数据中的至少一部分转换成具有第二字符码的第二数据。
-
公开(公告)号:CN103797480A
公开(公告)日:2014-05-14
申请号:CN201180073519.7
申请日:2011-09-14
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30106 , G06F17/30321 , G06F17/30598 , G06F17/30613
Abstract: 本发明提供提取方法、提取程序、提取装置、以及提取系统。对段(sg2(1))进行字符信息“人”的压缩符号(P(人))的汇集出现映射、字符信息“形”的压缩符号(P(形))的汇集出现映射、以及汇集删除映射的AND运算。AND结果为“1100”,可知在段(sg1(1))、(sg1(2))中有可能存在字符信息“人”和“形”。由于根据该AND结果指定了段(sg1(1))、(sg1(2)),因此执行AND运算。由此指定段(sg0(1))、段(sg0(5)),执行AND运算。由此从段(sg0(1))指定文件编号3,从段(sg0(5))指定文件编号19。因此可知在压缩文件(f3)、(f19)存在字符信息“人”和“形”这双方。
-
公开(公告)号:CN1148657C
公开(公告)日:2004-05-05
申请号:CN98801551.X
申请日:1998-10-20
Applicant: 富士通株式会社
IPC: G06F12/00
CPC classification number: G11B20/1252 , G06F3/0608 , G06F3/0643 , G06F3/0674 , G11B20/00007 , Y10S707/99942
Abstract: 一种文件处理方法,一种数据处理装置和一种存储介质,把数据和关于该数据的索引数据划分成多个部分,并对各部分进行压缩以获得压缩文件,并把压缩文件和压缩后各部分的地址信息存储在存储介质中。
-
-
-
-
-
-
-
-
-