-
公开(公告)号:CN114175041A
公开(公告)日:2022-03-11
申请号:CN201980098343.7
申请日:2019-08-01
Applicant: 富士通株式会社
IPC: G06F40/216 , G06F40/30
Abstract: 信息处理装置获取将与单词以及单词的语义的组的出现频率对应的长度的代码与单词以及语义的组建立对应关系的压缩词典。信息处理装置通过压缩词典,获取任意一个单词以及任意一个单词的语义的组、和与任意一个单词以及任意一个单词的语义的组建立对应关系的代码。信息处理装置参照分别将同一长度的多个定长码与单词以及语义的组建立对应关系并存储的存储部,确定多个定长码中与获取的任意一个单词以及任意一个单词的语义的组建立了对应关系的定长码。信息处理装置生成将确定出的定长码与获取的代码建立对应关系的转换词典。信息处理装置基于转换词典,确定与对文本数据进行了编码的压缩数据所包含的各代码建立了对应关系的各定长码。
-
公开(公告)号:CN106250354B
公开(公告)日:2020-09-18
申请号:CN201610365828.6
申请日:2016-05-27
Applicant: 富士通株式会社
IPC: G06F40/247 , G06F40/157 , G06F40/103
Abstract: 本发明能够适当地对包括罕用字的文书进行语素分析。程序使计算机执行:辨别处理,在处理对象的文书中,辨别不包含于信息处理装置处理的文字标准的罕用字;置换处理,基于从使用于语素分析的第一词典生成的置换词典将罕用字置换为包含于文字标准的常用字;以及解析处理,使用上述第一词典对上述罕用字被置换成上述常用字的文书进行解析。
-
公开(公告)号:CN105739882B
公开(公告)日:2019-06-11
申请号:CN201510969247.9
申请日:2015-12-22
Applicant: 富士通株式会社
IPC: G06F3/0488 , G06K9/68
CPC classification number: G06K9/00422 , G06K9/00416 , G06K2209/01
Abstract: 本申请涉及用于字符识别的计算机可读记录介质、方法及设备。字符识别设备包括存储装置和处理器,处理器执行方法,所述方法包括:根据与输入操作对应的输入坐标数据来生成输入笔划数据;根据输入笔划数据来生成笔划组合候选以及与笔划组合候选对应的评估数据,笔划候选包括目标验证笔划,目标验证笔划被组合以构成目标验证字符;基于目标验证笔划的出现概率、存储在存储装置中的每个笔划的出现概率数据以及评估数据来从笔划组合候选中标识第一笔划组合;以及基于第一笔划组合来输出与输入操作对应的字符。出现概率指示目标验证笔划在目标验证字符中的每个目标验证字符中出现的概率。出现概率数据是基于目标验证笔划的出现概率生成的。
-
公开(公告)号:CN105282554B
公开(公告)日:2019-01-15
申请号:CN201510367308.4
申请日:2015-06-29
Applicant: 富士通株式会社
IPC: H04N19/40 , H04N19/423
Abstract: 本发明提供了解码方法及解码装置,所述解码装置包括解码单元、检测单元和转换单元。解码单元将包括在编码数据中的第一编码数据解码成第一部分数据,所述编码数据从具有第一字符码的第一数据编码而来。检测单元基于所述编码数据从具有第一字符码的第一数据编码而来的字符码信息来检测第一部分数据中的字符边界。转换单元基于将第一字符码与第二字符码相关联的信息,利用检测到的字符边界将第一部分数据中的至少一部分转换成具有第二字符码的第二数据。
-
公开(公告)号:CN105191144B
公开(公告)日:2019-01-01
申请号:CN201380074817.7
申请日:2013-03-22
Applicant: 富士通株式会社
IPC: H03M7/40
Abstract: 本发明涉及压缩装置、压缩方法、解压装置、解压方法以及信息处理系统。根据一个侧面,目的在于在通过符号来表示构成数据的单位间的划分的数据的压缩中提高压缩率。压缩装置包含:存储部,其将与构成数据的要素之一的第一要素和在上述数据中表示上述要素间的划分的第一划分符号的组合对应的一个压缩编码与上述第一要素建立对应关系地进行存储;获取部,其从上述存储部获取与从上述数据读出的上述第一要素建立对应关系地存储的上述压缩编码;以及写入部,其将获取的上述压缩编码写入对上述数据的压缩数据进行储存的储存区域。
-
公开(公告)号:CN107305586A
公开(公告)日:2017-10-31
申请号:CN201710249150.X
申请日:2017-04-17
Applicant: 富士通株式会社
CPC classification number: G06F17/30097 , G06F17/30619 , G06F17/30684 , G06F17/30613 , G06F17/277 , G06F17/30106
Abstract: 本发明公开了索引生成方法、索引生成装置及搜索方法。在对多个输入文件进行词汇分析的过程中,索引生成装置生成关于存在或不存在多个关键字以及存在关键字时所述关键字针对相应文件的存在位置的各条信息。该索引生成装置基于所生成的各条信息,生成关于关键字以及关键字针对相应文件的位置的索引信息。
-
公开(公告)号:CN105739882A
公开(公告)日:2016-07-06
申请号:CN201510969247.9
申请日:2015-12-22
Applicant: 富士通株式会社
IPC: G06F3/0488 , G06K9/68
CPC classification number: G06K9/00422 , G06K9/00416 , G06K2209/01 , G06F3/04883 , G06K9/6835
Abstract: 本申请涉及用于字符识别的计算机可读记录介质、方法及设备。字符识别设备包括存储装置和处理器,处理器执行方法,所述方法包括:根据与输入操作对应的输入坐标数据来生成输入笔划数据;根据输入笔划数据来生成笔划组合候选以及与笔划组合候选对应的评估数据,笔划候选包括目标验证笔划,目标验证笔划被组合以构成目标验证字符;基于目标验证笔划的出现概率、存储在存储装置中的每个笔划的出现概率数据以及评估数据来从笔划组合候选中标识第一笔划组合;以及基于第一笔划组合来输出与输入操作对应的字符。出现概率指示目标验证笔划在目标验证字符中的每个目标验证字符中出现的概率。出现概率数据是基于目标验证笔划的出现概率生成的。
-
公开(公告)号:CN105052041A
公开(公告)日:2015-11-11
申请号:CN201380074814.3
申请日:2013-03-22
Applicant: 富士通株式会社
IPC: H03M7/40
CPC classification number: H03M7/42 , G06F17/2735 , G06F17/30153 , G06F17/30917 , H03M7/3084 , H03M7/3088 , H03M7/40
Abstract: 根据一个侧面,目的在于抑制由书写差异的存在引起的压缩率的降低。根据一个实施方式,压缩装置包含:存储部,其存储对相互不同的多个字符信息分配的第一压缩编码与上述多个字符信息的每一个相关联的词典信息;获取部,其在获取了上述多个字符信息中的第一字符信息的情况下,从上述词典信息中获取与上述第一字符信息相关联的上述第一压缩编码;以及写入部,其将获取的上述第一压缩编码写入储存压缩数据的储存区域。
-
公开(公告)号:CN104584439A
公开(公告)日:2015-04-29
申请号:CN201280075390.8
申请日:2012-08-20
Applicant: 富士通株式会社
Inventor: 片冈正弘
IPC: H03M7/40
CPC classification number: G06F3/0619 , G06F3/065 , G06F3/067 , H03M7/3088 , H03M7/4037 , H04N19/46 , H04N19/91
Abstract: 本发明的目的一个方面是为了降低用于压缩的压缩字典数据的大小。在一个实施例中,通过指令执行压缩的计算机执行下述处理来生成压缩字典数据:该处理用于将要被压缩的字符信息和分配给字符信息的压缩码的码长存储在存储区域中的由具有预定数量的位的不同位串指示的每个存储位置处,该位串包括压缩码,在该存储区域中具有预定数量的位串指示存储位置。
-
公开(公告)号:CN100535889C
公开(公告)日:2009-09-02
申请号:CN03106774.3
申请日:1998-10-20
Applicant: 富士通株式会社
CPC classification number: G11B20/1252 , G06F3/0608 , G06F3/0643 , G06F3/0674 , G11B20/00007 , Y10S707/99942
Abstract: 一种文件处理方法,一种数据处理装置和一种存储介质,把数据和关于该数据的索引数据划分成多个部分,并对各部分进行压缩以获得压缩文件,并把压缩文件和压缩后各部分的地址信息存储在存储介质中。
-
-
-
-
-
-
-
-
-