信息处理程序、信息处理方法以及信息处理装置

    公开(公告)号:CN117355826A

    公开(公告)日:2024-01-05

    申请号:CN202180098616.5

    申请日:2021-05-28

    Abstract: 信息处理装置按每一单词分割文本数据。信息处理装置基于定义了静态单词与矢量的关系的静态词典,确定出文本数据所包含的多个单词中表示不与静态词典的静态单词对应的单词的未知词。信息处理装置根据定义了基于类似的固有单词彼此设定有类似的矢量这样的条件生成的矢量与固有单词的关系的定义信息,来判定与未知词对应的固有单词是否包含于定义信息。信息处理装置在与未知词对应的固有单词包含于定义信息的情况下,将与固有单词对应的矢量分配至未知词。信息处理装置在与未知词对应的固有单词不包含于定义信息的情况下,根据配置于未知词的前后的单词对未知词分配矢量。

    信息处理程序、信息处理方法和信息处理装置

    公开(公告)号:CN116648753A

    公开(公告)日:2023-08-25

    申请号:CN202080107270.6

    申请日:2020-12-18

    Abstract: 信息处理装置基于学习数据,执行学习模型的学习,所述学习数据定义了与目标化合物对应的向量和与用于制造目标化合物的合成路径中包含的多个子化合物分别对应的向量之间的关系。信息处理装置在接受了分析对象的目标化合物的情况下,通过将分析对象的目标化合物的向量输入到学习模型,来计算与分析对象的目标化合物对应的多个子化合物的向量。

    串数据分析装置以及串数据分析方法

    公开(公告)号:CN108694229A

    公开(公告)日:2018-10-23

    申请号:CN201810310516.4

    申请日:2018-04-03

    CPC classification number: G06F17/2775 G06F17/277 G06F17/2785

    Abstract: 本公开涉及串数据分析装置以及串数据分析方法。串数据分析装置包括存储器和处理器,处理器耦接至存储器并且处理器被配置成执行以下处理,所述处理包括:生成关于包括多个词或短语的第一串数据的索引信息,该索引信息指示字符中的每一个的出现位置;对索引信息设置标志信息,该标志信息指示多个词或短语的开头位置以及多个词或短语中的每一个的结尾位置;以及通过使用设置有标志信息的索引信息从第二串数据中提取与多个词或短语对应的多个可划分的词或短语。

    文本分割装置以及文本分割方法

    公开(公告)号:CN106250362A

    公开(公告)日:2016-12-21

    申请号:CN201610111581.5

    申请日:2016-02-29

    Abstract: 本发明涉及文本分割装置以及文本分割方法,将文本在适当的位置上高效地分割。计算机从将被分割成多个单词的登记字符串和区分单词数建立对应的字符串分割信息中检索文本所包含的第一字符串(步骤201)。而且,计算机在第一字符串与登记字符串对应的情况下,将第一字符串中的、包括与登记字符串建立对应的区分单词数的单词的第二字符串分割成该区分单词数的单词(步骤202)。

    转换装置和转换方法
    6.
    发明公开

    公开(公告)号:CN105808513A

    公开(公告)日:2016-07-27

    申请号:CN201610017815.X

    申请日:2016-01-12

    Abstract: 本发明涉及转换装置和转换方法。信息处理设备接收压缩文件,在该压缩文件中,以包括单个字符或多个字符的字符串为单位对具有第一字符代码的字符串数据进行压缩。信息处理设备将被包括在压缩文件中的压缩信息转换成经转换的压缩信息,所述压缩信息将所述压缩文件中的经压缩的字符串数据中的每一个映射至具有所述第一字符代码的字符串的相应单位中的每一个,从而所述经转换的压缩信息将所述压缩文件中的经压缩的字符串数据中的每一个映射至具有第二字符代码的字符串的相应单位中的每一个。信息处理设备根据被映射至经压缩和编码的字符数据串的压缩和编码的单位以及经转换的字符数据串的压缩和编码的单位的压缩信息来生成扩展文件。

    解码方法及解码装置
    7.
    发明公开

    公开(公告)号:CN105282554A

    公开(公告)日:2016-01-27

    申请号:CN201510367308.4

    申请日:2015-06-29

    CPC classification number: H03M7/3086 H03M7/425 H03M7/6005

    Abstract: 本发明提供了解码方法及解码装置,所述解码装置包括解码单元、检测单元和转换单元。解码单元将包括在编码数据中的第一编码数据解码成第一部分数据,所述编码数据从具有第一字符码的第一数据编码而来。检测单元基于所述编码数据从具有第一字符码的第一数据编码而来的字符码信息来检测第一部分数据中的字符边界。转换单元基于将第一字符码与第二字符码相关联的信息,利用检测到的字符边界将第一部分数据中的至少一部分转换成具有第二字符码的第二数据。

    提取方法、提取程序、提取装置、以及提取系统

    公开(公告)号:CN103797480A

    公开(公告)日:2014-05-14

    申请号:CN201180073519.7

    申请日:2011-09-14

    Abstract: 本发明提供提取方法、提取程序、提取装置、以及提取系统。对段(sg2(1))进行字符信息“人”的压缩符号(P(人))的汇集出现映射、字符信息“形”的压缩符号(P(形))的汇集出现映射、以及汇集删除映射的AND运算。AND结果为“1100”,可知在段(sg1(1))、(sg1(2))中有可能存在字符信息“人”和“形”。由于根据该AND结果指定了段(sg1(1))、(sg1(2)),因此执行AND运算。由此指定段(sg0(1))、段(sg0(5)),执行AND运算。由此从段(sg0(1))指定文件编号3,从段(sg0(5))指定文件编号19。因此可知在压缩文件(f3)、(f19)存在字符信息“人”和“形”这双方。

Patent Agency Ranking