-
公开(公告)号:CN103064844A
公开(公告)日:2013-04-24
申请号:CN201110319562.9
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提出了一种索引装置,包括:非规则字符串切分模块,对文档中的非规则字符串进行切分;索引建立模块,根据切分后得到的字符串和所述文档建立索引。在该技术方案中,提出对文档中的非规则字符串进行切分,将切分后的新字符串作为关键词建立索引,可以合理地控制索引结构中的关键词指向的文件链表的长度,以及关键词列表的长度,即能够控制索引大小在计算机内存可接受的范围内,可以提高字符串检索速度。本发明还提供一种索引方法、一种检索装置、一种检索装置和一种检索系统。
-
公开(公告)号:CN103064847A
公开(公告)日:2013-04-24
申请号:CN201110319568.6
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提出了一种索引装置,包括:数字串切分模块,对文档中的数字串进行切分;索引建立模块,根据切分后得到的新数字串和所述文档建立索引。在该技术方案中,提出对文档中的数字串进行切分,将切分后的新数字串作为关键词建立索引,可以合理地控制索引结构中的关键词指向的文件链表的长度,以及关键词列表的长度,即能够控制数字串建立的索引大小在计算机内存可接受的范围内,可以提高数字串检索速度。本发明还提出索引方法、检索装置、检索方法和检索系统。
-
公开(公告)号:CN103064840A
公开(公告)日:2013-04-24
申请号:CN201110319548.9
申请日:2011-10-20
Applicant: 北京中搜网络技术股份有限公司
IPC: G06F17/30
Abstract: 本发明提出一种索引装置,包括:高频词处理模块,在文档中的当前词为高频词时,根据所述当前词邻接的前侧词和/或后侧词,对所述当前词进行扩展;索引建立模块,根据扩展得到的新词和所述文档建立索引。在该技术方案中,通过对文档关键词中的高频词进行扩展处理,降低了关键词中高频词的数量,避免了利用大量高频词建立索引而导致过高的检索量和过长的检索时间。本发明还提供索引方法、检索装置、检索方法和检索系统。
-
-