-
公开(公告)号:CN101107602B
公开(公告)日:2012-01-18
申请号:CN200580005139.4
申请日:2005-01-03
Applicant: 汤姆森路透社全球资源公司
Inventor: 迈克尔·达恩 , 卡利德·阿尔-科法伊 , 彼得·杰克逊
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/3347 , G06F16/38 , G06F16/951
Abstract: 为了便于法律研究,诸如Thomson West的公司提供了基于订阅的在线信息检索系统。为了寻求提高这些以及相关的IR系统,本发明人意识到研究者常常忽略可能对他们有用的一些文档类型,诸如法律百科全书和论文。因此,本发明人设计了自动搜索不被用户查询特别当作目标的其它类型的文档的系统、方法和软件。一个示范系统自动地递交对于法律意见的用户查询给第一和第二数据库,第一数据库存储法律意见,并且第二数据库存储非意见文档,诸如来自West Key Number系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。
-
公开(公告)号:CN102456075B
公开(公告)日:2016-01-27
申请号:CN201110370761.2
申请日:2005-01-03
Applicant: 汤姆森路透社全球资源公司
Inventor: 迈克尔·达恩 , 卡利德·阿尔-科法伊 , 彼得·杰克逊
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/3347 , G06F16/38 , G06F16/951
Abstract: 本发明公开了响应来自用户的查询的方法和系统。为了便于法律研究,诸如Thomson West的公司提供了基于订阅的在线信息检索系统。为了寻求提高这些以及相关的IR系统,本发明人意识到研究者常常忽略可能对他们有用的一些文档类型,诸如法律百科全书和论文。因此,本发明人设计了自动搜索不被用户查询特别当作目标的其它类型的文档的系统、方法和软件。一个示范系统自动地递交对于法律意见的用户查询给第一和第二数据库,第一数据库存储法律意见,并且第二数据库存储非意见文档,诸如来自West Key Number系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。
-
公开(公告)号:CN105045888A
公开(公告)日:2015-11-11
申请号:CN201510448878.6
申请日:2015-07-28
Applicant: 浪潮集团有限公司
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/322 , G06F16/374
Abstract: 本发明公开一种用于HMM的分词训练语料标注方法,属于大数据语言处理领域;利用trie将已有实体词词典的内容构建成字典树:构建trie字典树函数,标注字典文件全路径及文件名,将字典文件中每个词加入Set,利用开源org.ahocorasick.trie将输入的词加入trie树,从字符串中识别出trie树包含的词函数,读取特定文档,判断是否有文本行,若有则取出文本行与字典树匹配,匹配成功的词加入tagList中,遍历tagList,在待识别实体词的特定文档中识别出的词的一部分,按HMM构建模型时的需求将实体词按词首和词中进行标注状态的语料标注。
-
公开(公告)号:CN106844648A
公开(公告)日:2017-06-13
申请号:CN201710047514.6
申请日:2017-01-22
Applicant: 中央民族大学
Inventor: 王志娟
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/5846 , G06F16/951
Abstract: 本发明涉及一种基于图片构建资源稀缺语言可比语料库的方法及系统,该方法包括:S110,下载资源稀缺语言的网页,并作为资源稀缺语言文本,所述网页包括文本中的图片;S120,搜索包含资源稀缺语言文本相同或相似图片的资源丰富语言的网页,作为资源丰富语言文本;S130,对资源稀缺语言和资源丰富语言的网页进行特征提取;S140,基于所述特征计算具有相同或相似图片的资源稀缺语言和资源丰富语言网页的相似度值;S150,选取相似度值最高的资源丰富语言文本作为资源稀缺语言文本的可比文本;S160,重复S120‑S150,直至所有资源稀缺语言网页找到资源丰富语言的可比文本。本发明不受资源稀缺语言信息处理技术以及资源的限制,可以较低成本、快速构建资源稀缺语言的跨语言可比语料库。
-
公开(公告)号:CN105868277A
公开(公告)日:2016-08-17
申请号:CN201610165714.7
申请日:2016-03-21
Applicant: 广东欧珀移动通信有限公司
Inventor: 曾元清
IPC: G06F17/30
CPC classification number: G06F16/90335 , G06F16/3332
Abstract: 本发明公开了一种系统功能搜索方法、装置和终端设备,其中,方法包括:获取用户向预设的系统功能搜索接口输入的文本标签;查询预设的系统标签库,获取与文本标签对应的系统功能;向用户提供与系统功能对应的操作界面。该方法通过将文本标签与系统功能相对应,并根据文本标签对系统功能进行搜索,提高了搜索系统功能的效率,降低了对系统功能进行搜索的难度,提升了用户体验。
-
公开(公告)号:CN104424263A
公开(公告)日:2015-03-18
申请号:CN201310384765.5
申请日:2013-08-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/2452
Abstract: 本发明实施例公开了一种数据记录的处理方法及装置,其中,所述方法包括:识别需要进行字段翻译的目标数据记录的数据类型;选取与所述数据类型匹配的预先配置的翻译规则,根据选取的翻译规则,并根据所述目标数据记录中各字段的值以及位置,翻译得到新字段值;将所述翻译得到的新字段值添加到所述目标数据记录中由所述选取的翻译规则指示的位置。采用本发明,可以根据配置的翻译规则来完成数据记录中字段的翻译,不必编写复杂的翻译代码,可移植性较好。
-
公开(公告)号:CN106095763A
公开(公告)日:2016-11-09
申请号:CN201610160631.9
申请日:2016-03-21
Applicant: 株式会社日立制作所
IPC: G06F17/30
CPC classification number: G06F16/29 , G06F16/3334 , G06F16/3332 , G06F16/9537
Abstract: 一种数据加工辅助方法、数据处理服务器以及程序,即使是与数据的加工有关的知识、技能少的用户,也能够容易地进行从门户网站等Web网站取得的数据的加工。从客户终端接受包含地理名的检索句,分解该检索句,从Web网站取得该分解信息各自的关联数据,将上述各分解信息和该分解信息的上述关联数据对应地存储到存储部中,对每个上述分解信息判定该分解信息的关联数据的记录中是否有多个纬度、经度信息,根据该判定的结果,对上述存储部的相应分解信息设定网格显示标志或针显示标志,根据上述网格显示标志的值和上述针显示标志的值,对相应分解信息的关联数据进行向地图上的多边形显示处理、网格显示处理或针显示处理,将该处理结果发送到上述客户终端。
-
公开(公告)号:CN105138590A
公开(公告)日:2015-12-09
申请号:CN201510464596.5
申请日:2015-07-31
Applicant: 北京嘀嘀无限科技发展有限公司
Inventor: 卢海阳
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/35
Abstract: 本发明提供了一种轨迹预测方法及装置,所述方法包括:针对待预测轨迹的用户设备UE,获取打车平台在预设时间段内记录的UE发出打车请求的出发地信息和目的地信息;根据预先建立的分类模型,对所有的出发地信息和/或目的地信息进行分类处理,确定所述UE在预设时间段内的分类类型,该分类类型为属于预设的POI分类类型中的一种或多种;根据所述UE在预设时间段内的分类类型,预测所述UE的轨迹。本发明能够根据从用户打车系统中获取的打车数据获取用户的兴趣点,进而预测用户的出行轨迹。
-
公开(公告)号:CN102456075A
公开(公告)日:2012-05-16
申请号:CN201110370761.2
申请日:2005-01-03
Applicant: 汤姆森路透社全球资源公司
Inventor: 迈克尔·达恩 , 卡利德·阿尔-科法伊 , 彼得·杰克逊
IPC: G06F17/30
CPC classification number: G06F16/3332 , G06F16/3347 , G06F16/38 , G06F16/951
Abstract: 本发明公开了响应来自用户的查询的方法和系统。为了便于法律研究,诸如ThomsonWest的公司提供了基于订阅的在线信息检索系统。为了寻求提高这些以及相关的IR系统,本发明人意识到研究者常常忽略可能对他们有用的一些文档类型,诸如法律百科全书和论文。因此,本发明人设计了自动搜索不被用户查询特别当作目标的其它类型的文档的系统、方法和软件。一个示范系统自动地递交对于法律意见的用户查询给第一和第二数据库,第一数据库存储法律意见,并且第二数据库存储非意见文档,诸如来自WestKeyNumber系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。
-
公开(公告)号:CN105550282A
公开(公告)日:2016-05-04
申请号:CN201510915999.7
申请日:2015-12-10
Applicant: 成都陌云科技有限公司
IPC: G06F17/30
CPC classification number: G06F16/9535 , G06F16/3332
Abstract: 本发明提供了一种利用多维数据预测用户兴趣的方法,该方法包括:接收用户所输入的检索词和用户特征信息,根据所述用户特征信息对检索词进行优化调整,将优化调整后的检索词作为参数形成检索结果列表,返回给用户端。本发明提出了一种利用多维数据预测用户兴趣的方法,有效提高互联网用户特征的识别准确率和时效性。
-
-
-
-
-
-
-
-
-