-
公开(公告)号:CN112395833A
公开(公告)日:2021-02-23
申请号:CN202011073266.0
申请日:2020-10-09
Applicant: 贵州电网有限责任公司
IPC: G06F40/154
Abstract: 本发明公开了一种异构源文档静态化html处理方法,通过将不同源文档统一转换为PDF,再将PDF转换为HTML,从而避降低了将文档直接转换为html的难度,也避免了文档直接转换为html可能会造成的样式错乱及内容丢失的情况。从而提升了工作效率,也便于数据存储和文件传输。
-
公开(公告)号:CN112163158A
公开(公告)日:2021-01-01
申请号:CN202011074519.6
申请日:2020-10-09
Applicant: 贵州电网有限责任公司
IPC: G06F16/9535 , G06F16/9538 , G06F16/335 , G06F16/338 , G06F16/33 , G06F16/35 , G06K9/62
Abstract: 本发明公开了一种基于搜索历史、浏览足迹的搜索推荐方法,本发明首先通过文档相似度算法处理大量文档,并建立文档相似度关系,同时记录用户的搜索历史和浏览足迹,对搜索历史进行语义分词提取关键词并通过关键词匹配文档与浏览足迹相似文档进行组合去重,最后推荐给用户,从而解决传统推荐算法推荐不准、重复的问题。
-
公开(公告)号:CN111368539A
公开(公告)日:2020-07-03
申请号:CN202010135826.4
申请日:2020-03-02
Applicant: 贵州电网有限责任公司
IPC: G06F40/289 , G06F40/242
Abstract: 本发明公开了一种热点分析建模方法,该方法包括步骤:数据获取:从客服工单信息表中选取数据宽表作为建模数据;数据处理:剔除来电内容为‘无意义的来电内容工单;搭建停用词词库:搭建通用的停用词词库,根据停用词库中文分词,根据分词结果对停用词词库进行更新;分词:利用结巴中文分词方法对客服工单中的来电内容进行中文分词,其中分词用到的分词词典为通用词典,根据通用词库进行中文分词,分词结果进行去停用词处理;构建分词词典;提取关键词:根据停用词词库以及自定义词典,选取tf-idf的关键词提取方法进行关键词提取。本发明关键词提取方法准确率最高,且停用词词库和分词词库不断更新,词库不断丰富,分词以及关键词提取的准确率越高。
-
公开(公告)号:CN110222346A
公开(公告)日:2019-09-10
申请号:CN201910538158.7
申请日:2019-06-20
Applicant: 贵州电网有限责任公司
Abstract: 本发明公开了一种从交互数据中提取有效时间的方法,该方法包括步骤:对文件进行内容提取,获得实体和有效时间;对提取实体和有效时间就你行文本拆分建模,利用结巴分词进行词性标注,通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取有效时间,转换为标准格式输出;核对内容。本发明能判断是否是有效时间,并从时间先后顺序进行了排序,能大幅度的提高时间填写的准确性,从而达到效率的提升。
-
公开(公告)号:CN110197197A
公开(公告)日:2019-09-03
申请号:CN201910301144.3
申请日:2019-04-15
Applicant: 贵州电网有限责任公司
IPC: G06K9/62
Abstract: 本发明涉及一种基于文本相似度改进的电网档案相似度计算方法,属于文件管理技术领域。该方法包括以下步骤:S1:属性分类及相似度定义;S2:定义全属性综合相似度;S3:同义词转换;S4:获得文本相对相似度。本发明利用系统间的共有属性的数据,快速、简单、有效地得到电网档案中文本的相似度,更有利于对电网档案的管理。
-
公开(公告)号:CN110196912A
公开(公告)日:2019-09-03
申请号:CN201910300326.9
申请日:2019-04-15
Applicant: 贵州电网有限责任公司
Abstract: 本发明涉及一种基于信任规则网络的电网档案平行模型构建方法,属于电子档案管理技术领域。该方法包括以下步骤:S1:梳理信任规则;S2:建立信任度评价网络;S3:构建平行模型。本发明融合多个系统数据,能够构建一套基于原模型,通过叠加、裁剪、连接和融合的,建立与原模型等价的模拟平行模型,能够跨越电网站线变户档案差异大的难题,且数据更真实、有效。
-
-
-
-
-