一种热点分析建模方法
    23.
    发明公开

    公开(公告)号:CN111368539A

    公开(公告)日:2020-07-03

    申请号:CN202010135826.4

    申请日:2020-03-02

    Abstract: 本发明公开了一种热点分析建模方法,该方法包括步骤:数据获取:从客服工单信息表中选取数据宽表作为建模数据;数据处理:剔除来电内容为‘无意义的来电内容工单;搭建停用词词库:搭建通用的停用词词库,根据停用词库中文分词,根据分词结果对停用词词库进行更新;分词:利用结巴中文分词方法对客服工单中的来电内容进行中文分词,其中分词用到的分词词典为通用词典,根据通用词库进行中文分词,分词结果进行去停用词处理;构建分词词典;提取关键词:根据停用词词库以及自定义词典,选取tf-idf的关键词提取方法进行关键词提取。本发明关键词提取方法准确率最高,且停用词词库和分词词库不断更新,词库不断丰富,分词以及关键词提取的准确率越高。

    一种从交互数据中提取有效时间的方法

    公开(公告)号:CN110222346A

    公开(公告)日:2019-09-10

    申请号:CN201910538158.7

    申请日:2019-06-20

    Abstract: 本发明公开了一种从交互数据中提取有效时间的方法,该方法包括步骤:对文件进行内容提取,获得实体和有效时间;对提取实体和有效时间就你行文本拆分建模,利用结巴分词进行词性标注,通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取有效时间,转换为标准格式输出;核对内容。本发明能判断是否是有效时间,并从时间先后顺序进行了排序,能大幅度的提高时间填写的准确性,从而达到效率的提升。

Patent Agency Ranking