一种基于海量文本的新词发现方法

    公开(公告)号:CN110222157A

    公开(公告)日:2019-09-10

    申请号:CN201910538149.8

    申请日:2019-06-20

    Abstract: 本发明公开了一种基于海量文本的新词发现方法,该方法包括步骤:(1)计算每个词内部凝固程度:计算成词概率;(2)计算每个词内部自由运用程度,计算成词的左邻/右舍字的信息熵;(3)抽离词语:把文本中出现过的所有长度不超过d的子串都当作潜在的词,即候选词;(4)发现新词:若是第一次运行,那么所有的词都是新词,若已有一个基本词库,用目前发现的新词与旧词对比,就能够发现新词。本发明通过对海量文本数据,不依赖于任何已有的词库,仅仅根据词的共同特征,将一段大规模语料中可能成词的文本片段全部提取出来,不管它是新词还是旧词,适用于任何领域。然后,再把所有抽出来的词和已有词库进行比较,从而找出新词。

    一种日程信息中抽取实体的方法

    公开(公告)号:CN110245354A

    公开(公告)日:2019-09-17

    申请号:CN201910539137.7

    申请日:2019-06-20

    Abstract: 本发明公开了一种日程信息中抽取实体的方法,该方法包括步骤:对已知数据信息进行自扩展学习,寻找未知信息与已知信息之间的链接点;提取数据进行句子切分成单句、分词和词性标注,选择几个事件的抽取模式作为种子模式,构建抽取模式库:在每次迭代过程中把新生成的抽取模式追加到抽取模式库;用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;若抽取模式库中,不能进行模式匹配,则将关键词会自动添加到抽取模式库中。本发明把企业大量数据分成单句和词性标注进行提取,通过初始化种子模式的方式,自扩展的构建抽取模式库,做到自动模式匹配,匹配灵活性高,效率高,使人为纠错减少,节省企业正本,节省时间。

    一种电力终端日志分析预测系统及方法

    公开(公告)号:CN116307106A

    公开(公告)日:2023-06-23

    申请号:CN202310125678.1

    申请日:2023-02-16

    Abstract: 本发明一种电力终端日志分析预测系统及方法,设定区域内的各个电力终端均将其电力终端日志信息传输至主服务器,主服务器不对带有电力终端运行状态正常标志的电力终端日志信息进行处理,而仅对带有电力终端运行状态异常标志的电力终端日志信息进行处理,且处理顺序是按照电力终端的重要性优先级顺序进行处理,同一重要性优先级的电力终端按照时间先后顺序进行处理,处理方式是对待处理的电力终端日志信息进行预处理再提取出P个特征数据输入至对应训练好的神经网络模型中进行电力故障预测,以输出此电力终端日志信息对应的电力终端具体的电力故障类型。本发明需要处理的数据大大降低,处理速度快,效率高,分析预测结果准确性高。

    一种用于人工智能的语音采集装置

    公开(公告)号:CN113643734A

    公开(公告)日:2021-11-12

    申请号:CN202110787906.2

    申请日:2021-07-13

    Abstract: 本发明公开了一种用于人工智能的语音采集装置,包括防护壳,防护壳内放置有录音笔本体,防护壳上设有防水机构,防水机构包括旋盖,旋盖的下端固定有连接筒,连接筒的侧表面上端与防护壳的内表面上端呈螺纹连接,连接筒的表面开设有第一录音孔,防护壳的表面开设有第二录音孔,第一录音孔和第二录音孔孔径尺寸相同,防护壳的侧表面设有固定机构。本发明有利于调节语音采集装置的角度,有效提高了语音采集装置使用的灵活性和适用性,同时有利于提高防水防尘的效果。

    基于机器学习的IT故障缺陷预测方法

    公开(公告)号:CN112148578A

    公开(公告)日:2020-12-29

    申请号:CN202011081775.8

    申请日:2020-10-12

    Abstract: 本发明公开了一种基于机器学习的IT故障缺陷预测方法,属于计算机领域。该方法包括以下步骤:S1:数据采集;S2:数据接入;S3:实时搜索日志;S4:Spark计算;S5:Spark离线计算模型;S6:Spark Streaming实时计算;S7:将分析结果、异常告警、日志趋势、故障定位和缺陷预测,以图形化方式展现,并且提供Web方式的日志查询及查看、导出报表。该方法采用了成熟的流式收集、存储功能,同时利用日志的分布式特性实现可扩展架构,将大量收集任务、运算任务放在后台,将结果展现在前台供使用,结果分为实时性要求较高的流式运算和统计量更大的批处理任务。

Patent Agency Ranking