一种基于海量文本的新词发现方法

    公开(公告)号:CN110222157A

    公开(公告)日:2019-09-10

    申请号:CN201910538149.8

    申请日:2019-06-20

    Abstract: 本发明公开了一种基于海量文本的新词发现方法,该方法包括步骤:(1)计算每个词内部凝固程度:计算成词概率;(2)计算每个词内部自由运用程度,计算成词的左邻/右舍字的信息熵;(3)抽离词语:把文本中出现过的所有长度不超过d的子串都当作潜在的词,即候选词;(4)发现新词:若是第一次运行,那么所有的词都是新词,若已有一个基本词库,用目前发现的新词与旧词对比,就能够发现新词。本发明通过对海量文本数据,不依赖于任何已有的词库,仅仅根据词的共同特征,将一段大规模语料中可能成词的文本片段全部提取出来,不管它是新词还是旧词,适用于任何领域。然后,再把所有抽出来的词和已有词库进行比较,从而找出新词。

    一种电力数据价值及风险判定的数据台账管理方法及系统

    公开(公告)号:CN119624174A

    公开(公告)日:2025-03-14

    申请号:CN202411684890.2

    申请日:2024-11-22

    Abstract: 本发明涉及数据要素及资产管理技术领域,尤其涉及一种电力数据价值及风险判定的数据台账管理方法及系统,包括收集技术信息以获得一手数据,进行产品开发并进行数据登记,根据登记数据使用特定方式获取结果数据,以及对产品进行评价和数据风险分析;此外,实施了一种可量化的数据价值密度判定方法,规范化了数据产品评价过程,并通过全面的数据产品加工流程管控和风险监控措施,强化了对数据安全的保护;这种管理方法不仅提升了管理人员和第三方对产品构建的监控能力,还有效地消除了数据交付和使用过程中的风险因素,保障了电力数据的安全性和准确性。

    一种电网数据多场景共享系统
    14.
    发明公开

    公开(公告)号:CN119602473A

    公开(公告)日:2025-03-11

    申请号:CN202411712159.6

    申请日:2024-11-27

    Abstract: 本发明公开了一种电网数据多场景共享系统,涉及电网技术领域,包括:数据集成与处理引擎模块、用户界面模块、物业界面模块、数据采集模块、系统异常检测模块和云端式数据库模块;数据采集模块包括有用户私人数据模块和小区公共数据模块;系统异常检测模块连接有获取电量数据模块,获取电量数据模块连接有若干个计算通道。本发明的基于多场景可共享的电网数据系统,通过业主用户界面模块和物业界面模块与数据集成与处理引擎模块相连,数据集成与处理引擎模块内部包含数据采集模块,可获取用户私人电量数据和小区公共电量数据,并将这些数据反馈至用户界面模块和物业界面模块显示,实现数据共享。同时,实时监测模块和系统异常检测模块确保系统的稳定性和实时性。

    一种电力基层单位现场抢修数字化工具系统及方法

    公开(公告)号:CN116503021A

    公开(公告)日:2023-07-28

    申请号:CN202310484085.4

    申请日:2023-04-28

    Abstract: 本发明公开了一种电力基层单位现场抢修数字化工具系统,包括:快速抢修管理模块:实现资产计划停电、营销客服报障、配网停电数据的融合,支撑停电事件主动通知与跨系统全流程处理;数据综合应用模块:实现对复电业务抢修过程的设计到的管理数据进行统计;物资管理模块:建立与物资及设备查询相关的工具,支持配电所、供电所物资需求填报,对接物资子系统,获取物资分类与品种及规格参数信息,根据物资需求上报,按需求匹配库存,对物资供应时间进行初步研判;实现物资需求全流程管控,支撑物资需求填报、库存匹配、物资配送、需求分析与建议场景应用;解决了电力基层员工电力抢修过程中工具离散、功能分散不集中、数据综合不全面等问题。

    一种从文本中挖掘和定位个人能力的方法

    公开(公告)号:CN110263341B

    公开(公告)日:2023-06-20

    申请号:CN201910538161.9

    申请日:2019-06-20

    Abstract: 本发明公开了一种从文本中挖掘和定位个人能力的方法,该方法包括步骤:将文档数据和邮件数据入数据库;采用数据库生成人名词库以及系统词库文件;根据生成的人名词库以及系统词库分词并去掉停用词;提取出所有谓词并生词谓词文件;利用谓词文件人工标注出能力词并形成能力词库文件;利用能力词文件、人名词库和系统词库分词并去掉停用词,根据正则和规则判断能力、人名之间是不是并列的关系,若是,生成能力和人员对应关系,否,则根据距离计算最近的,然后将生成对应人员能力并存入数据库。本发明能自动从对应能力查找人员,进而大幅度提高了办公效率。

Patent Agency Ranking