一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015B

    公开(公告)日:2024-01-30

    申请号:CN202010103483.3

    申请日:2020-02-19

    Abstract: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015A

    公开(公告)日:2020-06-23

    申请号:CN202010103483.3

    申请日:2020-02-19

    Abstract: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义向量的短文本相似性度量方法

    公开(公告)号:CN109977418B

    公开(公告)日:2023-03-31

    申请号:CN201910279109.6

    申请日:2019-04-09

    Abstract: 本发明公开一种基于语义向量的短文本相似性度量方法,对短文本t1和t2分词后,根据根动词的分布判断短文本是否存在事件块;如存在,基于根动词提取事件块,并对事件块的语义相似性进行分析。如相似,依据分词位置和词性提取修饰块,并对修饰块的语义相似性进行分析。在此基础上,以短文本t1的修饰块顺序为基准,在短文本t2中查找语义相同的块,调整到对应顺序。最后用词向量表示分词,构建短文本的语义向量,计算二者的余弦距离,作为语义相似性度量。本发明方法通过依存句法分析,提取事件块和修饰块,块内部是具有一定语义关系的若干分词,兼顾了局部的语义关系;通过基于语义分析的块交换,兼顾了多样化的语言表达特点。

    一种密码管理方法
    5.
    发明公开

    公开(公告)号:CN110401529A

    公开(公告)日:2019-11-01

    申请号:CN201910666601.9

    申请日:2019-07-23

    Abstract: 本发明公开了一种密码管理方法,包括:接收密码管理对象信息录入,使用RSA方式加密存储在数据库中,并提供授权用户的密码查看;使用SSH、JDBC方式连接密码管理对象,验证密码是否正确;提供rest接口HTTP/HTTPS方式,供第三方系统获取密码管理对象的密码;提供密码过期策略,自动生成符合密码强度规范的密码,并下发到密码管理对象修改密码,同时修改关联系统中以文件方式存储的密码。本发明将以往人工方式管理密码转变为集中统一方式管控密码,并且将以往人工修改密码的繁琐工作转变为自动化方式修改,保证企业信息系统生产环境密码安全、提高企业内IT系统服务管理水平和运行维护效率。

    一种基于模拟退火遗传算法的数据挖掘方法及系统

    公开(公告)号:CN117349341A

    公开(公告)日:2024-01-05

    申请号:CN202311224136.6

    申请日:2023-09-21

    Abstract: 本发明公开了一种基于模拟退火遗传算法的数据挖掘方法及系统,包括初始化参数;初始化种群,并计算群体中各个体的适应度;经基于免疫机制的选择操作、自适应交叉操作及自适应变异操作后生成子代,并计算子代的适应度;模拟退火交叉、变异操作,当个体通过交叉和变异操作产生新个体后,判断是否接受新个体,并对新个体进行排序,执行降温操作,判断是否满足收敛条件,如果是则输出最优解。本发明基于模拟退火算法和遗传算法,结合两种算法的特点,采用免疫机制的选择算子和基于模拟退火机制的自适应交叉、变异操作对传统遗传算法进行改进,以克服传统遗传算法的“早熟”现象,能够更好的满足数据挖掘需求,提高效率。

    RPA资源调度方法、装置、设备及存储介质

    公开(公告)号:CN117076065A

    公开(公告)日:2023-11-17

    申请号:CN202310909784.9

    申请日:2023-07-21

    Abstract: 本发明公开了一种RPA资源调度方法、装置、设备及存储介质,方法包括如下步骤:对于新进入的任务,添加状态标识为默认值;当最高优先级的队列进入新的任务时,获取任务的状态标识,若状态标识不是默认值,则根据队列中所有任务的剩余需执行时间调整时间片,若是默认值,则不调整时间片;当最高优先级的队列按照设置的时间片执行后,将队列中所有任务的状态标识修改为非默认值;判断队列中是否还存在未完成的任务,若否,结束调度,若是,则在队列数量不超预设值时,创建一个优先级低于当前优先级的队列,并将所有未完成任务放入到创建的队列中执行,以此类推,直至全部任务完成。本发明的时间片可以动态调整,降低了任务的平均周转时间和平均等待时间。

Patent Agency Ranking