一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015B

    公开(公告)日:2024-01-30

    申请号:CN202010103483.3

    申请日:2020-02-19

    Abstract: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015A

    公开(公告)日:2020-06-23

    申请号:CN202010103483.3

    申请日:2020-02-19

    Abstract: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义向量的短文本相似性度量方法

    公开(公告)号:CN109977418A

    公开(公告)日:2019-07-05

    申请号:CN201910279109.6

    申请日:2019-04-09

    Abstract: 本发明公开一种基于语义向量的短文本相似性度量方法,对短文本t1和t2分词后,根据根动词的分布判断短文本是否存在事件块;如存在,基于根动词提取事件块,并对事件块的语义相似性进行分析。如相似,依据分词位置和词性提取修饰块,并对修饰块的语义相似性进行分析。在此基础上,以短文本t1的修饰块顺序为基准,在短文本t2中查找语义相同的块,调整到对应顺序。最后用词向量表示分词,构建短文本的语义向量,计算二者的余弦距离,作为语义相似性度量。本发明方法通过依存句法分析,提取事件块和修饰块,块内部是具有一定语义关系的若干分词,兼顾了局部的语义关系;通过基于语义分析的块交换,兼顾了多样化的语言表达特点。

    一种基于语义向量的短文本相似性度量方法

    公开(公告)号:CN109977418B

    公开(公告)日:2023-03-31

    申请号:CN201910279109.6

    申请日:2019-04-09

    Abstract: 本发明公开一种基于语义向量的短文本相似性度量方法,对短文本t1和t2分词后,根据根动词的分布判断短文本是否存在事件块;如存在,基于根动词提取事件块,并对事件块的语义相似性进行分析。如相似,依据分词位置和词性提取修饰块,并对修饰块的语义相似性进行分析。在此基础上,以短文本t1的修饰块顺序为基准,在短文本t2中查找语义相同的块,调整到对应顺序。最后用词向量表示分词,构建短文本的语义向量,计算二者的余弦距离,作为语义相似性度量。本发明方法通过依存句法分析,提取事件块和修饰块,块内部是具有一定语义关系的若干分词,兼顾了局部的语义关系;通过基于语义分析的块交换,兼顾了多样化的语言表达特点。

    一种密码管理方法
    8.
    发明公开

    公开(公告)号:CN110401529A

    公开(公告)日:2019-11-01

    申请号:CN201910666601.9

    申请日:2019-07-23

    Abstract: 本发明公开了一种密码管理方法,包括:接收密码管理对象信息录入,使用RSA方式加密存储在数据库中,并提供授权用户的密码查看;使用SSH、JDBC方式连接密码管理对象,验证密码是否正确;提供rest接口HTTP/HTTPS方式,供第三方系统获取密码管理对象的密码;提供密码过期策略,自动生成符合密码强度规范的密码,并下发到密码管理对象修改密码,同时修改关联系统中以文件方式存储的密码。本发明将以往人工方式管理密码转变为集中统一方式管控密码,并且将以往人工修改密码的繁琐工作转变为自动化方式修改,保证企业信息系统生产环境密码安全、提高企业内IT系统服务管理水平和运行维护效率。

Patent Agency Ranking