司法裁判文书摘要生成方法及系统

    公开(公告)号:CN117708644A

    公开(公告)日:2024-03-15

    申请号:CN202311592898.1

    申请日:2023-11-27

    Applicant: 中南大学

    Abstract: 本发明公开了一种司法裁判文书摘要生成方法及系统,具体过程为:获取句子语义功能标签;获取包含语义功能信息的句子关键程度向量;生成抽取式摘要;训练长文本摘要模型;生成生成式摘要;本发明利用条件归一化将句子法律语义功能信息融合到关键句的分类中,使关键句的选取更具有逻辑性。本发明以RoFormer+Unilm的方式构建生成式摘要模型,更适应法律文领域中常见的长文本情况。同时将法律词典融合到生成式摘要的生成中,使最终的生成式摘要更具专业性。

    基于深度学习的中文电子病历实体及关系联合抽取方法

    公开(公告)号:CN112542222B

    公开(公告)日:2024-02-02

    申请号:CN202011516382.5

    申请日:2020-12-21

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于深度学习的中文电子病历实体及关系联合抽取方法,包括:1,预处理得到语句序列特征的每个字对应的特征向量X;2,将待抽取的关系用三元组表示为(s,r,o);将X作为实体抽取层网络的输入,预测获得实体subject的实体信息;3,将X和实体信息拼接作为自注意力机制的key和value,获取注意力权重α,将α和1‑α分别作为权重,以加权求和的方式得到两者结合的信息向量;4,基于信息向量获得实体object的首尾位置和关系类别r;5,基于三元组(s,r,o),根据实体subject的实体类别和关系类别r,得到实体object的实体类别。本发明对关系重叠和单句多关系的识别效果良好,解决了实体信息和编码信息的自适应结合问题,能够

    文本摘要抽取方法、计算机装置、产品及存储介质

    公开(公告)号:CN113887240A

    公开(公告)日:2022-01-04

    申请号:CN202111185278.7

    申请日:2021-10-12

    Applicant: 中南大学

    Abstract: 本发明公开了一种文本摘要抽取方法、计算机装置、产品及存储介质,提出双层记忆网络,使句子向量融合了上下文中的语义关系。变换后的记忆网络有两层,第一层是单向记忆网络,第二层是双向记忆网络。为了使后续句子分类时充分融合前文已有信息,本发明通过单向记忆网络将目标语句向量和前文语句向量相结合。在单向记忆网络中,前文的句子向量被不加区分地融合,为了引入句子在司法裁判文书中的位置信息,本发明通过双向记忆网络将目标语句向量和其上下文语句向量相结合。本发明可以在将裁判文书的上下文语义融入句子本身的语义特征,使抽取式摘要更精准,更符合司法裁判文书的逻辑性,极大地提高了句子分类准确率。

    基于深度学习的中文电子病历实体及关系联合抽取方法

    公开(公告)号:CN112542222A

    公开(公告)日:2021-03-23

    申请号:CN202011516382.5

    申请日:2020-12-21

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于深度学习的中文电子病历实体及关系联合抽取方法,包括:1,预处理得到语句序列特征的每个字对应的特征向量X;2,将待抽取的关系用三元组表示为(s,r,o);将X作为实体抽取层网络的输入,预测获得实体subject的实体信息;3,将X和实体信息拼接作为自注意力机制的key和value,获取注意力权重α,将α和1‑α分别作为权重,以加权求和的方式得到两者结合的信息向量;4,基于信息向量获得实体object的首尾位置和关系类别r;5,基于三元组(s,r,o),根据实体subject的实体类别和关系类别r,得到实体object的实体类别。本发明对关系重叠和单句多关系的识别效果良好,解决了实体信息和编码信息的自适应结合问题,能够准确有效地联合抽取中文电子病历中的实体及关系。

Patent Agency Ranking