一种基于图神经网络的司法文书案情要素实体识别方法

    公开(公告)号:CN115017144A

    公开(公告)日:2022-09-06

    申请号:CN202210598184.0

    申请日:2022-05-30

    Abstract: 本发明涉及一种基于图神经网络的司法文书案情要素实体识别方法,属于自然语言处理及自然语言理解技术领域。本发明根据文书类型、案由罪名选择对应的规则模板;对文书数据清洗,去除多余空行以及非法字符,完成半角全角符号转换;使用模板对检务文书进行段落划分;对包含案情的审理查明段落构建多路径有向无环图结构,输入图神经网络学习节点表示;将图神经网络的各节点依次输入基于注意力机制的神经网络和条件随机场进行识别结果的序列次序校对;对提取的识别结果按照所需格式生成结构化数据,提高办公效率,促进检务工作高质量发展。

    一种法律裁判文书信息抽取方法

    公开(公告)号:CN111783399A

    公开(公告)日:2020-10-16

    申请号:CN202010586120.X

    申请日:2020-06-24

    Abstract: 本发明涉及一种法律裁判文书信息抽取方法,其中,包括:步骤一:根据不同的案由选择相对应的规则引擎、关键字字典以及模版引擎;步骤二:将裁判文书进行数据清洗;步骤三:将裁判文书的内容按照分段进行分割;步骤四:将分割的裁判文书的内容作为基于注意力机制的序列作为神经网络模型的输入,进行标签信息的提取;步骤五:将神经网络提取的信息进行微调;步骤六:根据提取的标签信息以及对应的模板引擎,生成所需要格式的结构化文档。本发明针对现有规则的解析缺点,利用深度学习技术,构建了基于注意力机制的神经网络模型,可以大大提高法律要素提取的效率与准确度。

Patent Agency Ranking