一种基于微调ChatGLM2的滑坡知识图谱智能生成方法

    公开(公告)号:CN119357404A

    公开(公告)日:2025-01-24

    申请号:CN202411377327.0

    申请日:2024-09-30

    Applicant: 郑州大学

    Abstract: 本发明公开了一种基于微调ChatGLM2的滑坡知识图谱智能生成方法,属于知识图谱技术领域,包括:将收集的第一数据信息处理成文本格式;对第一数据信息进行初步清洗,划分为多条语句信息,基于正则表达式对语句信息进行深度清洗获得第二数据信息;将第二数据信息输入ChatGLM2 130B,基于构建的问答模板对第二数据信息进行三元组粗划分和人工校对,获得三元组数据集;基于模型微调技术对ChatGLM2 6B的参数进行训练并加载至大语言模型中,输入三元组数据集生成三元组集合;拆分三元组集合获得实体关系表并进行去重,获得滑坡知识图谱,导入至Neo4j数据库。通过本发明提升了滑坡知识图谱的建立效率。

    一种基于微调ChatGLM2的滑坡知识图谱智能生成方法

    公开(公告)号:CN119357404B

    公开(公告)日:2025-04-08

    申请号:CN202411377327.0

    申请日:2024-09-30

    Applicant: 郑州大学

    Abstract: 本发明公开了一种基于微调ChatGLM2的滑坡知识图谱智能生成方法,属于知识图谱技术领域,包括:将收集的第一数据信息处理成文本格式;对第一数据信息进行初步清洗,划分为多条语句信息,基于正则表达式对语句信息进行深度清洗获得第二数据信息;将第二数据信息输入ChatGLM2 130B,基于构建的问答模板对第二数据信息进行三元组粗划分和人工校对,获得三元组数据集;基于模型微调技术对ChatGLM2 6B的参数进行训练并加载至大语言模型中,输入三元组数据集生成三元组集合;拆分三元组集合获得实体关系表并进行去重,获得滑坡知识图谱,导入至Neo4j数据库。通过本发明提升了滑坡知识图谱的建立效率。

Patent Agency Ranking