一种基于预训练语言模型的观点摘要评价系统

    公开(公告)号:CN113032550B

    公开(公告)日:2022-07-08

    申请号:CN202110331685.8

    申请日:2021-03-29

    Applicant: 同济大学

    Abstract: 一种基于预训练语言模型的观点摘要评价系统,包括预处理模块、观点摘要模块与算法评价模块。预处理模块包括分句处理和主观性分析,对原生语料通过分句和长度限制过滤后,借助预训练语言模型进行主观性分析以保留主观性较强的句子;观点摘要模块使用特定预训练语言模型生成语义向量并进行谱聚类,结合效果指标与少数舍弃策略获取若干个包含不同潜在主流观点的聚类簇,并从每个聚类中心附近抽取作为最终主流观点的主观句,通过语义修正以缓解口吻差异带来的阅读问题;算法评价模块借助主流观点数据集,对生成观点的主题召回率、正负极性进行自动评价,对算法生成观点与参考观点的对应程度进行人工评价,综合上述指标对摘要算法的效果给出合理评估。

    一种基于预训练语言模型的观点摘要评价系统

    公开(公告)号:CN113032550A

    公开(公告)日:2021-06-25

    申请号:CN202110331685.8

    申请日:2021-03-29

    Applicant: 同济大学

    Abstract: 一种基于预训练语言模型的观点摘要评价系统,包括预处理模块、观点摘要模块与算法评价模块。预处理模块包括分句处理和主观性分析,对原生语料通过分句和长度限制过滤后,借助预训练语言模型进行主观性分析以保留主观性较强的句子;观点摘要模块使用特定预训练语言模型生成语义向量并进行谱聚类,结合效果指标与少数舍弃策略获取若干个包含不同潜在主流观点的聚类簇,并从每个聚类中心附近抽取作为最终主流观点的主观句,通过语义修正以缓解口吻差异带来的阅读问题;算法评价模块借助主流观点数据集,对生成观点的主题召回率、正负极性进行自动评价,对算法生成观点与参考观点的对应程度进行人工评价,综合上述指标对摘要算法的效果给出合理评估。

Patent Agency Ranking