-
公开(公告)号:CN113569016A
公开(公告)日:2021-10-29
申请号:CN202111132931.3
申请日:2021-09-27
Applicant: 北京语言大学
Abstract: 本发明公开了一种基于Bert模型的专业术语提取方法及装置,涉及词语提取技术领域,方法包括:将待提取数据分别输入到通用Bert模型以及专业Bert模型,得到通用attention矩阵以及专业attention矩阵;在专业attention矩阵中确定出满足成词条件的最小矩阵,将最小矩阵对应的词语加入到专业术语候选集;在通用attention矩阵中确定专业术语候选集中的词语对应的关系矩阵,将不满足成词条件的词语确定为专业术语。采用本发明,可以节省成本,提高专业术语提取的准确率。
-
公开(公告)号:CN113569016B
公开(公告)日:2022-01-25
申请号:CN202111132931.3
申请日:2021-09-27
Applicant: 北京语言大学
Abstract: 本发明公开了一种基于Bert模型的专业术语提取方法及装置,涉及词语提取技术领域,方法包括:将待提取数据分别输入到通用Bert模型以及专业Bert模型,得到通用attention矩阵以及专业attention矩阵;在专业attention矩阵中确定出满足成词条件的最小矩阵,将最小矩阵对应的词语加入到专业术语候选集;在通用attention矩阵中确定专业术语候选集中的词语对应的关系矩阵,将不满足成词条件的词语确定为专业术语。采用本发明,可以节省成本,提高专业术语提取的准确率。
-