-
公开(公告)号:CN112632985A
公开(公告)日:2021-04-09
申请号:CN202011507899.8
申请日:2020-12-18
Applicant: 国网北京市电力公司 , 国家电网有限公司 , 福建亿榕信息技术有限公司
IPC: G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种语料的处理方法、装置、存储介质及处理器。其中,该方法包括:获取待识别的词句;采用新词发现模型处理词句,识别出至少一个候选语料,其中,新词发现模型为采用深度学习模型训练得到的语料模型;从至少一个候选语料中确定目标语料,其中,目标语料为从词句中识别出来的新词汇。本发明解决了现有技术中获取术语过程效率低的技术问题。