-
公开(公告)号:CN118898246A
公开(公告)日:2024-11-05
申请号:CN202410937119.5
申请日:2024-07-12
Applicant: 中国人民解放军战略支援部队信息工程大学
IPC: G06F40/232 , G06V30/26 , G06N3/045 , G06N3/08
Abstract: 本申请提供了一种结合候选字符生成策略的地理文本校正方法,属于自然语言处理技术领域,具体包括基于道路网数据以及出行类应用程序数据,构建含有地理信息文本的地理信息语料库;构建初始软掩码BERT模型;在初始软掩码BERT模型的候选字符集中增加形近字计算策略,获得软掩码BERT模型;利用地理信息语料库对软掩码BERT模型进行训练;利用训练后的软掩码BERT模型对待校正地理文本进行校正。通过本申请的处理方案,提高了形近字文本校正率。