-
公开(公告)号:CN116306596B
公开(公告)日:2023-09-19
申请号:CN202310271882.4
申请日:2023-03-16
Applicant: 北京语言大学
IPC: G06F40/232 , G06F18/25 , G06F18/214 , G06N3/045 , G06N3/047 , G06N3/048
Abstract: 本发明涉及语言处理技术领域,特别是指一种结合多重特征进行中文文本拼写检查的方法及装置,方法包括:获取待检查文本;获取训练完毕的文本拼写检查模型;其中,所述语义编码器为基于BERT的语义编码器;所述混淆编码器为基于Transformer的层次化混淆编码器;所述信息融合机制为基于门控和Transformer的信息融合机制;将所述待检查文本输入到所述文本拼写检查模型中,得到所述待检查文本的检查结果。采用本发明,可以将汉字的字音、字形、字义等信息融入到深度学习模型中,进而提高拼写检查模型等甄别及纠正错误的能力。
-
公开(公告)号:CN116306596A
公开(公告)日:2023-06-23
申请号:CN202310271882.4
申请日:2023-03-16
Applicant: 北京语言大学
IPC: G06F40/232 , G06F18/25 , G06F18/214 , G06N3/045 , G06N3/047 , G06N3/048
Abstract: 本发明涉及语言处理技术领域,特别是指一种结合多重特征进行中文文本拼写检查的方法及装置,方法包括:获取待检查文本;获取训练完毕的文本拼写检查模型;其中,所述语义编码器为基于BERT的语义编码器;所述混淆编码器为基于Transformer的层次化混淆编码器;所述信息融合机制为基于门控和Transformer的信息融合机制;将所述待检查文本输入到所述文本拼写检查模型中,得到所述待检查文本的检查结果。采用本发明,可以将汉字的字音、字形、字义等信息融入到深度学习模型中,进而提高拼写检查模型等甄别及纠正错误的能力。
-