一种文本纠错方法和装置、电子设备及存储介质

    公开(公告)号:CN115600606A

    公开(公告)日:2023-01-13

    申请号:CN202211355820.3

    申请日:2022-11-01

    Inventor: 陈焕坤 王伟 张黔

    Abstract: 本申请实施例涉及文本纠错技术领域,提供了一种文本纠错方法和装置、电子设备及存储介质,其通过获取训练样本并构建正负样本序列,通过文本纠错模型的编码模块中对应获得第一、第二和第三编码向量,在解码模块中根据第一编码向量确定输出序列;根据输出、原始文本和正确文本序列计算第一损失函数值;根据获取的第一标签字解码向量、候选字解码向量和错别字编码向量计算第二损失函数值;根据第一、第二和第三编码向量确定第三损失函数值;根据第一、第二和第三损失函数值训练文本纠错模型得到目标模型,并进行文本纠错。通过计算序列间误差、候选字和标签字间的误差和正负样本与原始文本间的误差,提高候选字间的差异性和纠错的稳定性与准确性。

Patent Agency Ranking