一种基于预训练语言模型的中文简繁字符转换方法及系统

    公开(公告)号:CN117252154A

    公开(公告)日:2023-12-19

    申请号:CN202311541516.2

    申请日:2023-11-20

    Abstract: 本发明涉及互联网与云计算技术领域,具体公开了一种基于预训练语言模型的中文简繁字符转换方法及系统,包括:S01:分别建立简体中文嵌入空间和繁体中文嵌入空间;S02:输入文字为简体中文时查找对应的简体中文嵌入空间,获得对应的简体中文字符;S03:利用变换矩阵获得为对抗嵌入繁体中文字符;S04:计算预测得分,判断对抗嵌入繁体中文字符是否来自繁体中文嵌入空间,并优化变换矩阵;S05:对对抗嵌入繁体中文字符进行建模获得繁体上下文文本,映射回简体中文,与最初输入的简体中文进行比较,计算损失函数和概率,优化变换矩阵;S06:添加隐藏变换矩阵,对对抗嵌入繁体中文字符计算隐藏预测概率,到阈值时优化变换矩阵,对应输出繁体中文。

    一种基于预训练语言模型的中文简繁字符转换方法及系统

    公开(公告)号:CN117252154B

    公开(公告)日:2024-01-23

    申请号:CN202311541516.2

    申请日:2023-11-20

    Abstract: 本发明涉及互联网与云计算技术领域,具体公开了一种基于预训练语言模型的中文简繁字符转换方法及系统,包括:S01:分别建立简体中文嵌入空间和繁体中文嵌入空间;S02:输入文字为简体中文时查找对应的简体中文嵌入空间,获得对应的简体中文字符;S03:利用变换矩阵获得为对抗嵌入繁体中文字符;S04:计算预测得分,判断对抗嵌入繁体中文字符是否来自繁体中文嵌入空间,并优化变换矩阵;S05:对对抗嵌入繁体中文字符进行建模获得繁体上下文文本,映射回简体中文,与最初输入的简体中文进行比较,计算损失函数和概率,优化变换矩阵;S06:添加隐藏变换矩阵,对对抗嵌入繁体中文字符计算隐藏预测概率,到阈值时优化变换矩阵,对应输出繁体中文。

Patent Agency Ranking