-
公开(公告)号:CN112926343A
公开(公告)日:2021-06-08
申请号:CN201911244080.4
申请日:2019-12-06
Applicant: 搜狗(杭州)智能科技有限公司 , 北京搜狗科技发展有限公司
IPC: G06F40/58
Abstract: 本发明实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:获取源语言文本;依据文字要素信息对所述源语言文本中各文字进行编码,得到所述源语言文本对应的编码信息;采用机器翻译模型依据所述源语言文本对应的编码信息,将所述源语言文本翻译为目标语言文本;相对于现有技术直接对源语言文本中文字进行编码而言,本发明实施例能够对源语言文本进行更细粒度的编码,从而能够提高机器翻译模型翻译的质量。
-
公开(公告)号:CN112199963A
公开(公告)日:2021-01-08
申请号:CN202011063600.4
申请日:2020-09-30
Applicant: 北京搜狗科技发展有限公司
IPC: G06F40/56 , G06F40/58 , G06F40/284 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供了一种文本处理方法、装置和用于文本处理的装置。其中的方法包括:对原文本进行向量化处理,得到原文本向量;将所述原文本向量输入第一模型,通过所述第一模型输出目标文本,所述原文本和所述目标文本对应相同的语言,所述第一模型包括拷贝网络,所述拷贝网络用于在所述目标文本中保留所述原文本中的拷贝文本,所述第一模型基于第一语言对应第二语言的翻译平行语料以及第二模型的输出结果训练得到,所述第二模型用于将第一语言的文本翻译为第二语言的文本。本发明实施例可以提高文本润色的效率和准确性。
-
公开(公告)号:CN112926343B
公开(公告)日:2024-11-05
申请号:CN201911244080.4
申请日:2019-12-06
Applicant: 北京搜狗科技发展有限公司
IPC: G06F40/58
Abstract: 本发明实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:获取源语言文本;依据文字要素信息对所述源语言文本中各文字进行编码,得到所述源语言文本对应的编码信息;采用机器翻译模型依据所述源语言文本对应的编码信息,将所述源语言文本翻译为目标语言文本;相对于现有技术直接对源语言文本中文字进行编码而言,本发明实施例能够对源语言文本进行更细粒度的编码,从而能够提高机器翻译模型翻译的质量。
-
公开(公告)号:CN112199963B
公开(公告)日:2024-12-20
申请号:CN202011063600.4
申请日:2020-09-30
Applicant: 北京搜狗科技发展有限公司
IPC: G06F40/56 , G06F40/58 , G06F40/284 , G06F40/295 , G06N3/0455 , G06N3/08
Abstract: 本发明实施例提供了一种文本处理方法、装置和用于文本处理的装置。其中的方法包括:对原文本进行向量化处理,得到原文本向量;将所述原文本向量输入第一模型,通过所述第一模型输出目标文本,所述原文本和所述目标文本对应相同的语言,所述第一模型包括拷贝网络,所述拷贝网络用于在所述目标文本中保留所述原文本中的拷贝文本,所述第一模型基于第一语言对应第二语言的翻译平行语料以及第二模型的输出结果训练得到,所述第二模型用于将第一语言的文本翻译为第二语言的文本。本发明实施例可以提高文本润色的效率和准确性。
-
-
-