-
公开(公告)号:CN116235244A
公开(公告)日:2023-06-06
申请号:CN202180061101.8
申请日:2021-04-26
Applicant: 微软技术许可有限责任公司
IPC: G10L13/08
Abstract: 一种用于从用户应用接收文本数据的混合文本到语音(TTS)系统的系统和方法;确定所接收的文本数据从该高速缓存中丢失;向远程TTS引擎并向设备中的TTS引擎两者发送所接收的文本数据;从该远程TTS引擎和该设备中的该TTS引擎两者接收语音数据;以及基于选择策略来选择或组合来自该远程TTS引擎或该设备中的该TTS引擎的语音数据。该语音数据被传送到该用户应用。
-
公开(公告)号:CN117083669A
公开(公告)日:2023-11-17
申请号:CN202180067617.3
申请日:2021-05-28
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183
Abstract: 一种用于增强演讲期间的发音的方法和系统,该方法包括:接收音频数据,音频数据包括语音;对语音执行声学评分和语言评分中的至少一项;基于声学评分和语言评分来确定语音的一个或多个单词的发音分数;确定单词的发音分数不满足阈值分数;响应于确定发音分数不满足阈值分数,将该单词识别为误读的;以及响应于将该单词识别为误读的,输出单词及其发音分数。
-