-
公开(公告)号:WO2022231126A1
公开(公告)日:2022-11-03
申请号:PCT/KR2022/003710
申请日:2022-03-18
Applicant: 삼성전자주식회사
Abstract: 다양한 실시예에 따른 전자 장치는 인스터럭션들을 포함하는 메모리; 및 상기 메모리와 전기적으로 연결되고, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는, 복수의 음소를 포함하는 학습 데이터를 수신하고, 상기 학습 데이터의 상기 복수의 음소 각각에 대한 프로소디의 값을 결정하고, 상기 복수의 음소에 대한 프로소디의 값들에 기초하여 상기 복수의 음소에 대한 군집화를 수행하여 복수의 프로소디 군집들을 결정하고, 상기 학습 데이터에 포함된 텍스트에 대응하는 음소열을 추출하고, 상기 텍스트의 발화에 대한 프로소디의 값들에 기초하여 상기 복수의 프로소디 군집들 중 하나를 선택하여 상기 발화에 대응하는 프로소디 군집 인덱스열을 추출하고, 상기 음소열 및 상기 프로소디 군집 인덱스열에 기초하여 TTS(text-to-speech) 모델을 생성할 수 있다. 그 외에도 다양한 실시예들이 가능할 수 있다.