-
公开(公告)号:KR1020080030338A
公开(公告)日:2008-04-04
申请号:KR1020060096296
申请日:2006-09-29
Applicant: 한국전자통신연구원
CPC classification number: G10L13/033
Abstract: A method for converting pronunciation using boundary pause intensity and a voice synthesizing system based on the same are provided to improve the accuracy of pronunciation conversion by generating a pronunciation conversion model in consideration of a previous pronunciation-converted formant environment as well as front/back pronunciation-converted formant environment. A synthesis database processing unit(610) processes a synthesis database such that a pronunciation variation phenomenon at a boundary of words can be reflected. A training DB generating unit(620) extracts a feature parameter from the processed synthesis database and generates a training DB. A pronunciation conversion model generating unit(630) trains the training DB based on the extracted feature parameter to generate a pronunciation conversion model, extracts a word with which a pronunciation conversion error frequently occurs in the training process, and makes an exceptional pronunciation dictionary. A pre-processing unit(640) performs pre-processing on input text. A language analyzing unit(650) receives the pre-processed input text and performs language analyzing on the same to predict a boundary intensity between words based on the language analysis result. A feature extracting unit(660) extracts a feature parameter for pronunciation conversion by using the language analysis result and the predicted inter-word boundary intensity information. A pronunciation sequence generating unit(670) generates pronunciation sequences with respect to the input text based on the pronunciation conversion model or the exceptional pronunciation dictionary. A synthesized sound generating unit(680) generates a synthesized sound with respect to the generated pronunciation sequences and outputs the same.
Abstract translation: 提供了一种使用边界暂停强度转换发音的方法和基于该语音合成系统的语音合成系统,以通过考虑到先前的发音转换共振峰环境以及前/后发音产生语音转换模型来提高语音转换的准确性 转型共振峰环境。 合成数据库处理单元(610)处理合成数据库,使得可以反映单词边界处的发音变化现象。 训练数据库生成部(620)从处理后的合成数据库中提取特征参数,生成训练数据DB。 发音转换模型生成单元(630)基于所提取的特征参数对训练数据库进行训练以产生语音转换模型,提取在训练处理中经常发生语音转换错误的单词,并且形成例外的发音词典。 预处理单元(640)对输入文本执行预处理。 语言分析单元(650)接收预处理的输入文本,并根据语言分析结果对其进行语言分析以预测单词之间的边界强度。 特征提取单元(660)通过使用语言分析结果和预测的单词间边界强度信息来提取用于发音转换的特征参数。 发音序列生成单元(670)基于发音转换模型或异常发音字典,生成关于输入文本的发音顺序。 合成声音产生单元(680)生成关于所生成的发音序列的合成声音并输出。
-
公开(公告)号:KR100655489B1
公开(公告)日:2006-12-08
申请号:KR1020040101879
申请日:2004-12-06
Applicant: 한국전자통신연구원
IPC: G10L15/20
Abstract: 본 발명은 잡음환경하의 음성인식엔진 평가 시스템 및 자동화 방법에 관한 것으로서, 클라이언트 단말을 통해 잡음과 대상어휘 음성을 조합하여 출력시키는 단계와, 상기 조합된 데이터를 입력받은 서버에서 잡음을 제거하고 음성인식 처리를 수행하여 상기 대상어휘를 출력시키는 단계로 진행하여, 다양한 잡음의 조합, 잡음의 크기, 반복을 설정한 후 음성과 결합시켜 테스트할 수 있기 때문에, 잡음의 종류와 크기에 따라 음성인식에 얼마나 많은 영향을 미치는 지를 실시간으로 확인할 수 있다.
다중잡음, 음성결합, 음성인식엔진, 분석자동화Abstract translation: 本发明涉及一种在嘈杂环境中的语音识别引擎评估系统和自动化方法,该方法包括:通过客户端输出噪声和目标词汇语音的组合;从接收组合数据的服务器去除噪声; 然后输出目标词汇,这样可以设置各种噪声的组合,噪声的大小和重复的组合,然后结合语音进行测试,因此根据噪声的类型和大小, 你可以实时看到它是否有很大的影响。
-
公开(公告)号:KR1020070058953A
公开(公告)日:2007-06-11
申请号:KR1020060060365
申请日:2006-06-30
Applicant: 한국전자통신연구원
Abstract: A method and an apparatus for generating a response message in a speech dialogue system are provided to modify a search result to a natural expression for a user when the search result is provided to the user. An explanation file information database is constructed. When information on a response to a user's inquiry does not exist in a user information database(S408), an information search request message is transmitted to an information search server(S418). When a search result received from the information search service is a nominal form(S412), vocabularies included in the search result are integrated into vocabulary and it is determined whether the integrated vocabulary exists in the explanation file information database. When the integrated vocabulary does not exist in the explanation file information database, the integrated vocabulary is split into vocabularies based on spacing wards. It is determined whether the split vocabularies exist in the explanation file information database. When the split vocabularies exist in the explanation file information database, a response message is generated using explanations respectively corresponding to the vocabularies(S414).
Abstract translation: 提供了一种用于在语音对话系统中生成响应消息的方法和装置,用于当将搜索结果提供给用户时将搜索结果修改为用户的自然表达。 构建说明文件信息数据库。 当在用户信息数据库中不存在关于用户询问的响应的信息时(S408),信息搜索请求消息被发送到信息搜索服务器(S418)。 当从信息搜索服务接收的搜索结果是标称形式(S412)时,包括在搜索结果中的词汇被集成到词汇中,并且确定综合词汇是否存在于说明文件信息数据库中。 当解释文件信息数据库中不存在综合词汇时,基于间隔区将综合词汇表分割成词汇。 确定解释文件信息数据库中是否存在拆分词汇。 当分解词汇存在于说明文件信息数据库中时,使用分别对应于词汇的说明来生成响应消息(S414)。
-
公开(公告)号:KR100792208B1
公开(公告)日:2008-01-08
申请号:KR1020060060365
申请日:2006-06-30
Applicant: 한국전자통신연구원
Abstract: 본 발명은 영역별 설명문 파일 정보 데이터베이스를 구축하고, 상기 사용자 질의에 대한 답변 정보가 사용자 정보 데이터베이스에 존재하지 않은 경우, 정보 검색 서버에 접속하여 정보 검색 요청 메시지를 전송하고, 상기 정보 검색 서버로부터 수신된 검색 결과가 명사형인 경우, 상기 검색 결과에 포함된 어휘를 통합된 어휘로 만들어 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 상기 통합된 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하지 않으면, 상기 통합된 어휘를 띄어쓰기를 기준으로 한 어휘로 분리하고, 상기 분리된 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하는지를 판단하고, 상기 판단결과 각 어휘가 상기 영역별 설명문 파일 정보 데이터베이스에 존재하면, 상기 각 어휘에 해당하는 설명문을 이용하여 답변 문장을 생성하는 것으로서, 웹사이트를 통하여 검색된 검색결과를 사용자에게 제공할 때, 검색 결과 그대로 사용자에게 답변하기보다는 사용자가 듣기에 자연스러운 표현으로 수정하여 답변 문장을 제공할 수 있다.
음성대화시스템, 답변문장, 정보검색-
公开(公告)号:KR1020060062884A
公开(公告)日:2006-06-12
申请号:KR1020040101879
申请日:2004-12-06
Applicant: 한국전자통신연구원
IPC: G10L15/20
Abstract: 본 발명은 잡음환경하의 음성인식엔진 평가 시스템 및 자동화 방법에 관한 것으로서, 클라이언트 단말을 통해 잡음과 대상어휘 음성을 조합하여 출력시키는 단계와, 상기 조합된 데이터를 입력받은 서버에서 잡음을 제거하고 음성인식 처리를 수행하여 상기 대상어휘를 출력시키는 단계로 진행하여, 다양한 잡음의 조합, 잡음의 크기, 반복을 설정한 후 음성과 결합시켜 테스트할 수 있기 때문에, 잡음의 종류와 크기에 따라 음성인식에 얼마나 많은 영향을 미치는 지를 실시간으로 확인할 수 있다.
다중잡음, 음성결합, 음성인식엔진, 분석자동화
-
-
-
-