다국어 공통 음소셋를 이용한 음향모델 재학습방법 및 장치
    11.
    发明公开
    다국어 공통 음소셋를 이용한 음향모델 재학습방법 및 장치 审中-实审
    使用多语言联络电话机的声学模型重新绘制方法和装置

    公开(公告)号:KR1020140059545A

    公开(公告)日:2014-05-16

    申请号:KR1020120126111

    申请日:2012-11-08

    CPC classification number: G10L15/14 G10L15/005 G10L2015/025

    Abstract: The present invention relates to a retraining method by complementing insufficient audio data for a particular language and without changing the structure of the acoustic model simultaneously using a joint phone which is included in the multilingual audio data. Speech data for each language must be fully prepared in order to create an acoustic model of a multi-continuous speech recognition device but consumes a lot of costs and time in general. And the present invention can define common phonemes to be used for a phoneme symbol which is acoustically same between multiple languages. Provided is a selective retraining method using the common phoneme in the language which has a large amount of the audio data in order to train the language of insufficient memory on the basis of above.

    Abstract translation: 本发明涉及一种通过补充特定语言的不足的音频数据并且不使用包括在多语言音频数据中的联合电话同时改变声学模型的结构的再培训方法。 必须对每种语言的语音数据进行全面准备,以创建多连续语音识别设备的声学模型,但通常会消耗大量成本和时间。 并且本发明可以定义要用于在多种语言之间声学上相同的音素符号的共同音素。 提供了一种选择性再培训方法,其使用具有大量音频数据的语言中的公共音素,以便基于上述来训练不足的存储器的语言。

    음향 모델 생성 장치 및 방법
    12.
    发明公开
    음향 모델 생성 장치 및 방법 无效
    用于创建声学模型的装置和方法

    公开(公告)号:KR1020120045582A

    公开(公告)日:2012-05-09

    申请号:KR1020100107205

    申请日:2010-10-29

    CPC classification number: G10L15/144 G10L15/285

    Abstract: PURPOSE: A sound model generating apparatus and a method thereof are provided to automatically search for a penalty value about complexity of a sound model of an MDL(Minimum Description Length) standard. CONSTITUTION: A binary tree generating unit(101) generates a binary tree by repetition of Gaussian components in an HMM(Hidden Markov Model) state based on distance standards. An information generating unit(102) generates the maximum scale information of the sound model according to a platform(111) including a sound recognition unit(112). A binary tree reduction unit(103) reduces the binary tree according to the maximum scale information of the sound model.

    Abstract translation: 目的:提供一种声音模型生成装置及其方法,以自动搜索关于MDL(最小描述长度)标准的声音模型的复杂度的惩罚值。 构成:二叉树生成单元(101)通过基于距离标准在HMM(隐马尔可夫模型)状态中重复高斯分量来生成二叉树。 信息生成单元(102)根据包括声音识别单元(112)的平台(111)生成声音模型的最大比例信息。 二叉树缩小单元(103)根据声音模型的最大比例信息来减少二叉树。

    인터넷 정보검색을 위한 시각 장애인용 컴퓨터 시스템
    13.
    发明公开
    인터넷 정보검색을 위한 시각 장애인용 컴퓨터 시스템 无效
    用于在互联网上搜索信息的视觉手动计算机系统

    公开(公告)号:KR1020000026206A

    公开(公告)日:2000-05-15

    申请号:KR1019980043652

    申请日:1998-10-19

    Abstract: PURPOSE: A computer system is provided to convert a text information, transmitted from the internet, into a sound or braille information and an image information into a tactile information so the computer system can let the visually handicapped search the various types of information scattered in the internet. CONSTITUTION: The computer system comprises a main body(20), connected to the internet (10), converting braille type commands into text type commands and receiving web documents corresponding to the commands and an I/O peripherals converting the web documents into braille, sound or tactile type information by using an application software stored in the main body(20). The main body(20) includes an internet information searching application(200) for the visually handicapped with a braille/text converter(201), a sound converter(202), an image converter(203), and a text/braille converter(204). The I/O peripherals(300) includes a braille keyboard(301), a speaker(302), a tactile sense device(303) and a braille printer(304).

    Abstract translation: 目的:提供一种计算机系统,用于将从互联网发送的文本信息转换成声音或盲文信息和图像信息到触觉信息中,使得计算机系统可以让视觉障碍搜索分散在 互联网。 构成:计算机系统包括连接到互联网(10)的主体(20),将盲文类型命令转换成文本类型命令和接收与命令对应的web文档以及将web文档转换成盲文的I / O外围设备, 声音或触觉类型信息通过使用存储在主体(20)中的应用软件。 主体(20)包括用于具有盲文/文本转换器(201)的视觉障碍的互联网信息搜索应用(200),声音转换器(202),图像转换器(203)和文本/盲文转换器 204)。 I / O外围设备(300)包括盲文键盘(301),扬声器(302),触觉感测装置(303)和盲文打印机(304)。

    핸즈프리 자동 통역 서비스를 위한 단말 장치 및 핸즈프리 장치와, 핸즈프리 자동 통역 서비스 방법
    14.
    发明授权
    핸즈프리 자동 통역 서비스를 위한 단말 장치 및 핸즈프리 장치와, 핸즈프리 자동 통역 서비스 방법 有权
    一种用于免提自动口译服务的终端设备和免提设备以及免提自动口译服务方法

    公开(公告)号:KR101834546B1

    公开(公告)日:2018-04-13

    申请号:KR1020140022712

    申请日:2014-02-26

    Abstract: 핸즈프리자동통역서비스를위한자동통역시스템에관한것이다. 핸즈프리기반의자동통역시스템은핸즈프리장치, 단말장치및 통역서버를포함할수 있다. 이때, 단말장치는핸즈프리장치의요청에따라통역환경을초기화하는통역환경초기화부와, 사용자및 상대방의통역결과를중개하는통역중개부및 상대방의통역결과를설정된통역환경에기초하여음성으로합성하여핸즈프리장치에전송하는통역처리부를포함할수 있다. 이와같이, 핸즈프리장치를통하여통역서비스를제공함으로써사용자편의성이향상될수 있다.

    Abstract translation: 用于免提自动翻译服务的自动翻译系统。 基于免提的自动翻译系统可以包括免提设备,终端设备和解释服务器。 此时,通过合成基于初始化在免提环境初始化单元,用户和介导解释结果的解释器调停部的另一方,并且所述解释器环境的另一侧的请求的解释环境的解释语音终端装置被设置为解释结果 以及用于向免提装置发送的解释处理单元。 这样,通过免提设备提供翻译服务可以提高用户的便利性。

    음성 신호 처리 장치 및 방법, 그리고 단말
    15.
    发明公开
    음성 신호 처리 장치 및 방법, 그리고 단말 审中-实审
    用于处理语音信号和终端的装置和方法

    公开(公告)号:KR1020170007114A

    公开(公告)日:2017-01-18

    申请号:KR1020160076806

    申请日:2016-06-20

    Abstract: 본발명의일 실시예에따른음성신호처리장치는사용자의음성신호를입력받는입력부, 보조신호를감지하는감지부, 및제 1 동작모드에서상기음성신호를외부단말로전송하고, 제 2 동작모드에서상기음성신호및 보조신호를동일한프로토콜또는서로다른프로토콜을이용하여상기외부단말로전송하는신호처리부를포함할수 있다.

    음성인식 시스템 및 방법
    16.
    发明公开
    음성인식 시스템 및 방법 审中-实审
    语音识别系统与方法

    公开(公告)号:KR1020170007107A

    公开(公告)日:2017-01-18

    申请号:KR1020160064193

    申请日:2016-05-25

    Inventor: 김동현 이민규

    Abstract: 본발명은사용자에게수동으로발성할언어를선택하기위한버튼의사용등 사용자등록이나인식언어설정을위한별도의과정없이, 발성한사람의음성인식동안에자동으로음성언어의식별이가능하게하여다국어음성인식을효과적으로처리할수 있으며, 하나의단말기를사용해각기다른언어의사람이발성하여도자동으로각 언어의음성인식을수행하도록지원하여사용자의편의성을높일수 있는음성인식시스템및 방법에관한것이다.

    통계 기반의 다중 발음 사전 생성 장치 및 방법
    17.
    发明授权
    통계 기반의 다중 발음 사전 생성 장치 및 방법 有权
    基于统计量生成多个发音词典的装置和方法

    公开(公告)号:KR101333194B1

    公开(公告)日:2013-11-26

    申请号:KR1020110072394

    申请日:2011-07-21

    Abstract: 본 발명에 따른 통계 기반의 다중 발음 사전 생성 장치는, 발화 및 녹음된 음성 신호 파일들과 각각의 음성 신호 파일에 해당하는 단어 수준의 전사문 및 각각의 음성 신호 파일에 해당하는 화자 정보를 포함하는 데이터베이스; 상기 음성 신호 파일, 상기 단어 수준의 전사문, 및 각 단어 별로 복수 개의 발음열을 포함하는 다중 발음 사전으로부터 음성 인식기의 정렬 기능을 이용하여 상기 음성 신호 파일에 포함된 단어에 대하여 상기 다중 발음 사전에서 가장 가까운 발음열을 검출하는 음성-발음열 정렬부; 상기 가장 가까운 발음열의 검출을 상기 데이터베이스에 저장된 음성 신호 파일들과 단어 수준의 전사문에 적용하여 단어와 발음열의 쌍들을 추출하는 단어-발음열 쌍 추출부; 및 상기 추출된 단어와 발음열의 쌍들을 바탕으로 상기 다중 발음 사전의 각 단어 별 발음열들에 대한 통계 정보를 산출하여 저장하는 발음열 통계정보 추출부를 포함하는 것을 특징으로 한다.

    자동통역 단말기와 서버, 시스템 및 자동통역 서비스 방법
    18.
    发明公开
    자동통역 단말기와 서버, 시스템 및 자동통역 서비스 방법 无效
    翻译终端和服务器,系统和方法

    公开(公告)号:KR1020110038448A

    公开(公告)日:2011-04-14

    申请号:KR1020090095741

    申请日:2009-10-08

    CPC classification number: G06F17/2854

    Abstract: PURPOSE: An automatic interpretation terminal, a service, a system and method for servicing automatic interpretation are provided to supply rapid and exact interpretation service by directly performing interpretation and relay interpretation by utilizing a plurality of interpretation supporters and providing an interpretation result to a terminal of a user. CONSTITUTION: A communication unit(300) receives interpretation request from a user. The communication unit transmits an interpretation result according to the interpretation request. A interpretation applicant information DB(306) stores a list information of the interpretation supporters capable of performing interpretation as a target language. A server control unit(304) searches interpretation supporter capable of interpreting the request target language.

    Abstract translation: 目的:提供自动解释终端,服务,系统和方法来提供快速准确的口译服务,通过利用多个解释支持者直接进行解释和中继解释,并将解释结果提供给终端 一个用户 构成:通信单元(300)从用户接收解释请求。 通信单元根据解释请求发送解释结果。 解释申请者信息DB(306)存储能够进行解释的解释支持者的列表信息作为目标语言。 服务器控制单元(304)搜索能够解释请求目标语言的解释支持者。

    화자 적응 시스템 및 그 방법
    19.
    发明公开
    화자 적응 시스템 및 그 방법 有权
    用于演讲者适应的方法

    公开(公告)号:KR1020100137873A

    公开(公告)日:2010-12-31

    申请号:KR1020090056120

    申请日:2009-06-23

    Abstract: PURPOSE: A speaker adaptation system and a method thereof are provided to utilize the cumulative variable for obtaining enough statistics for the non-instruction adaptation in voice recognitioin process without performing an adaptation training thereby enabling to gradual adaptation. CONSTITUTION: A characteristic detecting part(110) extracts an eigenvector from a voice signal. A sound model storage(120) stores an acoustic model consisting of a recursive tree. A conversion parameter class determiner(130) produces gaussian posteriori probability of a candidate state based on the eigenvector and the sound model and determines the cumulative variable and a conversion parameter class based on the gaussian posterior probability. A sound model updater(140) produces the conversion parameter based on the conversion parameter class and cumulative variable and renews the acoustic model.

    Abstract translation: 目的:提供一种扬声器适应系统及其方法,以利用该累积变量来获得用于语音识别过程中的非指令适配的足够的统计量,而不进行适应训练,从而能够逐渐适应。 构成:特征检测部(110)从语音信号中提取特征向量。 声音模型存储(120)存储由递归树组成的声学模型。 转换参数类确定器(130)基于特征向量和声音模型产生候选状态的高斯后验概率,并且基于高斯后验概率确定累积变量和转换参数类。 声音模型更新器(140)基于转换参数类和累积变量产生转换参数,并更新声学模型。

    여객기 승객 서비스 개선 시스템 및 그 운용방법
    20.
    发明公开
    여객기 승객 서비스 개선 시스템 및 그 운용방법 无效
    AIRLINER乘客服务改进系统及操作方法

    公开(公告)号:KR1020000026690A

    公开(公告)日:2000-05-15

    申请号:KR1019980044347

    申请日:1998-10-22

    Abstract: PURPOSE: The airliner passenger service improvement system and the operating method is to stimulate passenger's interest by mounting video camera in airliner and providing information of the airport surroundings with real picture, character and graphic in service, and also to get a tourism effect for the airport surroundings. CONSTITUTION: The real picture is acquired from video camera fixed in airliner(300). The content of information DB(306) is interpreted in the information creation and process system(305) and the information is created by airliner location information the GPS receiver(302) provides and direction information the gyro system(304) provides. The information is printed in display(307) at the proper position on the acquired real picture.

    Abstract translation: 目的:客机乘客服务改善体系和运行方式是通过在客机中安装摄像机,提供乘客的兴趣,提供机场周边环境的真实图像,人物和图像等服务信息,并为机场获得旅游效果 环境。 规定:实际照片是从固定在客机中的摄像机(300)获得的。 在信息创建和处理系统(305)中解释信息DB(306)的内容,并且通过GPS接收机(302)提供的客机位置信息和陀螺仪系统(304)提供的方向信息来创建信息。 在所获取的真实图片上的适当位置将信息打印在显示器(307)中。

Patent Agency Ranking