Patent search ap:("한국전자통신연구원") AND inv:"임우택" Page 2

11.

发明公开
뉴럴 네트워크를 이용한 오디오 인식 장치 및 방법 审中-实审
Title translation: 使用神经网络的音频识别设备和方法

公开(公告)号：KR1020170095582A

公开(公告)日：2017-08-23

申请号：KR1020160017168

申请日：2016-02-15

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: G10L15/16 , G10L15/22 , G10L15/02 , G10L19/008

Abstract: 뉴럴네트워크를이용한오디오인식장치및 방법이개시된다. 본발명에따른뉴럴네트워크를이용한오디오인식장치는 1차원형태의오디오신호를 2차원데이터로변환하는 2차원신호변환부, 합성곱신경망을적용하고, 병목레이어를이용하여상기 2차원데이터로부터병목특징을추출하는합성곱신경망구조부, 상기병목특징을이용하여시계열데이터를분석하는순환신경망구조부, 그리고분석된상기시계열데이터의인식클래스를판단하는분류부를포함한다.

Abstract translation: 公开了一种使用神经网络的音频识别设备和方法。使用根据本发明的神经网络的音频识别设备应用二维信号转换单元和用于将一维音频信号转换成二维数据的复合神经网络，循环神经网络结构部分，用于使用瓶颈特性分析时间序列数据;以及分类部分，用于对分析的时间序列数据的分类进行分类。

12.

发明公开
캐릭터 선택적 오디오 줌인을 제공하는 멀티미디어 콘텐츠 서비스 방법 및 장치 审中-实审
Title translation: 多媒体内容使用字符选择音频变焦的方法和装置

公开(公告)号：KR1020160093404A

公开(公告)日：2016-08-08

申请号：KR1020150014375

申请日：2015-01-29

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: H04N21/439 , H04N21/233 , H04N21/2368

CPC classification number: H04N21/4398 , H04N21/233 , H04N21/2368 , H04N21/4394

Abstract: 본발명은멀티미디어콘텐츠재생화면에서사람, 동물등 얼굴이검출된특정캐릭터의선택이나줌인등 사용자입력에연동하여오디오신호에서의음원분리나부채널오디오신호를통해해당캐릭터의대사등 음원부분만을강화하여청취할수 있도록오디오줌인을제공할수 있는멀티미디어콘텐츠서비스방법및 장치에관한것이다.

Abstract translation: 本发明涉及一种能够提供音频放大的多媒体内容服务方法及其装置，其将声源与音频信号相结合的用户输入分离，诸如选择或放大特定角色，其中面部通过子频道音频信号检测或增强对象的语音等的声源部分，以听取声源部分的人，动物等。

13.

发明公开
TTS를 이용한 화면해설방송 제작 방법 및 장치 审中-实审
Title translation: 通过使用文字到语音生成描述性视频服务的方法和装置

公开(公告)号：KR1020140147401A

公开(公告)日：2014-12-30

申请号：KR1020130070577

申请日：2013-06-19

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: H04H60/07 , H04N21/854 , H04N21/235 , H04N7/08

CPC classification number: H04H60/07 , G10L13/08 , H04N21/235 , H04N21/488 , H04N21/854

Abstract: Provided are a method and an apparatus for producing a descriptive video service using text-to-speech (TTS). The apparatus for producing a descriptive video service comprises a mute section detecting unit analyzing an audio signal of content to detect a mute section from the audio signal, a descriptive section selecting unit selecting a section into which description is to be inserted, from the detected mute section, and a description inserting unit inserting a description to the selected section using TTS.

Abstract translation: 提供了使用文本到语音（TTS）产生描述性视频服务的方法和装置。用于产生描述性视频服务的装置包括：静音部分检测单元，用于从音频信号中分析内容的音频信号以检测静音部分，描述部分选择单元从检测到的静音中选择要插入说明的部分部分和描述插入单元使用TTS将描述插入到所选择的部分。

14.

发明公开
ISDN 교환기에서의 자국 패킷 호 구현시 패킷 크기 결정 방법 无效
Title translation: ISDN交换机实现本地分组呼叫时如何确定分组大小

公开(公告)号：KR1019940003247A

公开(公告)日：1994-02-21

申请号：KR1019920011792

申请日：1992-07-02

Applicant: 한국전자통신연구원 , 주식회사 케이티

Inventor： 임우택 , 송인근 , 전경표 , 한기철

IPC: H04L12/56

Abstract: 본 발명은 ISDN 교환기에서 패킷 교환 성능에 주요한 영향을 미치는 임의 사용자 기능 중 패킷 크기를 결정하는 방법에 관한 것으로, ISDN 교환기에서의 패킷 교환 수행 시 패킷 정보 단위 인 패킷 크기를 결정하여 패킷 정보량, 패킷 정보의 신속성, 교환기의 메모리 사용 상태와 관련되어 패킷 교환 성능의 핵심 요소로 사용되므로써 ISDN교환기 패킷 교환 기능에 효과가 있다.

15.

发明授权
음성/무음성 구간 검출 방법 및 장치 有权
Title translation: 用于检测语音/非语音部分的方法和装置

公开(公告)号：KR101808810B1

公开(公告)日：2017-12-14

申请号：KR1020130144979

申请日：2013-11-27

Applicant: 한국전자통신연구원

Inventor： 장인선 , 임우택

IPC: G10L25/78

CPC classification number: G10L25/78

Abstract: 음성/무음성구간검출방법및 장치를제공한다. 음성/무음성구간검출장치는스테레오오디오신호에서상기스테레오오디오신호의채널간관계정보를획득하는획득부, 상기채널간관계정보를기초로상기스테레오오디오신호의각 요소를센터채널성분과서라운드성분으로분류하는분류부, 상기센터채널성분인요소들로구성된센터채널신호와상기서라운드성분인요소들로구성된서라운드채널신호간의프레임별에너지비율값 및상기스테레오오디오신호를기초로생성된모노신호와상기스테레오오디오신호간의프레임별에너지비율값을계산하는계산부및 상기에너지비율값들을비교하여상기스테레오오디오신호에서음성구간과무음성구간을판단하는판단부를포함할수 있다.

Abstract translation: 提供了一种用于检测语音/非语音部分的方法和设备。语音/非语音区间检测装置，所述获取单元，基于用于从立体声音频信号获取对每个元素到一个立体声音频信号的中心信道分量和环绕部件的立体声音频信号的信道之间的关系的信息的信道之间的关系的信息，类别分类部，在该中心信道信号和环绕信道信号的一帧一帧的能量比的环绕组件的元件的中心通道组件被配置作为一个元素值和立体声音频信号的单声道信号，并生成所述立体声基于由计算单元，用于计算音频信号之间的每帧能量的比率;以及确定单元，用于比较能量比值以确定立体声音频信号中的语音区间和非语音区间。

16.

发明公开
신경망을 이용한 음원분리 장치 및 방법 审中-实审
Title translation: 使用神经网络分离声源的设备和方法

公开(公告)号：KR1020170096083A

公开(公告)日：2017-08-23

申请号：KR1020160017354

申请日：2016-02-15

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: G10L15/16 , G10L15/22 , G10L19/12 , G10L21/00 , G06N3/02

Abstract: 본발명에따른신경망을이용한음원분리장치는오디오신호를분석하여 2차원신호로변환하는 2차원신호변환부, 변환된 2차원신호에기초하여컨벌루션신경망을형성하는컨벌루션신경망형성부, 형성된컨벌루션신경망에기초하여디컨벌루션신경망을형성하여네트워크를구성하는디컨벌루션신경망형성부및 디컨벌루션신경망으로부터확률맵을추출하여음원분리를수행하는음원분리부를포함한다.

Abstract translation: 使用根据本发明，卷积神经网络形成部到神经网络的声源分离装置，形成二维信号的基础上，卷积神经网络转换单元，通过分析所述音频信号转换成一个二维信号转换后的二维信号以形成一个卷积神经网络以及声源分离单元，用于通过形成反卷积神经网络从反卷积神经网络形成单元和反卷积神经网络提取概率图，以形成网络。

17.

发明公开
자막 생성을 위한 장치 및 방법 审中-实审
Title translation: 用于生成标题的方法和装置

公开(公告)号：KR1020150086989A

公开(公告)日：2015-07-29

申请号：KR1020140007316

申请日：2014-01-21

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: G10L15/26 , G10L15/02

CPC classification number: H04N21/488 , G10L15/26 , H04N5/278

Abstract: 자막생성을위한장치및 방법을제공한다. 자막생성장치는콘텐츠의오디오신호로부터검출된음성정보의특징값에서적어도두 명의화자를구분하는특징분석부및 음성정보의특징값의변화에따라대응하는자막을변경하거나, 화자별로구분된음성정보특징값에대응하는자막을변경하는동적자막생성부를포함한다.

Abstract translation: 本发明提供一种用于生成字幕的装置和方法。字幕生成装置包括：特征分析单元，其将至少两个扬声器与在内容的音频信号中检测到的语音数据的特征值区分开; 以及动态字幕生成单元，其根据语音信息的特征值的变化来改变对应的字幕，或者改变与为每个扬声器分离的语音信息的特征值相对应的字幕。

18.

发明公开
디스플레이 유닛의 시청자 인식 시스템 审中-实审
Title translation: 显示单元的查看器识别系统

公开(公告)号：KR1020140060091A

公开(公告)日：2014-05-19

申请号：KR1020120126761

申请日：2012-11-09

Applicant: 한국전자통신연구원

Inventor： 임우택

IPC: H04N21/441 , G06K9/00

CPC classification number: H04N21/44218 , H04N21/42204 , H04N21/4532 , H04N21/454

Abstract: A user cognition system of a display device according to the present invention comprises a display unit and a cognition unit including a camera for shooting viewers who watch the display unit and a control unit for displaying content set by recognizing the viewers captured by the camera on the display unit. The cognition unit recognizes a main viewer who has a remote controller connected to the cognition unit when the many viewers are existed.

Abstract translation: 根据本发明的显示装置的用户认知系统包括显示单元和认知单元，所述认知单元包括用于拍摄观看显示单元的观看者的摄像机和用于通过识别由相机拍摄的观看者来显示内容的控制单元显示单元。当许多观众存在时，认知单元识别具有连接到认知单元的遥控器的主要观看者。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification