-
公开(公告)号:KR1020170095582A
公开(公告)日:2017-08-23
申请号:KR1020160017168
申请日:2016-02-15
Applicant: 한국전자통신연구원
Inventor: 임우택
IPC: G10L15/16 , G10L15/22 , G10L15/02 , G10L19/008
Abstract: 뉴럴네트워크를이용한오디오인식장치및 방법이개시된다. 본발명에따른뉴럴네트워크를이용한오디오인식장치는 1차원형태의오디오신호를 2차원데이터로변환하는 2차원신호변환부, 합성곱신경망을적용하고, 병목레이어를이용하여상기 2차원데이터로부터병목특징을추출하는합성곱신경망구조부, 상기병목특징을이용하여시계열데이터를분석하는순환신경망구조부, 그리고분석된상기시계열데이터의인식클래스를판단하는분류부를포함한다.
Abstract translation: 公开了一种使用神经网络的音频识别设备和方法。 使用根据本发明的神经网络的音频识别设备应用二维信号转换单元和用于将一维音频信号转换成二维数据的复合神经网络, 循环神经网络结构部分,用于使用瓶颈特性分析时间序列数据;以及分类部分,用于对分析的时间序列数据的分类进行分类。
-
公开(公告)号:KR1020160093404A
公开(公告)日:2016-08-08
申请号:KR1020150014375
申请日:2015-01-29
Applicant: 한국전자통신연구원
Inventor: 임우택
IPC: H04N21/439 , H04N21/233 , H04N21/2368
CPC classification number: H04N21/4398 , H04N21/233 , H04N21/2368 , H04N21/4394
Abstract: 본발명은멀티미디어콘텐츠재생화면에서사람, 동물등 얼굴이검출된특정캐릭터의선택이나줌인등 사용자입력에연동하여오디오신호에서의음원분리나부채널오디오신호를통해해당캐릭터의대사등 음원부분만을강화하여청취할수 있도록오디오줌인을제공할수 있는멀티미디어콘텐츠서비스방법및 장치에관한것이다.
Abstract translation: 本发明涉及一种能够提供音频放大的多媒体内容服务方法及其装置,其将声源与音频信号相结合的用户输入分离,诸如选择或放大特定角色,其中面部 通过子频道音频信号检测或增强对象的语音等的声源部分,以听取声源部分的人,动物等。
-
公开(公告)号:KR1020140147401A
公开(公告)日:2014-12-30
申请号:KR1020130070577
申请日:2013-06-19
Applicant: 한국전자통신연구원
Inventor: 임우택
IPC: H04H60/07 , H04N21/854 , H04N21/235 , H04N7/08
CPC classification number: H04H60/07 , G10L13/08 , H04N21/235 , H04N21/488 , H04N21/854
Abstract: Provided are a method and an apparatus for producing a descriptive video service using text-to-speech (TTS). The apparatus for producing a descriptive video service comprises a mute section detecting unit analyzing an audio signal of content to detect a mute section from the audio signal, a descriptive section selecting unit selecting a section into which description is to be inserted, from the detected mute section, and a description inserting unit inserting a description to the selected section using TTS.
Abstract translation: 提供了使用文本到语音(TTS)产生描述性视频服务的方法和装置。 用于产生描述性视频服务的装置包括:静音部分检测单元,用于从音频信号中分析内容的音频信号以检测静音部分,描述部分选择单元从检测到的静音中选择要插入说明的部分 部分和描述插入单元使用TTS将描述插入到所选择的部分。
-
公开(公告)号:KR1019940003247A
公开(公告)日:1994-02-21
申请号:KR1019920011792
申请日:1992-07-02
IPC: H04L12/56
Abstract: 본 발명은 ISDN 교환기에서 패킷 교환 성능에 주요한 영향을 미치는 임의 사용자 기능 중 패킷 크기를 결정하는 방법에 관한 것으로, ISDN 교환기에서의 패킷 교환 수행 시 패킷 정보 단위 인 패킷 크기를 결정하여 패킷 정보량, 패킷 정보의 신속성, 교환기의 메모리 사용 상태와 관련되어 패킷 교환 성능의 핵심 요소로 사용되므로써 ISDN교환기 패킷 교환 기능에 효과가 있다.
-
公开(公告)号:KR101808810B1
公开(公告)日:2017-12-14
申请号:KR1020130144979
申请日:2013-11-27
Applicant: 한국전자통신연구원
IPC: G10L25/78
CPC classification number: G10L25/78
Abstract: 음성/무음성구간검출방법및 장치를제공한다. 음성/무음성구간검출장치는스테레오오디오신호에서상기스테레오오디오신호의채널간관계정보를획득하는획득부, 상기채널간관계정보를기초로상기스테레오오디오신호의각 요소를센터채널성분과서라운드성분으로분류하는분류부, 상기센터채널성분인요소들로구성된센터채널신호와상기서라운드성분인요소들로구성된서라운드채널신호간의프레임별에너지비율값 및상기스테레오오디오신호를기초로생성된모노신호와상기스테레오오디오신호간의프레임별에너지비율값을계산하는계산부및 상기에너지비율값들을비교하여상기스테레오오디오신호에서음성구간과무음성구간을판단하는판단부를포함할수 있다.
Abstract translation: 提供了一种用于检测语音/非语音部分的方法和设备。 语音/非语音区间检测装置,所述获取单元,基于用于从立体声音频信号获取对每个元素到一个立体声音频信号的中心信道分量和环绕部件的立体声音频信号的信道之间的关系的信息的信道之间的关系的信息, 类别分类部,在该中心信道信号和环绕信道信号的一帧一帧的能量比的环绕组件的元件的中心通道组件被配置作为一个元素值和立体声音频信号的单声道信号,并生成所述立体声基于由 计算单元,用于计算音频信号之间的每帧能量的比率;以及确定单元,用于比较能量比值以确定立体声音频信号中的语音区间和非语音区间。
-
公开(公告)号:KR1020170096083A
公开(公告)日:2017-08-23
申请号:KR1020160017354
申请日:2016-02-15
Applicant: 한국전자통신연구원
Inventor: 임우택
Abstract: 본발명에따른신경망을이용한음원분리장치는오디오신호를분석하여 2차원신호로변환하는 2차원신호변환부, 변환된 2차원신호에기초하여컨벌루션신경망을형성하는컨벌루션신경망형성부, 형성된컨벌루션신경망에기초하여디컨벌루션신경망을형성하여네트워크를구성하는디컨벌루션신경망형성부및 디컨벌루션신경망으로부터확률맵을추출하여음원분리를수행하는음원분리부를포함한다.
Abstract translation: 使用根据本发明,卷积神经网络形成部到神经网络的声源分离装置,形成二维信号的基础上,卷积神经网络转换单元,通过分析所述音频信号转换成一个二维信号转换后的二维信号以形成一个卷积神经网络 以及声源分离单元,用于通过形成反卷积神经网络从反卷积神经网络形成单元和反卷积神经网络提取概率图,以形成网络。
-
公开(公告)号:KR1020150086989A
公开(公告)日:2015-07-29
申请号:KR1020140007316
申请日:2014-01-21
Applicant: 한국전자통신연구원
Inventor: 임우택
CPC classification number: H04N21/488 , G10L15/26 , H04N5/278
Abstract: 자막생성을위한장치및 방법을제공한다. 자막생성장치는콘텐츠의오디오신호로부터검출된음성정보의특징값에서적어도두 명의화자를구분하는특징분석부및 음성정보의특징값의변화에따라대응하는자막을변경하거나, 화자별로구분된음성정보특징값에대응하는자막을변경하는동적자막생성부를포함한다.
Abstract translation: 本发明提供一种用于生成字幕的装置和方法。 字幕生成装置包括:特征分析单元,其将至少两个扬声器与在内容的音频信号中检测到的语音数据的特征值区分开; 以及动态字幕生成单元,其根据语音信息的特征值的变化来改变对应的字幕,或者改变与为每个扬声器分离的语音信息的特征值相对应的字幕。
-
公开(公告)号:KR1020140060091A
公开(公告)日:2014-05-19
申请号:KR1020120126761
申请日:2012-11-09
Applicant: 한국전자통신연구원
Inventor: 임우택
IPC: H04N21/441 , G06K9/00
CPC classification number: H04N21/44218 , H04N21/42204 , H04N21/4532 , H04N21/454
Abstract: A user cognition system of a display device according to the present invention comprises a display unit and a cognition unit including a camera for shooting viewers who watch the display unit and a control unit for displaying content set by recognizing the viewers captured by the camera on the display unit. The cognition unit recognizes a main viewer who has a remote controller connected to the cognition unit when the many viewers are existed.
Abstract translation: 根据本发明的显示装置的用户认知系统包括显示单元和认知单元,所述认知单元包括用于拍摄观看显示单元的观看者的摄像机和用于通过识别由相机拍摄的观看者来显示内容的控制单元 显示单元。 当许多观众存在时,认知单元识别具有连接到认知单元的遥控器的主要观看者。
-
-
-
-
-
-
-