Patent search ap:("서강대학교산학협력단" OR "경북대학교 산학협력단") AND inv:"박형민" Page 1

1.

发明申请
선택적 주의 집중 모델을 이용한 모니터링 장치 및 그 모니터링 방법 审中-公开
Title translation: 使用选择性注意模型的监视装置和用于监视其的方法

公开(公告)号：WO2013085278A1

公开(公告)日：2013-06-13

申请号：PCT/KR2012/010480

申请日：2012-12-05

Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단

Inventor： 이민호 , 장영민 , 정성문 , 김범휘 , 박형민 , 김민욱

IPC: G01Q20/00

CPC classification number: G10L17/02 , G06K9/00221 , G06K9/4628 , G06K9/4671 , G10L15/25 , H04N7/18

Abstract: 모니터링 장치가 개시된다. 본 모니터링 장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 경로를 생성하는 시선 경로 인식부 및 생성된 시선 경로를 출력하는 출력부를 포함한다.

Abstract translation: 本发明涉及监视装置。本监视装置包括：用于接收在分离位置听到的多个声源的输入单元和在分开的位置捕获的多个图像; 显着图生成单元，分别通过使用所生成的单体显着图生成分别用于多个图像的多个单显显示图和动态显着图; 位置确定单元，用于分析所述多个声源以确定所述声源的位置; 基于生成的动态显着图和确定的声源位置，生成用于生成多个图像的路径的视线路径的识别单元; 以及用于输出生成的视线路径的输出单元。

2.

发明公开
음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체 有权
Title translation: 利息计算系统和使用语音信号特征数据的方法，记录计数记录方法

公开(公告)号：KR1020140133257A

公开(公告)日：2014-11-19

申请号：KR1020130053176

申请日：2013-05-10

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 조지원 , 김비호 , 이민호

IPC: G10L25/63 , G10L25/09

CPC classification number: G10L25/63 , G10L15/02 , G10L25/09

Abstract: 본 발명에 따르는 음성신호의 특징정보를 이용한 흥미점수 산출 시스템에 있어서, 질의를 위한 음성신호를 입력받아 특징정보를 검출하고, 상기 질의를 위한 음성신호의 특징정보를 수집된 음성신호들과 그에 대해 미리 설정된 점수정보들을 회귀분석 학습하여 생성한 흥미점수 산출함수에 따라 연산하여 흥미점수를 산출하는 제어장치; 상기 흥미점수 및 상기 흥미점수 산출함수를 저장하며, 상기 제어장치의 프로그램 수행을 위해 요구되는 저장영역을 제공하는 메모리부; 및 상기 제어장치의 제어에 따라 음성신호를 제공받아 특징정보를 생성하는 음성신호의 특징정보 검출부;를 구비함을 특징으로 한다.

Abstract translation: 根据本发明，使用语音信号的特征数据的兴趣点计算系统包括：控制单元，接收用于查询的语音信号以检测特征数据，并通过操作语音信号的特征数据来计算兴趣得分，根据通过学习和回归分析收集的语音信号和为信号预设的分数数据产生的兴趣分数计算函数进行查询; 存储单元，存储利息分数和利益分数计算功能，并提供执行控制单元的程序所需的存储; 以及语音信号特征数据检测单元，其根据控制单元的控制接收语音信号以生成特征数据。

3.

发明授权
음성 인식 장치 및 음성 인식 방법 有权
Title translation: 语音识别装置和语音识别方法

公开(公告)号：KR101353936B1

公开(公告)日：2014-01-27

申请号：KR1020120030718

申请日：2012-03-26

Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단

Inventor： 이민호 , 박형민 , 장영민 , 김민욱 , 정성문 , 김범휘

IPC: G10L15/24

Abstract: 음성 인식 장치가 개시된다. 본 음성 인식 장치는, 사용자를 촬상한 복수의 이미지 및 음원을 입력받는 입력부, 복수의 이미지 각각에서 사용자의 입술 영역을 검출하는 검출부, 복수의 이미지 각각의 검출된 입술 영역에 대한 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵을 이용하여 입술의 움직임 정보를 취득하는 정보 취득부. 취득된 움직임 정보를 기초로 입력된 음원에 대한 음성 인식을 수행하는 음성 인식부, 및, 음성 인식의 결과를 출력하는 출력부를 포함한다.

4.

发明公开
음성 인식 장치 및 음성 인식 방법 有权
Title translation: 语音识别装置和语音识别方法

公开(公告)号：KR1020130108894A

公开(公告)日：2013-10-07

申请号：KR1020120030718

申请日：2012-03-26

Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단

Inventor： 이민호 , 박형민 , 장영민 , 김민욱 , 정성문 , 김범휘

IPC: G10L15/24

CPC classification number: G10L15/25 , G06K9/00228

Abstract: PURPOSE: A device and method for recognizing a voice are provided to easily recognize the voice with accurately identifying a juncture in which a speaker speaks. CONSTITUTION: A device for recognizing a voice includes an input part (110), a detecting part (150), a saliency map generating part (160), an information obtaining part (170), a voice recognizing part (180), and an output part (120). The input part is inputted with multiple photographed images and sound sources, and a user is included in the photographed images. The detecting part detects the lip regions of a user from the respective images. The saliency map generating part generates dynamic saliency maps for the lip regions. The information obtaining part obtains motion information for a lip using the dynamic saliency maps. The voice recognizing part recognizes a voice for the sound sources based on the motion information for the lip. The output part outputs a result from recognizing the voice. [Reference numerals] (110) Input part; (120) Extracting unit; (130) Storage unit; (140) Location determination unit; (160) Saliency map generating part; (170) Information obtaining part; (180) Voice recognizing part; (190) Control unit; (200) Face detecting unit; (300) Lips detecting unit

Abstract translation: 目的：提供用于识别语音的装置和方法，以容易地识别语音，准确地识别说话者所说的交点。构成：用于识别语音的装置包括输入部分（110），检测部分（150），显着图生成部分（160），信息获取部分（170），语音识别部分（180）和输出部分（120）。输入部分输入多个拍摄的图像和声源，并且用户被包括在拍摄的图像中。检测部件从各图像检测用户的唇部区域。显着性图生成部分产生唇区的动态显着图。信息获取部分使用动态显着图获得唇的运动信息。语音识别部分基于唇部的运动信息来识别声源的声音。输出部分输出识别声音的结果。（附图标记）（110）输入部; （120）提取单元; （130）存储单元; （140）位置确定单元; （160）显着图生成部分; （170）信息获取部分; （180）语音识别部分; （190）控制单元; （200）面部检测单元; （300）嘴唇检测单元

5.

发明授权
음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체 有权
Title translation: 利息分数计算系统和方法采用语音信号特征数据，记录媒体记录程序的利息分数计算方法

公开(公告)号：KR101499606B1

公开(公告)日：2015-03-09

申请号：KR1020130053176

申请日：2013-05-10

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 조지원 , 김비호 , 이민호

IPC: G10L25/63 , G10L25/09

Abstract: 본 발명에 따르는 음성신호의 특징정보를 이용한 흥미점수 산출 시스템에 있어서, 질의를 위한 음성신호를 입력받아 특징정보를 검출하고, 상기 질의를 위한 음성신호의 특징정보를 수집된 음성신호들과 그에 대해 미리 설정된 점수정보들을 회귀분석 학습하여 생성한 흥미점수 산출함수에 따라 연산하여 흥미점수를 산출하는 제어장치; 상기 흥미점수 및 상기 흥미점수 산출함수를 저장하며, 상기 제어장치의 프로그램 수행을 위해 요구되는 저장영역을 제공하는 메모리부; 및 상기 제어장치의 제어에 따라 음성신호를 제공받아 특징정보를 생성하는 음성신호의 특징정보 검출부;를 구비함을 특징으로 한다.

6.

发明授权
반향 환경에서의 영교차 기반 다음원 국지화 방법 및 장치 有权
Title translation: 在混响环境中的基于过零的多源定位装置

公开(公告)号：KR101073632B1

公开(公告)日：2011-10-14

申请号：KR1020100017069

申请日：2010-02-25

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 이수연 , 이민호

IPC: G10L21/02 , G10L21/0308 , G10L25/84

Abstract: 본발명은다음원국지화장치에관한것이다. 다음원국지화장치는, 외부로부터신호를수신하는제1 및제2 신호수신부; 상기제1 및제2 신호수신부로부터제공되는신호를사전에설정된주파수대역별로분리하여각 채널로출력하는제1 및제2 필터뱅크; 상기제1 필터뱅크의각 채널로부터출력된신호의포락선정보를이용하여반향시간을추정하는반향시간추정부; 상기반향시간을이용하여반향이없는시작구간을검출하는시작구간추정부; 영교차점을기반으로하는 ITD를추정하는 ITD 추정부; 상기채널들로부터출력된신호들에대한신호대 잡음비(SNR)를검출하는 SNR 추정부; 시작구간및 SNR들을이용하여상기 ITD들중 신뢰성있는 ITD들을선택하는 ITD 선택부; 상기 ITD 선택부에의해선택된 ITD들을방향각으로변환시키는방향각변환부; 상기방향각변환부로부터출력된방향각에추정된 SNR 가중치로누적시켜히스토그램을생성하고, 상기히스토그램을이용하여음원의방향을추출하는음원방향추출부; 를구비한다. 상기반향시간추정부, 시작구간추정부, ITD 추정부, SNR 추정부, ITD 선택부및 방향각변환부는제1 필터뱅크의모든채널에각각구비되고, 모든방향각변환부로부터출력된방향각정보들은음원방향추출부로제공되어반향환경에서의음원방향을추출한다.

7.

发明公开
반향 환경에서의 영교차 기반 다음원 국지화 방법 및 장치 有权
Title translation: 复原环境中的基于零交叉的多源本地化设备

公开(公告)号：KR1020110097296A

公开(公告)日：2011-08-31

申请号：KR1020100017069

申请日：2010-02-25

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 이수연 , 이민호

IPC: G10L21/02 , G10L21/0308 , G10L25/84

Abstract: 본 발명은 다음원 국지화 장치에 관한 것이다. 다음원 국지화 장치는, 외부로부터 신호를 수신하는 제1 및 제2 신호 수신부; 상기 제1 및 제2 신호 수신부로부터 제공되는 신호를 사전에 설정된 주파수 대역별로 분리하여 각 채널로 출력하는 제1 및 제2 필터 뱅크; 상기 제1 필터 뱅크의 각 채널로부터 출력된 신호의 포락선 정보를 이용하여 반향 시간을 추정하는 반향 시간 추정부; 상기 반향 시간을 이용하여 반향이 없는 시작 구간을 검출하는 시작 구간 추정부; 영교차점을 기반으로 하는 ITD를 추정하는 ITD 추정부; 상기 채널들로부터 출력된 신호들에 대한 신호 대 잡음비(SNR)를 검출하는 SNR 추정부; 시작 구간 및 SNR들을 이용하여 상기 ITD들 중 신뢰성있는 ITD들을 선택하는 ITD 선택부; 상기 ITD 선택부에 의해 선택된 ITD들을 방향각으로 변환시키는 방향각 변환부; 상기 방향각 변환부로부터 출력된 방향각에 추정된 SNR 가중치로 누적시켜 히스토그램을 생성하고, 상기 히스토그램을 이용하여 음원의 방향을 추출하는 음원 방향 추출부; 를 구비한다. 상기 반향 시간 추정부, 시작 구간 추정부, ITD 추정부, SNR 추정부, ITD 선택부 및 방향각 변환부는 제1 필터 뱅크의 모든 채널에 각각 구비되고, 모든 방향각 변환부로부터 출력된 방향각 정보들은 음원 방향 추출부로 제공되어 반향 환경에서의 음원 방향을 추출한다.

8.

发明授权
시선 경로 제공장치 및 시선 경로 제공방법 有权
Title translation: 提供眼睛扫描路径的设备和提供眼睛扫描路径的MEED

公开(公告)号：KR101314687B1

公开(公告)日：2013-10-07

申请号：KR1020110129935

申请日：2011-12-06

Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단

Inventor： 이민호 , 장영민 , 박형민 , 김민욱 , 정성문 , 김범휘

IPC: G06T7/00

Abstract: 시선 경로 제공장치가 개시된다. 본 시선 경로 제공장치는, 이격된 위치에서 촬영된 복수의 이미지 및 이격된 위치에서 청취된 복수의 음원을 입력받는 입력부, 복수의 음원을 분석하여 음원의 위치를 판단하는 위치 판단부, 복수의 이미지 각각에 대한 복수의 모노 돌출맵을 생성하고, 생성된 복수의 모노 돌출맵을 이용하여 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵 및 판단된 음원 위치를 기초로 복수의 이미지에 대한 시선 경로를 생성하는 시선 경로 생성부, 및, 생성된 시선 경로를 출력하는 출력부를 포함한다.

9.

发明授权
성김 특성 최소화를 통한 암묵 신호 제거를 이용한 음성 향상 방법 및 장치 有权
Title translation: 基于盲信号消除的语音增强方法和使用该方法的设备

公开(公告)号：KR101318328B1

公开(公告)日：2013-10-15

申请号：KR1020120037993

申请日：2012-04-12

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 황재식 , 이민호

IPC: G10L21/02

CPC classification number: G10L21/0308 , G10L21/0232

Abstract: PURPOSE: A method and device for sound enhancement using silence signal removal through the sparsity property minimization can make a target speech signal is generated from a point source and estimate a target speech signal in an environment in which defuse noise exists. CONSTITUTION: A gain measurement part (230) receives a null forming signal from a null forming unit. The gain measurement part receives a beam forming signal from a beam forming part. The gain measurement part uses the provided null forming signal and the beam forming signal to generate a gain and provides it. A filter section (240) receives a beam forming signal from the beam forming part. The filter section receives the gain from the gain measurement part. The filter section uses the provided beam forming signal and the gain to estimate a target speech signal and provides it. [Reference numerals] (200) Signal input part; (210) Null forming part; (220) Beam forming part; (230) Gain measurement part; (240) Filter section

Abstract translation: 目的：通过稀疏属性最小化使用静音信号去除的声音增强的方法和装置可以使得从点源产生目标语音信号，并在存在消音噪声的环境中估计目标语音信号。构成：增益测量部件（230）从零形成单元接收零形成信号。增益测量部分从波束形成部分接收波束形成信号。增益测量部分使用提供的零形成信号和波束形成信号来产生增益并提供它。滤波器部分（240）从波束形成部分接收波束形成信号。滤波器部分从增益测量部分接收增益。滤波器部分使用提供的波束形成信号和增益来估计目标语音信号并提供它。（附图标记）（200）信号输入部; （210）零成形件; （220）梁形成部分; （230）增益测量部分; （240）过滤器部分

10.

发明授权
딥 빌리프 네트워크를 이용한 음성기반 호불호 검출방법 및 장치, 그를 기록한 기록매체 有权
Title translation: 利用深度比较网络的语音信号的基于检测方法和装置的特征数据，记录方法的中继记录方案

公开(公告)号：KR101561651B1

公开(公告)日：2015-11-02

申请号：KR1020140062477

申请日：2014-05-23

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 조지원 , 이호용 , 이민호

IPC: G10L25/63 , G10L25/09

Abstract: 본발명에따르는딥 빌리프네트워크(Deep Belief Network; 이하 DBN라칭함)를이용한음성기반호불호검출방법은, 음성신호들과그에대응되는호불호식별정보들로구성되는학습데이터를제공받아, 음성신호들에대한특징정보를추출하고, 그특징정보를 DBN을통해학습하여 DBN 데이터를생성하고, 그 DBN 데이터에호불호식별정보로구성되는레이블레이어를추가하여 DBN 데이터의생성을완료하는단계; 및상기테스트음성신호가입력되면, 그테스트음성신호에서특징정보를추출하고, 그특징정보에대응되는 DBN 데이터를검출하고, 그검출된 DBN 데이터의레이블레이어에기록된호불호식별정보에따라호불호검출결과를출력하는단계;를구비함을특징으로한다.

Abstract translation: 本发明涉及一种通过使用深信念网络（以下称为DBN）来检测基于语音的偏好的方法，该方法包括以下步骤：接收由语音信号组成的学习数据和与其对应的偏好识别信息，以提取特征关于语音信号的信息，通过DBN学习特征信息以生成DBN数据，以及将由偏好识别信息组成的标签层添加到DBN数据以完成DBN数据的生成; 并且当输入测试语音信号时从测试语音信号中提取特征信息以检测对应于特征信息的DBN数据，并根据记录在检测到的DBN数据的标签层上的偏好识别信息输出检测到的偏好的结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification