Patent search ap:("서강대학교산학협력단") AND inv:"박형민" Page 3

21.

发明授权
오차 신호를 기반으로 한 음원 위치 탐색 방법 및 음원 위치 탐색 장치 有权

公开(公告)号：KR102044393B1

公开(公告)日：2019-11-13

申请号：KR1020170107098

申请日：2017-08-24

Applicant: 서강대학교산학협력단

Inventor： 박형민 , 김정선

IPC: G01S3/802 , G01S5/18

22.

发明授权
심층 신경망을 기반으로 한 사운드 이벤트 검출 방법 및 사운드 이벤트 검출 장치 有权

公开(公告)号：KR101969504B1

公开(公告)日：2019-04-16

申请号：KR1020170056345

申请日：2017-05-02

Applicant: 서강대학교산학협력단 , 블루카이트주식회사

Inventor： 박형민 , 김영만

IPC: G10L25/30 , G10L21/0208 , G10L25/48

23.

发明公开
단일 영상으로부터 반사성분을 분리하는 방법 및 그 방법에 따른 영상처리 장치 有权
Title translation: 根据该方法用于从单个图像分离反射分量的方法和图像处理设备

公开(公告)号：KR1020170092218A

公开(公告)日：2017-08-11

申请号：KR1020160013267

申请日：2016-02-03

Applicant: 서강대학교산학협력단

Inventor： 제창수 , 박형민

IPC: G06T7/40

Abstract: 본발명은단일영상내의반사성분을분리하는방법및 그방법에따른영상처리장치에관한것으로, 영상처리장치는, 단일영상을입력받고, 입력영상에서, 각컬러채널의반사조도(reflected irradiance) 또는각 컬러채널의광도(intensity)를상기각 컬러채널의조명(illumination)으로나누어서얻어지는혼합반사도(mixed reflectance)에서상기혼합반사도의분광적평균(mean with respect to the spectral channel index)인혼합중분(mixed neuter)을제외한잔여성분인체정분(body essence)을이용하여이색성반사성분(dichromatic reflection components)을분리하고, 이색성반사성분의분리에따라광휘(highlight) 영상과광휘가제거된영상중 하나이상을출력한다.

Abstract translation: 本发明涉及一种图像处理装置，根据所述方法和所述单个图像中，图像处理装置，接收单个图像，从输入图像中，反射光强度每个颜色通道的（反射辐照度）分离的反射成分的方法或其中，对于每个颜色通道万亿人（照明），以在所得到的混合物的反射率的混合反射率（混合反射率）光积分平均的划分分钟每个颜色通道的亮度（强度）（平均值相对于所述光谱信道索引）的混合物分钟（使用混合中性），除了杯女士体jeongbun（体精华）到分色反射分量（二色性反射分量）的分离，这取决于分色反射分量亮度（高亮）图像的分离中的一个和一个光度被去除图像或更多。

24.

发明授权
DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법 有权
Title translation: 使用DCICA执行基于DNN的特征增强的语音识别设备和方法

公开(公告)号：KR101720514B1

公开(公告)日：2017-04-11

申请号：KR1020160023335

申请日：2016-02-26

Applicant: 서강대학교산학협력단

Inventor： 박형민 , 이호용 , 조지원 , 김민욱

IPC: G10L15/07 , G10L15/14 , G10L15/20

Abstract: 본발명에따르는 DCICA를이용한 DNN 기반특징향상을수행하는음성인식장치는, 다수의마이크로부터입력되는마이크입력신호들을각각입력받아 STFT(Short-Time Fourier Transform) 처리하는다수의 STFT; 상기다수의 STFT 처리부가출력하는 STFT 처리된마이크입력신호들을입력받아 DCICA 처리를이행하며, 타겟추정신호와잡음추정신호를생성하는 DCICA(Direction of arrival(DOA) Constrained Independent Component Analysis(ICA))부; 상기 STFT 처리된마이크입력신호들중 어느하나인제1마이크입력신호와, 상기 DCICA부가출력하는타겟추정신호와잡음추정신호를입력받아 LMPSC(logarithmic mel-frequency power spectral coefficient) 처리하여스펙트럴형태로변환하여출력하는다수의 LMPSC 처리부; 상기 LMPSC 처리부가출력하는스펙트럴형태로변환되어출력되는제1마이크입력신호와타겟추정신호와잡음추정신호를입력받아특징강화된최종타겟추정신호를생성하는 DNN 기반 FE(DNN-Based Feature Enhancement) 처리부; 및상기최종타겟추정신호를제공받아음성인식을수행하는 ASR(Automatic Speech Recognition) 처리부;로구성됨을특징으로한다. 또한상기방법은, 상기 DCICA부가출력하는잡음추정신호의스케일을가변하는스케일링부; 상기스케일링부가출력하는스케일링된잡음추정신호를입력받아 LMPSC 처리하여스펙트럴형태로변환하여출력하는 LMPSC; 및상기 LMPSC가출력하는스펙트럴형태로변환된스케일링된잡음추정신호와상기 DCICA가출력하는타겟추정신호를입력받아 HMM(hidden markov model) 기반 FE 처리하여특징강화된타켓추정신호를생성하여상기 DNN 기반 FE 처리부로제공하는 HMM 기반 FE 처리부;를더 구비하며, 상기 DNN 기반 FE 처리부는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호를입력받아특징강화된최종타겟신호를생성하며, 상기 DNN 기반 FE 처리부로입력되는상기제1마이크입력신호와상기특징강화된타켓추정신호와상기잡음추정신호는스펙트럴형태임을특징으로한다.

Abstract translation: 用于使用DCICA根据本发明，多个STFT来接收和处理来自多个微STFT的麦克风输入信号的输入的每个类型（短时傅立叶变换）执行基于DNN特征增强语音识别装置; 和实施DCICA过程接收STFT经处理的麦克风输入信号向所述多个STFT处理单元输出，该目标估计信号和DCICA的（到达方向（DOA）约束独立成分分析（ICA）），用于产生噪声估计信号部分。该STFT并将处理后的麦克风输入信号中的任何一个摄取一个麦克风输入信号，接收目标估计信号和所述噪声估计信号到DCICA相加后的输出通过处理（对数梅尔频率功率频谱系数）LMPSC转换为频谱形状输出LMPSC的多个LMPSC处理单元; 第一麦克风输入信号和目标估计信号和基于DNN FE（基于DNN特征增强）接收所述噪声估计信号，以产生增强的特征是输出的最终目标估计信号被转换成LMPSC处理单元输出的频谱形状处理器; 以及ASR（自动语音识别）处理器，用于通过接收最终目标估计信号来执行语音识别。该方法还可以包括：缩放单元，用于改变DCICA输出的噪声估计信号的比例; LMPSC通过治疗LMPSC频谱形状转换接收缩放的噪声估计信号输出到缩放的输出部; 和LMPSC失控力方面缩放的转换成桶形式噪声估计信号和所述通过接收信号HMM（隐马尔可夫模型）估计DCICA失控力目标和对基础FE过程产生增强的目标估计信号采用了DNN到用于接收第一麦克风输入信号，特征增强的目标估计信号和噪声估计信号以提供最终增强的目标信号，并且输入到基于DNN的FE处理器的第一麦克风输入信号，特征增强的目标估计信号和噪声估计信号处于频谱形式。

25.

发明授权
반향필터 추정방법, 반향제거필터 추정방법 및 이를 이용한 단일채널 반향제거방법 有权
Title translation: 反演滤波器估计方法和滤波器估计方法，以及使用DEREVERBERATION滤波器的单通道语音分析方法

公开(公告)号：KR101558397B1

公开(公告)日：2015-11-23

申请号：KR1020140062476

申请日：2014-05-23

Applicant: 서강대학교산학협력단

Inventor： 박형민 , 지민선

IPC: H04R3/02

CPC classification number: H04R3/02 , G10L2021/02082 , H04M9/082

Abstract: 본발명에따르는단일채널에대한음성반향제거를위한반향필터추정방법에있어서, 반향필터의확률밀도함수에대한선험적정보를입력받아, 상기반향필터의확률밀도함수를토대로반향필터의사후확률밀도함수의로그값을산출하는단계; 상기반향필터의사후확률밀도함수의로그값을최대화하여반향필터를추정하는단계;를구비함을특징으로한다.

Abstract translation: 根据本发明，用于估计用于单个信道的用于语音回波去除的回波滤波器的方法包括以下步骤：接收关于回波滤波器的概率密度函数的先验信息，并且测量后验概率的对数值基于回波滤波器的概率密度函数的回波滤波器的密度函数; 并通过使回波滤波器的后验概率密度函数的对数值最大化来估计回波滤波器。

26.

发明授权
최적 계층적 블록 매칭 방법 및 시스템, 이를 이용한 영상 정합 방법 및 영상 압축 방법 有权
Title translation: 优化分层块匹配的方法与系统，基于优化分层块匹配的图像注册和视频压缩方法

公开(公告)号：KR101550665B1

公开(公告)日：2015-09-07

申请号：KR1020140036362

申请日：2014-03-27

Applicant: 서강대학교산학협력단

Inventor： 제창수 , 박형민

IPC: G06T5/00 , G06T9/00

Abstract: 본 발명에 따른 최적 계층적 블록 매칭(optimized hierarchical block matching, OHBM) 방법 및 시스템은, 계층적 블록 매칭에서, 계산량(computational cost)과 정확도(accuracy)를 최적화하도록 영상 피라미드(image pyramid)의 레이어 수(number of layers)와 두 인접 레이어(two consecutive layers) 사이의 해상도 비(scale factor), 즉 단위 해상도 비(unit scale factor)를 결정하여 계층적 블록 매칭을 수행하는 것을 특징으로 한다. 또한 본 발명에 따른 최적 계층적 블록 매칭 방법 및 시스템은 정확도를 향상시키기 위하여 두 입력 영상의 각 채널의 평균과 표준편차를 이용하여 두 입력 영상 간의 컬러 차이를 고속으로 보정하는 컬러 보정(color alignment, CA) 단계(혹은 컬러 보정부)를 더 포함하기도 한다. 또한 본 발명에 따른 영상 정합(image registration) 방법은, 두 영상에 대해 상기 최적 계층적 블록 매칭 방법 또는 시스템을 이용하여 최적 계층적 블록 매칭을 수행하고, 그 결과를 이용하여 소정의 기하 모델(geometric transformation model)에 기반을 둔 하나 이상의 기하 변환 파라미터를 추정하고, 상기 추정된 기하 변환 파라미터를 이용하여 두 입력 영상 중 하나 이상을 기하 변환하는 것을 특징으로 한다. 또한 본 발명에 따른 최적 계층적 블록 매칭을 이용한 영상 압축 방법은 영상 프레임 간 또는 스테레오스코픽 3D(stereoscopic 3D, S3D) 영상이나 다시점 3D(multiview 3D) 영상의 경우에는 좌우 영상 간 혹은 서로 다른 시점(viewpoint)의 영상 간 모션 보정을 위한 모션 추정의 속도를 획기적으로 향상시키기 위하여 상기 최적 계층적 블록 매칭 방법 또는 시스템을 이용하는 것을 특징으로 한다.

Abstract translation: 本发明涉及优化的分层块匹配（OHBM）方法和系统，以及图像配准方法和图像压缩方法。根据本发明的实施例的OHBM方法和系统通过确定作为两个连续层之间的比例因子的单位比例因子和图像金字塔的层数来优化精度和计算成本来执行分层块匹配分层块匹配。

27.

发明公开
반향 환경에서의 음성특징 향상방법 및 장치 有权
Title translation: 语音特征增强方法和装置在混响环境中

公开(公告)号：KR1020150015990A

公开(公告)日：2015-02-11

申请号：KR1020130092139

申请日：2013-08-02

Applicant: 서강대학교산학협력단

Inventor： 박형민 , 조지원

IPC: G10L15/20 , G10L21/02

CPC classification number: G10L21/02 , G10L15/20

Abstract: A speech feature enhancement method in a reverberation environment according to the present invention initializes model error statics and log mean energy of a room impulse response (RIP) through an approximate modeling process for the reverberation environment, determines an enhanced LMPSCs estimation formula based on the initialized model error statics and log mean energy of RIP, estimates the LMPSCs estimation formula with regard to an observation signal based on the enhanced LMPSCs estimation formula, calculates and updates the log mean energy of the RIP based on the observation signal, the model error statics, and the enhanced LMPSCs, and determines the enhanced LMPSCs estimation formula based on the updated model error statics and log mean average of the RIP. The present invention includes a first step of determining the enhanced LMPSCs estimation method in consideration of a frequency dependent reverberation and a second step of improving the speech feature of an input signal according to the LMPSCs estimation method in consideration of the frequency dependent reverberation.

Abstract translation: 根据本发明的混响环境中的语音特征增强方法通过用于混响环境的近似建模过程初始化房间脉冲响应（RIP）的模型误差静态和对数平均能量，基于初始化的LMPSC估计公式确定增强的LMPSC估计公式 RIP的模型误差静态和对数平均能量，基于增强的LMPSC估计公式估计关于观测信号的LMPSC估计公式，基于观测信号计算和更新RIP的对数平均能量，模型误差静态，和增强的LMPSC，并且基于RIP的更新的模型误差静态和对数平均值来确定增强的LMPSC估计公式。本发明包括考虑到频率相关混响来确定增强型LMPSC估计方法的第一步骤和考虑到频率依赖性混响的根据LMPSC估计方法改进输入信号的语音特征的第二步骤。

28.

发明公开
음성신호의 특징정보를 이용한 흥미점수 산출 시스템 및 방법, 그를 기록한 기록매체 有权
Title translation: 利息计算系统和使用语音信号特征数据的方法，记录计数记录方法

公开(公告)号：KR1020140133257A

公开(公告)日：2014-11-19

申请号：KR1020130053176

申请日：2013-05-10

Applicant: 서강대학교산학협력단 , 경북대학교 산학협력단

Inventor： 박형민 , 조지원 , 김비호 , 이민호

IPC: G10L25/63 , G10L25/09

CPC classification number: G10L25/63 , G10L15/02 , G10L25/09

Abstract: 본 발명에 따르는 음성신호의 특징정보를 이용한 흥미점수 산출 시스템에 있어서, 질의를 위한 음성신호를 입력받아 특징정보를 검출하고, 상기 질의를 위한 음성신호의 특징정보를 수집된 음성신호들과 그에 대해 미리 설정된 점수정보들을 회귀분석 학습하여 생성한 흥미점수 산출함수에 따라 연산하여 흥미점수를 산출하는 제어장치; 상기 흥미점수 및 상기 흥미점수 산출함수를 저장하며, 상기 제어장치의 프로그램 수행을 위해 요구되는 저장영역을 제공하는 메모리부; 및 상기 제어장치의 제어에 따라 음성신호를 제공받아 특징정보를 생성하는 음성신호의 특징정보 검출부;를 구비함을 특징으로 한다.

Abstract translation: 根据本发明，使用语音信号的特征数据的兴趣点计算系统包括：控制单元，接收用于查询的语音信号以检测特征数据，并通过操作语音信号的特征数据来计算兴趣得分，根据通过学习和回归分析收集的语音信号和为信号预设的分数数据产生的兴趣分数计算函数进行查询; 存储单元，存储利息分数和利益分数计算功能，并提供执行控制单元的程序所需的存储; 以及语音信号特征数据检测单元，其根据控制单元的控制接收语音信号以生成特征数据。

29.

发明授权
3차원 기하정보를 이용한 음성 인식 방법 및 이를 이용한 음성 인식 시스템 有权
Title translation: 使用3D几何信息的语音识别系统和方法

公开(公告)号：KR101442211B1

公开(公告)日：2014-10-16

申请号：KR1020130013854

申请日：2013-02-07

Applicant: 서강대학교산학협력단

Inventor： 박형민 , 제창수 , 김비호 , 김민욱

IPC: G10L25/57 , G10L15/25 , G10L15/28

CPC classification number: G10L15/063 , G10L15/24

Abstract: 본 발명은 3차원 기하정보를 이용하여 음성 인식하는 방법 및 시스템에 관한 것이다. 상기 음성 인식 시스템은 학습 모듈 및 인식 모듈을 구비하여, 학습 모듈은 학습용 3차원 기하정보 또는 이들로부터 추출된 학습용 3차원 특징을 이용하여 인식기를 생성한다. 상기 인식 모듈은 음성에 연관되거나 종속된 물리적 대상로부터 획득한 3차원 기하정보 또는 이로부터 추출된 3차원 특징을 상기 인식기에 적용하여 음성 인식하는 것을 특징으로 한다.
본 발명에 따른 음성 인식 시스템 및 방법은 발화시의 입술 및 주변, 또는 인체의 임의의 하나 이상의 영역에 대한 3차원 기하정보를 이용하여 음성 인식하는 것을 특징으로 하며, 더 나아가 발화시의 2차원 특징 또는 음향 특징과 3차원 기하정보 또는 3차원 특징을 결합하여 음성 인식하거나, 발화시의 2차원 특징 또는 음향 특징에 의한 인식 결과와 3차원 기하정보 또는 3차원 특징에 의한 인식 결과를 결합하여 최종적으로 음성 인식함으로써 음성 인식의 정확도를 향상시키는 것을 특징으로 한다.

30.

发明授权
음성 인식 장치 및 음성 인식 방법 有权
Title translation: 语音识别装置和语音识别方法

公开(公告)号：KR101353936B1

公开(公告)日：2014-01-27

申请号：KR1020120030718

申请日：2012-03-26

Applicant: 경북대학교 산학협력단 , 서강대학교산학협력단

Inventor： 이민호 , 박형민 , 장영민 , 김민욱 , 정성문 , 김범휘

IPC: G10L15/24

Abstract: 음성 인식 장치가 개시된다. 본 음성 인식 장치는, 사용자를 촬상한 복수의 이미지 및 음원을 입력받는 입력부, 복수의 이미지 각각에서 사용자의 입술 영역을 검출하는 검출부, 복수의 이미지 각각의 검출된 입술 영역에 대한 동적 돌출맵을 생성하는 돌출맵 생성부, 생성된 동적 돌출맵을 이용하여 입술의 움직임 정보를 취득하는 정보 취득부. 취득된 움직임 정보를 기초로 입력된 음원에 대한 음성 인식을 수행하는 음성 인식부, 및, 음성 인식의 결과를 출력하는 출력부를 포함한다.

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification