얼굴 검출 장치
    91.
    发明公开
    얼굴 검출 장치 有权
    用于检测脸部的装置

    公开(公告)号:KR1020110019969A

    公开(公告)日:2011-03-02

    申请号:KR1020090077609

    申请日:2009-08-21

    CPC classification number: H04N5/2621 G06K9/00228 G06K9/4614 G06T7/44

    Abstract: PURPOSE: A face detecting apparatus is provided to maintain the performance of a face recognition technique by using the intensity and the edge of face detection and detect the combination of extracted information by extracting EOH feature information from an integral image. CONSTITUTION: A feature information extractor(110) generates an integral image and an edge image from an input image. The feature information extractor extracts Haar-like feature information from the integral image through previously stored learning data. The feature information extractor extracts EOH(Edge Of Histogram) feature information from the edge image. A face detector(140) detects a face in an adaboost algorithm.

    Abstract translation: 目的:提供一种面部检测装置,通过使用面部检测的强度和边缘来保持面部识别技术的性能,并通过从整体图像中提取EOH特征信息来检测提取的信息的组合。 构成:特征信息提取器(110)从输入图像生成整体图像和边缘图像。 特征信息提取器通过先前存储的学习数据从积分图像中提取哈尔状特征信息。 特征信息提取器从边缘图像提取EOH(直方图边缘)特征信息。 面部检测器(140)在adaboost算法中检测脸部。

    빔포밍 기술을 이용한 음원 분리 방법 및 시스템
    93.
    发明公开
    빔포밍 기술을 이용한 음원 분리 방법 및 시스템 有权
    声源分离方法和使用波束形成的系统

    公开(公告)号:KR1020100010356A

    公开(公告)日:2010-02-01

    申请号:KR1020080071287

    申请日:2008-07-22

    Abstract: PURPOSE: A sound source separation method and a system thereof are provided to separate each voice when two or more voices are inputted at the same time, thereby improving performance of the voice communicator/recognizer. CONSTITUTION: A windowing processing unit covers an integrated voice signal inputted by at least one bean formed microphone array with a window. A DFT(Discrete Fourier Transform) transforming unit(200) changes the signal in which the window is covered into a frequency axis. A TF(Transfer Function) estimating unit(300) estimates a TF with a feature value of two or more different individual voice signal from the signal in which the window is covered. A noise estimating unit(400) removes noises of the individual voice signals from the TF. A voice signal detecting unit(600) extracts the individual voice signals from the noise removed voice signals.

    Abstract translation: 目的:提供一种声源分离方法及其系统,用于在同时输入两个或多个语音时分离每个语音,从而提高语音通信器/识别器的性能。 构成:窗口处理单元覆盖由具有窗口的至少一个豆形麦克风阵列输入的综合语音信号。 DFT(离散傅立叶变换)变换单元(200)将窗口被覆盖的信号改变为频率轴。 TF(传递函数)估计单元(300)从窗口被覆盖的信号估计具有两个或更多个不同单独语音信号的特征值的TF。 噪声估计单元(400)从TF去除各个声音信号的噪声。 语音信号检测单元(600)从噪声消除的语音信号中提取各个语音信号。

    음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
    94.
    发明公开
    음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치 有权
    使用语音和声估计噪声的方法和装置

    公开(公告)号:KR1020080086298A

    公开(公告)日:2008-09-25

    申请号:KR1020070028310

    申请日:2007-03-22

    CPC classification number: G10L21/0208

    Abstract: A method and an apparatus for estimating noise by using harmonics of a speech signal are provided to estimate a noise spectrum by determining a weight of a noise spectrum estimation function according to a speech presence probability, thereby expanding a range of the weight and estimating non-stationary noise. Harmonics components are estimated in an inputted sound signal frame(103). A speech presence probability on the sound signal frame is calculated by using the estimated harmonics components(105). A weight of a noise spectrum estimation function is determined according to the speech presence probability(107). A noise spectrum is estimated and updated by using the determined weight and noise spectrum estimation function(109).

    Abstract translation: 提供一种通过使用语音信号的谐波来估计噪声的方法和装置,以通过根据语音存在概率确定噪声谱估计函数的权重来估计噪声谱,从而扩大权重的范围, 平稳噪音 在输入的声音信号帧(103)中估计谐波分量。 通过使用估计的谐波分量(105)来计算声音信号帧上的语音存在概率。 根据语音存在概率确定噪声谱估计函数的权重(107)。 通过使用确定的权重和噪声谱估计函数(109)来估计和更新噪声谱。

    실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법
    95.
    发明授权
    실제 잡음 환경의 특성을 반영한 빔포밍 장치 및 방법 有权
    波束形成装置及其实际噪声环境特性的反射方法

    公开(公告)号:KR100856246B1

    公开(公告)日:2008-09-03

    申请号:KR1020070012803

    申请日:2007-02-07

    Abstract: 본 발명은 실제 잡음 환경의 특성을 반영하여 빔포밍을 수행하기 위한 장치 및 방법에 관한 것이다. 이를 위하여 본 발명은 실제 잡음 환경의 특성을 반영한 빔포밍 장치에 있어서, 적어도 하나의 마이크로폰으로 구성되고, 마이크로폰을 통해 입력되는 입력신호를 출력하는 마이크로폰 어레이와, 입력신호가 입력되면, 입력신호에 대해 각 마이크로폰 간격에 따른 코히런스들을 계산한 후, 동일거리 별로 각각 코히런스들의 평균을 계산하고, 계산된 평균 코히런스들을 필터링 한 후 출력하는 코히런스 함수 생성부, 필터링된 평균 코히런스들을 이용하여 공간필터 계수를 산출하여 출력하는 공간필터 계수 산출부와, 공간필터 계수를 이용하여 입력신호에 대한 빔포밍을 수행하여 잡음 처리된 신호를 출력하는 빔포밍 수행부를 포함하여 구성되는 것을 특징으로 한다.
    빔포머, 마이크로폰 어레이, 코히런스

    동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체
    96.
    发明授权
    동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체 失效
    从语音识别结果中提取元数据的方法和视频中的字符识别方法,使用METADTA和记录媒体搜索视频的方法

    公开(公告)号:KR100828166B1

    公开(公告)日:2008-05-08

    申请号:KR1020070057478

    申请日:2007-06-12

    Abstract: A method for extracting metadata through speech recognition and caption recognition of a video, a video searching method using metadata, and a recording medium recording the same are provided to extract metadata information as a speech recognition result and an opened caption recognition result, reduce archiving work time by manual work, and enable broadcasting manufacturers to manufacture contents of good quality by automatically executing contents management and index work for mass broadcasting data. A method for extracting metadata through speech recognition and caption recognition of a video comprises the following steps of: inputting the video including the metadata, and extracting a start frame and a screen conversion frame of the inputted video(110); displaying the extracted start frame and screen conversion frame as a thumbnail image, and storing the displayed thumbnail image and time information of the thumbnail image(120); recognizing a voice of a speaker according to a phoneme of a voice included in the inputted video, and converting the recognized voice data into text data before extracting a keyword from the converted text data(130); extracting a caption through caption recognition from the inputted video(140); extracting metadata and title from the keyword and caption included in thumbnail images of a start shot, an end shot and between the start shot and the end shot if the start shot and the end shot are designated by a user in the start frame and the screen conversion frame of the displayed video(150); and displaying the extracted metadata, time information of the start shot, time information of the end shot and the title(160).

    Abstract translation: 提供通过视频的语音识别和字幕识别提取元数据的方法,使用元数据的视频搜索方法以及记录其的记录介质来提取元数据信息作为语音识别结果和开放的字幕识别结果,减少归档工作 通过手工工作,通过自动执行大众广播数据的内容管理和索引工作,使广播制造商能够制作出高品质的内容。 一种通过视频的语音识别和字幕识别来提取元数据的方法包括以下步骤:输入包括元数据的视频,以及提取输入视频(110)的起始帧和屏幕转换帧; 将所提取的开始帧和画面转换帧显示为缩略图,并存储所显示的缩略图和缩略图(120)的时间信息; 根据输入视频中包含的语音的音素识别扬声器的声音,并且在从转换后的文本数据提取关键字之前将识别的语音数据转换为文本数据; 从输入的视频(140)中通过字幕识别提取字幕; 如果在开始帧和屏幕中用户指定开始镜头和结束镜头,则从起始镜头,结束镜头以及开始镜头和结束镜头的缩略图中提取的关键字和标题中的元数据和标题提取, 所显示的视频的转换帧(150); 并显示所提取的元数据,开始拍摄的时间信息,结束拍摄的时间信息和标题(160)。

    멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치
    97.
    发明公开
    멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치 失效
    多通道语音信号适应性消除噪声的预处​​理方法和装置

    公开(公告)号:KR1020070050700A

    公开(公告)日:2007-05-16

    申请号:KR1020050108238

    申请日:2005-11-11

    Inventor: 고한석 김기현

    Abstract: 멀티채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치가 개시된다. 그 전처리 장치는 멀티음성채널의 각 입력채널별로 매 프레임의 채널신호 평균이득(RMS) 값을 계산하는 평균이득 계산부; 상기 평균이득 계산부에서 계산된 평균이득을 이용하여 상기 멀티채널 간의 상대적인 평균이득비를 계산하는 이득비추정부; 및 상기 이득비 추정부에서 계산된 평균이득비의 역을 이용하여 채널별로 입력신호를 보정하는 이득비역보상부를 포함함을 특징으로 한다.
    본 발명에 의하면, 전체 시스템의 잡음 제거 성능을 향상 할 수 있다. 또한 잡음 제거의 모든 과정이 시간 도메인에서 처리되도록 함으로써 매 샘플마다 잡음 추정 과정을 진행할 수 있으며, 실시간적용에 적합한 작은 계산량을 갖는다. 추가로 잘못된 이득 비 추정에 대한 제한을 둠으로써 기존 GSC의 성능을 저해하는 것을 방지한다.

Patent Agency Ranking