-
公开(公告)号:KR101265960B1
公开(公告)日:2013-05-22
申请号:KR1020070084127
申请日:2007-08-21
Applicant: 삼성전자주식회사
IPC: H04N21/845
Abstract: 본발명은하이라이트추출장치및 방법을제공한다. 본발명의하이라이트추출장치는영상정보를오디오신호와비디오신호로분류하고오디오신호를복수의오디오구간으로분류하며, 비디오신호중 키워드의문자분석과오디오구간중 키워드의음소열매칭을통해키워드를생성하는키워드생성부및, 키워드생성부로입력되는오디오구간중 사운드를분석함으로써하이라이트구간을추출하고키워드중 특정키워드의출현빈도가높은하이라이트구간을결합하여키워드별하이라이트구간을생성하는하이라이트생성부를포함한다. 동영상의하이라이트뿐만아니라키워드별하이라이트를브라우징할수 있는장점이있다.
-
公开(公告)号:KR1020090019582A
公开(公告)日:2009-02-25
申请号:KR1020070084127
申请日:2007-08-21
Applicant: 삼성전자주식회사
IPC: H04N21/845
Abstract: A highlight extracting apparatus and a method thereof for providing highlight to a keyword in which a user desires are provided to select a highlight according to a keyword desired by a user and highlight of the specific moving picture. A keyword generating unit(100) is comprised of a signal sorting apparatus(110), an integration subtitle detector(120) and a keyword indexing apparatus(130). The signal sorting apparatus classifies the video information into the audio signal and the video signal. The audio signal is classified into a plurality of audio sections. The integrator film detector detects the integration caption areas among the video signal. The keyword is formed through the character analysis. The keyword indexing apparatus indexes a keyword through keyword and phoneme series indexed among the audio section of an integration subtitle detector. The keyword indexing apparatus transmits the generated keyword to the highlight generating unit(200). The keyword highlight section is matched.
Abstract translation: 提供用于向用户期望的关键字提供高亮的亮点提取装置及其方法,以根据用户期望的关键字和特定运动图像的高亮度来选择高亮。 关键字生成单元(100)由信号分类装置(110),积分字幕检测器(120)和关键字索引装置(130)构成。 信号分类装置将视频信息分类为音频信号和视频信号。 音频信号分为多个音频部分。 积分器胶片检测器检测视频信号中的集成字幕区域。 关键字是通过字符分析形成的。 关键词索引装置通过在集成字幕检测器的音频部分中索引的关键字和音素序列来索引关键词。 关键词索引装置将生成的关键字发送到高亮生成单元(200)。 关键字高亮部分匹配。
-
公开(公告)号:KR1020070081276A
公开(公告)日:2007-08-16
申请号:KR1020060013125
申请日:2006-02-10
Applicant: 삼성전자주식회사
IPC: G06F17/30
CPC classification number: G06F15/00 , G06F17/30743 , G06F17/30758 , G10L25/48
Abstract: A method and a device for searching music information with an MS are provided to search the music information at high speed in a noise environment by extracting the MS(Modulation Spectrum) insensitive to the noise environment converting property of the extracted module spectrum into bits, and using a hash table. An audio fingerprint generator(110) generates an audio fingerprint by extracting an MDCT(Modified Discrete Cosine Transformation)-MS from the music data of a compressed section. An audio data searcher(120) provides the information for the searched audio data by searching the audio data corresponding to the generated audio fingerprint. The audio fingerprint generator includes an MDCT coefficient extractor(111) extracting the MDCT coefficient by partially decoding the music data of the compressed section, an MDCT coefficient selector(112) selecting the MDCT coefficient found in a frequency section not affected by noise from the extracted MDCT coefficient, a MS generator(113), and a bit part(114). The MS generator generates the MS by performing DFT(Discrete Fourier Transformation) in the selected MDCT coefficient. The bit part quantizes the property of the generated MDCT-MS in a bit derivation mode.
Abstract translation: 提供了一种利用MS搜索音乐信息的方法和装置,通过提取对所提取的模块频谱的噪声环境转换特性不敏感的MS(调制频谱)为比特,在噪声环境中高速搜索音乐信息,以及 使用哈希表。 音频指纹生成器(110)通过从压缩部分的音乐数据提取MDCT(修正离散余弦变换)-MS来产生音频指纹。 音频数据搜索器(120)通过搜索对应于所生成的音频指纹的音频数据来提供搜索到的音频数据的信息。 音频指纹生成器包括MDCT系数提取器(111),通过对压缩部分的音乐数据进行部分解码来提取MDCT系数; MDCT系数选择器(112),其选择在不受噪声影响的频率部分中找到的MDCT系数 MDCT系数,MS发生器(113)和位部分(114)。 MS发生器通过在所选择的MDCT系数中执行DFT(离散傅里叶变换)来产生MS。 该位部分在位导出模式下量化生成的MDCT-MS的属性。
-
公开(公告)号:KR100803206B1
公开(公告)日:2008-02-14
申请号:KR1020050108070
申请日:2005-11-11
Applicant: 삼성전자주식회사
CPC classification number: G06Q30/0276 , G10L19/0212 , G10L25/48
Abstract: 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법이 개시된다. 본 발명에 의한 오디오 지문 생성 장치는, 오디오 데이터를 압축영역에서 부분적으로 디코딩하여 MDCT 계수들을 추출하는 계수 추출부, 추출된 MDCT 계수들에서 잡음환경에 강인한 MDCT 계수를 선택하는 계수 선택부, 선택된 MDCT 계수를 퓨리에 변환하여 변조 스펙트럼을 생성하는 스펙트럼 생성부 및 생성된 변조 스펙트럼을 양자화하여 오디오 지문을 생성하는 비트화부를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 다양한 환경에서 녹음된 오디오 데이터를 정확하고 빠르게 검색할 수 있는 효과를 거둘 수 있다. 그리고, MP 3 기반의 요소를 이용하므로 MP3 어플리케이션에 다양하게 적용될 수 있는 효과를 거둘 수 있다. 또한, 음악 무드 분류, 음악 장르 분류와 같은 오디오 데이터의 분류에 이용할 수 있고, 스포츠 동영상에서 특정 이벤트를 추출하는 데 사용되는 등 다양한 분야에 적용될 수 있는 효과를 거둘 수 있다.-
公开(公告)号:KR100717387B1
公开(公告)日:2007-05-11
申请号:KR1020060008159
申请日:2006-01-26
Applicant: 삼성전자주식회사
Abstract: 본 발명은 음악 파일에 대한 무드와 장르를 분류하여 데이터베이스에 저장하고 사용자에 의해 요청된 쿼리 음악의 무드와 장르가 동일한 음악 파일로부터 유사곡을 검색하는 방법 및 그 장치에 관한 것이다. 본 발명은 음악 파일로부터 음악의 무드/장르를 분류하기 위한 제1 특성을 추출하는 단계와, 상기 추출된 제1 특성을 이용하여 상기 음악 파일에 대한 무드/장르를 분류하는 단계와, 상기 음악 파일로부터 유사성을 검색하기 위한 제2 특성을 추출하는 단계와, 상기 분류된 무드/장르 정보 및 상기 추출된 제2 특성을 소정의 데이터베이스 저장하는 단계와, 사용자로부터 쿼리 음악 정보를 입력 받는 단계와, 상기 쿼리 음악에 대한 무드/장르를 검출하는 단계와, 상기 데이터베이스를 참조하여 상기 쿼리 음악과 무드/장르가 동일한 음악 파일에 대해 상기 쿼리 음악과의 유사도를 측정하는 단계 및 상기 측정된 유사도에 따라 상기 쿼리 음악에 대한 유사곡을 검색하는 단계를 포함하는 것을 특징으로 하는 유사곡 검색 방법을 제공한다. 본 발명에 의하면, 음악의 무드 및 장르 자동 분류 결과를 이용하여 비슷한 음악 무드 및 장르에 대해서만 유사곡을 검색하므로 검색 결과에 대한 신뢰도가 높은 유사곡 검색 방법 및 그 장치를 제공할 수 있다.
음악, 무드, 장르, 유사곡, 검색Abstract translation: 本发明涉及一种用于存储数据库的音乐文件的情绪和流派分类和从音乐文件,心情和由用户查询所请求的音乐相同流派搜寻类似的歌曲的方法和装置。 该方法包括以下步骤:从音乐文件中提取用于对音乐的情绪/流派进行分类的第一特征;使用所提取的第一特征对音乐文件的情绪/流派进行分类; 提取用于从情绪/流派信息和提取的第二特征中搜索相似度的第二特征,将分类的情绪/流派信息和提取的第二特征存储在预定数据库中,从用户接收查询音乐信息, 检测查询音乐的情绪/流派;参考数据库,针对具有与查询音乐相同的心情/流派的音乐文件,测量查询音乐和查询音乐之间的相似度; 并寻找类似的音乐作品。 根据本发明,类似的歌曲只有类似的音乐风格和情绪使用的心情和音乐流派自动分类搜索,因为它可以提供类似于搜索的高可靠性在搜索结果和设备中的歌曲的方式。
-
公开(公告)号:KR100715949B1
公开(公告)日:2007-05-08
申请号:KR1020050107957
申请日:2005-11-11
Applicant: 삼성전자주식회사
Abstract: 본 발명은 음악 파일의 압축 영역으로부터 MDCT(Modified Discrete Cosine Transformation) 기반의 음색 특성 및 템포 특성을 추출하고 추출된 음색 특성 및 템포 특성을 기초로 하여 음악 파일에 대한 무드를 분류하는 방법 및 그 장치에 관한 것이다. 본 발명은 음악 파일의 압축 영역으로부터 MDCT(Modified Discrete Cosine Transformation) 기반의 음색(timbre) 특성을 추출하는 단계와, 상기 음악 파일의 상기 압축 영역으로부터 MDCT 기반의 템포(tempo) 특성을 추출하는 단계 및 상기 추출된 음색 특성 및 템포 특성을 기초로 하여 상기 음악 파일에 대한 무드를 분류하는 단계를 포함하는 것을 특징으로 하는 고속 음악 무드 분류 방법을 제공한다. 본 발명에 의하면, 압축 영역에서 음악 파일의 음색 특성 및 템포 특성을 추출하여 고속으로 정확하게 음악 무드를 분류할 수 있다.
음악, 무드, 음색, 템포, 추출, 분류Abstract translation: 本发明是一种方法和用于所提取的色调特性和速度特性基于特性的音乐文件和提取音的压缩区(修正离散余弦变换)MDCT的基础上,音乐文件的情绪分类的装置和速度属性 它涉及。 本发明包括基于压缩区域提取的MDCT的相位和节奏(速度)的步骤中,该音乐文件的压缩区的音乐文件来提取语音(音色)的碱的特性的特性(修正离散余弦变换)的MDCT,并 并根据提取的音色特征和节奏特征对音乐文件的情绪进行分类。 根据本发明,可以提取压缩区域中的音乐文件的音色特性和节奏特性,并且可以高速精确地分类音乐心情。
-
公开(公告)号:KR1020060042700A
公开(公告)日:2006-05-15
申请号:KR1020040091451
申请日:2004-11-10
Applicant: 삼성전자주식회사
CPC classification number: G01H3/08
Abstract: 임펄스 이벤트 분리 장치 및 방법이 개시된다. 본 발명의 임펄스 이벤트 분리 장치는 입력신호를 프레임 단위로 분할하는 전처리부; 프레임을 복수의 주파수 서브대역으로 분할하고, 각 서브대역별 신호에 대한 파워변화와 위상 변화를 구하여 복수의 온셋을 검출하며, 검출된 온셋들을 이용하여 복수의 이벤트를 검출하는 이벤트 검출부; 검출된 이벤트들을 저장하는 이벤트 버퍼; 및 임펄스 이벤트의 특성을 참조하여 이벤트들이 임펄스 이벤트인지를 판별하는 임펄스 이벤트 판별부를 포함함을 특징으로한다.
-
公开(公告)号:KR100832360B1
公开(公告)日:2008-05-26
申请号:KR1020060092858
申请日:2006-09-25
Applicant: 삼성전자주식회사
CPC classification number: H03G5/005 , G10H1/125 , G10H2210/046 , G10H2240/081 , G10H2240/131 , G10H2250/235 , G10L25/00
Abstract: 본 발명은 연속적인 오디오 스트림으로부터 추출된 오디오 특징값을 이용하여 카테고리를 분류하고, 분류된 카테고리에 따라 이퀄라이저를 조정하기 위한 제1 사운드 모드를 인식하는 제1 사운드 모드 인식기와, 저장된 음악으로부터 추출된 하이라이트를 이용하여 각 음원의 장르를 분류하여 상기 이퀄라이저를 조정하기 위한 제2 사운드 모드를 인식하는 제2 사운드 모드 인식기 및 상기 제1 사운드 모드 또는 상기 제2 사운드 모드를 분석하여 조정할 사운드 모드를 선택하고, 선택된 사운드 모드에 따라 상기 이퀄라이저를 조정하는 이퀄라이저 조정기를 포함하는 것을 특징으로 하는 이퀄라이저 조정 시스템을 제공한다.
이퀄라이저, 조정, 오디오 특징값, 카테고리, 장르, 분류-
公开(公告)号:KR100774585B1
公开(公告)日:2007-11-09
申请号:KR1020060013125
申请日:2006-02-10
Applicant: 삼성전자주식회사
IPC: G06F17/30
CPC classification number: G06F15/00 , G06F17/30743 , G06F17/30758 , G10L25/48
Abstract: 본 발명은 음악 데이터로부터 변조 스펙트럼을 추출하고 추출된 변조 스펙트럼을 해시 비트로 전환한 후 해시 테이블을 사용하여 잡음 환경에서 고속으로 음악 정보를 검색하는 방법 및 그 장치에 관한 것이다. 본 발명은 압축 영역의 음악 데이터로부터 변조 스펙트럼(Modulation Spectrum)을 추출하여 지문 비트(fingerprint bit)로 변환하고, 상기 지문 비트를 해시 테이블(hash table)로 정렬하고, 주어진 쿼리를 그에 대응하는 해시 함수에 의한 주소로 변환하여 상기 해시 테이블을 참조하여 상기 음악 정보를 검색하는 것을 특징으로 하는 음악 정보 검색 방법을 제공한다. 본 발명에 의하면, 잡음 환경에 강인한 변조 스펙트럼을 추출하고 추출된 변조 스펙트럼의 특성을 해시 비트로 변환한 후 해시 테이블을 사용함으로써 잡음 환경에서 고속으로 음악 정보를 검색하는 방법 및 그 장치를 제공할 수 있다.
해시, 지문, MDCT, MS, 검색-
公开(公告)号:KR1020070050631A
公开(公告)日:2007-05-16
申请号:KR1020050108070
申请日:2005-11-11
Applicant: 삼성전자주식회사
CPC classification number: G06Q30/0276 , G10L19/0212 , G10L25/48
Abstract: 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법이 개시된다. 본 발명에 의한 오디오 지문 생성 장치는, 오디오 데이터를 압축영역에서 부분적으로 디코딩하여 MDCT 계수들을 추출하는 계수 추출부, 추출된 MDCT 계수들에서 잡음환경에 강인한 MDCT 계수를 선택하는 계수 선택부, 선택된 MDCT 계수를 퓨리에 변환하여 변조 스펙트럼을 생성하는 스펙트럼 생성부 및 생성된 변조 스펙트럼을 양자화하여 오디오 지문을 생성하는 비트화부를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 다양한 환경에서 녹음된 오디오 데이터를 정확하고 빠르게 검색할 수 있는 효과를 거둘 수 있다. 그리고, MP 3 기반의 요소를 이용하므로 MP3 어플리케이션에 다양하게 적용될 수 있는 효과를 거둘 수 있다. 또한, 음악 무드 분류, 음악 장르 분류와 같은 오디오 데이터의 분류에 이용할 수 있고, 스포츠 동영상에서 특정 이벤트를 추출하는 데 사용되는 등 다양한 분야에 적용될 수 있는 효과를 거둘 수 있다.
-
-
-
-
-
-
-
-
-