여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템
    1.
    发明授权
    여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템 失效
    通过使用谐波结构模型和可变长度窗口来提取复音音乐的装置和方法

    公开(公告)号:KR101106185B1

    公开(公告)日:2012-01-20

    申请号:KR1020100004695

    申请日:2010-01-19

    Abstract: 본 발명은 여러 음을 가지는 오디오 신호에서 멜로디 추출 방법에 관한 것으로, 해결하고자 하는 기술적 과제는 가요나 오케스트라 같이 여러 음을 가진 음악에서 멜로디 성분만을 추출할 수 있는 방법을 제공하는데 있다.
    이를 위해 본 발명은, 여러 음을 가진 오디오 신호가 입력되면, 유동적 길이를 가지는 분석 창을 이용하여 주파수를 분석하는 주파수 분석 단계와,
    상기 주파수 분석 단계를 통하여 분석된 여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용하여 멜로디 피치 후보들을 추출하는 멜로디 피치 후보 추출 단계 및 상기 멜로디 피치 후보 추출 단계에서 추출된 멜로디 피치 후보들을 연결하여 멜로디 라인을 결정하는 멜로디 라인 결정 단계를 포함하는 것을 특징으로 하는 여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법을 개시한다.

    화자 인식 결과의 이력을 이용한 화자 인식 방법 및 장치
    2.
    发明公开
    화자 인식 결과의 이력을 이용한 화자 인식 방법 및 장치 无效
    使用扬声器识别结果历史的扬声器识别装置和方法

    公开(公告)号:KR1020080066394A

    公开(公告)日:2008-07-16

    申请号:KR1020070003798

    申请日:2007-01-12

    Abstract: An apparatus and a method for recognizing a speaker are provided to improve the accuracy in recognition of the speaker by using the reliabilities of speaker voices, which are received in the past. A reference voice database stores reference voices, which correspond to voices of one or more users registered, while the reference voices are matched to the users. A voice reception unit receives a voice of a speaker. A voice feature extraction unit extracts one or more features for speaker-recognition from the received voice. A reliability measurement unit measures the similarity between the extracted features of the received voice and each of the reference voices, thereby obtaining the reliability of voice, which represents a possibility that the speaker corresponds each of the users. A reliability database stores the measured reliability for each of the users. A weight computation unit computes respective weight values for a series of reliabilities stored in the reliability database, according to a predetermined rule. A weight appliance unit applies the computed weight values to the reliabilities, respectively. A determination unit determines whether the received voice is identical to one of the reference voices by calculating an average of the reliabilities to which the weight values are respectively applied and comparing the average with the reliability of the received voice.

    Abstract translation: 提供用于识别扬声器的装置和方法,以通过使用过去接收到的扬声器声音的可靠性来提高扬声器识别的准确性。 参考语音数据库存储与登记的一个或多个用户的语音相对应的参考语音,同时参考语音与用户匹配。 语音接收单元接收扬声器的声音。 语音特征提取单元从接收到的语音中提取用于说话者识别的一个或多个特征。 可靠性测量单元测量所接收的语音的提取特征与每个参考语音之间的相似度,从而获得语音的可靠性,其表示说话者对应每个用户的可能性。 可靠性数据库存储每个用户的测量可靠性。 权重计算单元根据预定规则计算存储在可靠性数据库中的一系列可靠性的相应权重值。 权重装置单元分别将计算的权重值应用于可靠性。 确定单元通过计算分别应用权重值的可靠性的平均值并将平均值与接收到的语音的可靠性进行比较来确定接收到的语音是否与参考语音之一相同。

    다원화된 확률 모형에 기반한 비.에스.에이.씨 산술 복호화방법
    3.
    发明公开
    다원화된 확률 모형에 기반한 비.에스.에이.씨 산술 복호화방법 有权
    基于多项概率模型的BSAC算术解码方法

    公开(公告)号:KR1020080047837A

    公开(公告)日:2008-05-30

    申请号:KR1020060117773

    申请日:2006-11-27

    Abstract: A BSAC arithmetic decoding method based on plural probability models is provided to add only a twentieth part of memory requirements to the memory requirements necessary to store probability models, thereby performing arithmetic decoding operation based on the plural probability models and managing the memory efficiently. A BSAC(Bit Sliced Arithmetic Coding) arithmetic decoding method comprises the following steps of: performing decoding using a probability value corresponding to a predetermined index and storing probability values corresponding the predetermined number of indexes around the predetermined index in a small table of which the number of elements is less than a predetermined number; determining whether a calculated new index is identical with a former index, index used immediately, when the new index different from the predetermined index is calculated; reusing a former probability value if the currently calculated index is identical with the former index; extracting and using a corresponding probability value from the small table if the calculated index corresponds to one of the predetermined number of indexes around the former index; comparing the currently calculated index with index used just before the former index if the currently calculated index has difference more than the element number of the small table; storing probability values corresponding to the predetermined number of indexes around the currently calculated index in the other small table with a size similar to that of the small table when the index used just before the former index and the currently calculated index are compared with each other; and performing the first process using the calculated index when the calculated index is different from the former index and the index used just before the former index. The number of elements on the small table is less than 128.

    Abstract translation: 提供了一种基于多个概率模型的BSAC算术解码方法,仅将第二十部分的存储器要求添加到存储概率模型所需的存储器要求中,从而基于多个概率模型进行算术解码操作并有效地管理存储器。 BSAC(比特切换算术编码)算术解码方法包括以下步骤:使用与预定索引相对应的概率值来执行解码,并将与预定索引周围的预定索引数相对应的概率值存储在小型表中 的元素小于预定数量; 当计算出与所述预定索引不同的新索引时,确定所计算的新索引是否与立即使用的前索引相一致; 如果当前计算的索引与前一个索引相同,则重新使用前一概率值; 如果所计算的索引对应于围绕前一索引的预定数量的索引之一,则从小表提取并使用相应的概率值; 将当前计算出的指数与前一个指数之前使用的指数进行比较,如果当前计算的指数与小表的元素数目有差异; 将与前一个索引之前使用的索引和当前计算出的索引进行比较,将与当前计算出的索引周围的预定数量的索引相对应的概率值存储在另一个小表格中,其大小与小表格的尺寸相似; 并且当所计算的指数与前一个索引不同且在前一个索引之前使用的索引不同时,使用计算的索引执行第一处理。 小桌子上的元素数量小于128。

    다원화된 확률 모형에 기반한 비.에스.에이.씨 산술 복호화방법
    4.
    发明授权
    다원화된 확률 모형에 기반한 비.에스.에이.씨 산술 복호화방법 有权
    基于多概率模型的BSAC算术解码方法

    公开(公告)号:KR101260285B1

    公开(公告)日:2013-05-03

    申请号:KR1020060117773

    申请日:2006-11-27

    Abstract: 본발명은다원화된확률모형에기반한산술복호화방법에관한것이다. 본발명은특히지상파 DMB 서비스의오디오규격인 BSAC 복호화의핵심이되는산술복호화방법에있어서심볼값 복원을위해확률모형으로부터확률값을추출하는경우, 대규모의일원화된테이블로부터추출하는대신, 다원화된복수의소규모테이블들로부터추출함으로써, 필요한연산량을현저히감소시키는효과를달성할수 있다. 또한본 발명에의한산술복호화방법을디지털신호처리프로세서에의하여구현하는경우, 빠른접근속도와메모리사용의효율적인관리를실현할수 있다.

    여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템
    5.
    发明公开
    여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템 失效
    通过使用谐波结构模型和可变长度窗口的方法提取多波音频的装置和方法

    公开(公告)号:KR1020110085089A

    公开(公告)日:2011-07-27

    申请号:KR1020100004695

    申请日:2010-01-19

    CPC classification number: G10L25/90 G10L25/45

    Abstract: PURPOSE: A melody extracting method and system for the same are provided to extract melody component form music with many sounds by using characteristics with energy of the melody component and enabling a melody component to have a harmonic component. CONSTITUTION: A frequency is analyzed by using an analyzing window having a flexible length if an audio signal with many sound is inputted(S100). A candidate melody pitches extracted from an audio signal with a many sounds through a frequency analyzing step by using a harmonic structure model(S200). A melody line is connected to the extracted melody pitch candidates and the candidates area determined(S300).

    Abstract translation: 目的:提供一种旋律提取方法和系统,以通过使用具有旋律分量的能量的特征来提取具有许多声音的音乐的旋律分量,并使旋律分量具有谐波分量。 构成:如果输入了许多声音的音频信号,则通过使用具有灵活长度的分析窗口来分析频率(S100)。 通过使用谐波结构模型,通过频率分析步骤从具有许多声音的音频信号提取的候选旋律间距(S200)。 旋律线连接到提取的旋律音调候选和确定的候选区域(S300)。

    여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법
    6.
    发明公开
    여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법 失效
    基于谐波结构模型的多声道音频提取方案提取方法

    公开(公告)号:KR1020110080554A

    公开(公告)日:2011-07-13

    申请号:KR1020100000841

    申请日:2010-01-06

    CPC classification number: G10L25/90

    Abstract: PURPOSE: A method for melody pitch candidate extraction of polyphonic audio based on a harmonic structure model is provided to extract melody pitch candidates in an audio signal including various sounds. CONSTITUTION: An audio signal including various sounds are short Fourier transformed(S10). The unit of the Fourier transformed audio signal is changed into a cent from Hz(S20). A peak point is extracted from each frame of the audio signal which was transformed to the cent unit(S30). The weight of a harmonic structure model which is included in candidate melody pitches is measured(S40). An energy level difference by a frequency is compensated based on the weight information(S50).

    Abstract translation: 目的:提供一种基于谐波结构模型的和弦音频旋律音调候选提取方法,以提取包含各种声音的音频信号中的旋律音调候选。 构成:包括各种声音的音频信号是短傅里叶变换(S10)。 傅立叶变换音频信号的单位从Hz变为一分(S20)。 从转换成分单位的音频信号的每个帧提取峰值点(S30)。 测量包括在候选旋律间距中的谐波结构模型的重量(S40)。 基于权重信息来补偿频率的能级差(S50)。

    멜로디 라인의 특성에 기반한 멜로디 피치 후보들로부터의 멜로디 라인 결정 방법
    7.
    发明公开
    멜로디 라인의 특성에 기반한 멜로디 피치 후보들로부터의 멜로디 라인 결정 방법 失效
    基于MELODY LINE属性的MELODY PITCH候选人的线索决策方法

    公开(公告)号:KR1020110080553A

    公开(公告)日:2011-07-13

    申请号:KR1020100000840

    申请日:2010-01-06

    CPC classification number: G10H1/0025 G10H2210/056

    Abstract: PURPOSE: A melody line decision method from melody pitch candidates on the basis of the property of a melody line is provided for N melody pitch candidates and each melody pitch candidate to efficiently determine a melody line on the basis of physical properties of the melody line. CONSTITUTION: A system is input information about N melody pitch candidates and weight which the melody pitch candidate has in each frame(S10). In a start frame, the system selects N melody pitch candidates and arrays the candidate in a weight descending order(S40). The system determines whether two neighbor melody pitch candidates satisfy set melody line standards(S50). The system selects N melody line candidates through a melody line connection in each melody section(S60). The system selects an optimal melody line(S70).

    Abstract translation: 目的:根据旋律线的属性提供旋律音调候选人的旋律线决策方法,用于N个旋律音调候选和每个旋律音调候选,以根据旋律线的物理特性来有效地确定旋律线。 构成:系统是关于N个旋律音调候选的输入信息和旋律音调候选在每个帧中的权重(S10)。 在起始帧中,系统以加权降序选择N个旋律音调候选和阵列候选(S40)。 系统确定两个相邻旋律音调候选是否满足设定的旋律线标准(S50)。 系统通过每个旋律部分中的旋律线连接来选择N个旋律线候选(S60)。 系统选择最佳旋律线(S70)。

    여러 음을 가진 오디오 신호에서 유동적 길이를 가지는 분석 창을 이용한 주파수 분석 방법
    8.
    发明授权
    여러 음을 가진 오디오 신호에서 유동적 길이를 가지는 분석 창을 이용한 주파수 분석 방법 失效
    使用可变长度窗口对复调音频进行频谱分析的方法

    公开(公告)号:KR101095968B1

    公开(公告)日:2011-12-19

    申请号:KR1020100004696

    申请日:2010-01-19

    Abstract: 본 발명은 여러 음을 가진 오디오 신호에서 유동적 길이를 가지는 분석 창을 이용한 주파수 분석 방법에 관한 것이다.
    이를 위해 본 발명은, 입력된 오디오 신호를 리샘플링하는 제 1단계와, 시간 영역 기준으로 입력된 오디오 신호를 주파수 영역 기준의 신호로 변환하는 제 2단계와, 상기 제 2단계를 통하여 얻어진 각 프레임의 스펙트럼에서 진폭의 피크 값과 상기 피크 값이 나타나는 위치의 주파수 값을 추출하는 제 3단계와, 상기 제 3단계를 통하여 추출된 값들을 바탕으로 각 프레임의 멜로디 피치가 존재하는 범위를 재설정하는 제 4단계와, 상기 제 2단계를 통하여 주파수 영역 기준의 신호로 변환된 결과에서 프레임 간의 자기상관계수를 파악하는 방법으로 멜로디 피치의 동적 변화 정보를 구하는 제 5단계와, 상기 제 4단계를 통하여 재설정된 각 프레임의 멜로디 피치가 존재하는 범위에 관한 정보 및 상기 제 5단계를 통하여 구한 멜로디 피치의 동적 변화 정보를 이용하여 각 프레임에 대응되는 분석 창의 길이를 설정하는 제 6단계와, 고주파수 통과 필터를 이용하여 오디오 신호에서 베이스 신호 및 저주파수 신호를 제거하는 제 7단계와, 상기 제 7단계를 통하여 고주파수 통과 필터를 통과한 오디오 신호를 상기 제 6단계에서 길이가 설정된 각 프레임에 대응되는 분석 창을 이용하여 단시간 푸리에 변환 하는 제 8단계 및 상기 제 8단계를 통하여 단시간 푸리에 변환된 오디오 신호를 주파수 영역의 분해능을 높이기 위해 다중비율필터뱅크를 통과 시키는 제 9단계를 포함한다.

    여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법
    9.
    发明授权
    여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법 失效
    基于谐波结构模型的复音音频旋律音调提取方法

    公开(公告)号:KR101093725B1

    公开(公告)日:2011-12-19

    申请号:KR1020100000841

    申请日:2010-01-06

    Abstract: 본 발명은 여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용하여 멜로디 피치 후보를 추출하기 위한 방법에 관한 것이다.
    이를 위해 본 발명에서는, 입력된 여러 음을 가지는 오디오 신호를 단시간 푸리에 변환(STFT)하는 제 1단계와, 상기 제 1단계를 통하여 단시간 푸리에 변환(STFT)된 오디오 신호의 단위를 헤르쯔(Hz)에서 센트(Cent)로 변환하는 제 2단계와, 상기 제 2단계를 통하여 센트(Cent) 단위로 변환된 오디오 신호의 각 프레임 마다 피크 지점을 추출하는 제 3단계와, 멜로디 피치 후보들이 내포한 하모닉 구조 모델의 비중(Weight)을 측정하는 제 4단계와, 상기 제 4단계에서 측정한 비중(Weight) 정보에 있어서, 주파수에 따른 에너지 레벨 차이를 보상하는 제 5단계 및 각 프레임에서 N개의 멜로디 피치 후보를 추출하는 제 6단계를 포함하는 것을 특징으로 하는 멜로디 피치 후보 추출 방법을 개시한다.

    멜로디 라인의 특성에 기반한 멜로디 피치 후보들로부터의 멜로디 라인 결정 방법
    10.
    发明授权
    멜로디 라인의 특성에 기반한 멜로디 피치 후보들로부터의 멜로디 라인 결정 방법 失效
    基于旋律线属性的旋律音调候选者旋律线决策方法

    公开(公告)号:KR101079743B1

    公开(公告)日:2011-11-03

    申请号:KR1020100000840

    申请日:2010-01-06

    Abstract: 본발명은멜로디라인결정방법에관한것으로, 해결하고자하는기술적과제는멜로디라인이가지는물리적특성에기반하여효율적으로멜로디라인을결정할수 있는방법을제공하는데있다. 이를위해본 발명에따른멜로디라인결정방법은, 각프레임에서 N개의멜로디피치후보들과상기피치후보들이가지는비중에관한정보를입력받는제 1단계와, 오디오신호의단위를헤르쯔(Hz)에서센트(Cent)로변환하는제 2단계와, 멜로디라인의시작프레임을설정하는제 3단계와, 상기제 3단계를통하여설정된시작프레임에서상기제 1단계에서입력받은 N개의멜로디피치후보들을선택하고이들을비중이큰 순으로정렬하는제 4단계와, 이웃한두 멜로디피치후보가기설정된멜로디라인기준을만족하는지판정하는제 5단계와, 멜로디라인연결을통해각 멜로디구간마다 N개의멜로디라인후보를선택하는제 6단계와, 상기제 6단계를통하여선택된 N개의멜로디라인후보중에서최적의멜로디라인을선택하는제 7단계와, 상기제 7단계에서선택된최적의멜로디라인을스무드화(Smoothing) 하는제 8단계를포함한다.

Patent Agency Ranking