의미 표현 처리 장치 및 그 방법
    31.
    发明公开
    의미 표현 처리 장치 및 그 방법 失效
    意义表达处理装置及其方法

    公开(公告)号:KR1020110010916A

    公开(公告)日:2011-02-08

    申请号:KR1020090068268

    申请日:2009-07-27

    CPC classification number: G10L15/26 G06F17/2809 G10L15/1822

    Abstract: PURPOSE: A meaning representation processing device and a method thereof are provided to interpret a sentence which is available for being generated in a constructed meaning expression group and train an auto translating unit. CONSTITUTION: A meaning expression converting unit(202a) converts a word column of an input voice recognition result in a meaning expression. By referring a previously constructed meaning expression group database(206a), a meaning expression matching unit(204a) searches the converted meaning expression. According to the search result, a meaning expression matching unit determines a final meaning expression. A sentence generating unit(208a) generates the generated final meaning expression into a final sentence.

    Abstract translation: 目的:提供一种意义表示处理设备及其方法来解释可在构造的意义表达组中生成的句子并训练自动翻译单元。 构成:意义表达转换单元(202a)将意义表达式中的输入语音识别结果的单词列转换。 通过引用先前构造的意义表达组数据库(206a),意义表达匹配单元(204a)搜索转换的含义表达式。 根据搜索结果,意义表达匹配单元确定最终含义表达。 句子生成单元(208a)将生成的最终含义表达式生成到最终句子中。

    문장 코퍼스에 대한 영역 자동분류 방법 및 장치
    32.
    发明公开
    문장 코퍼스에 대한 영역 자동분류 방법 및 장치 有权
    方法和装置自动分类

    公开(公告)号:KR1020100048842A

    公开(公告)日:2010-05-11

    申请号:KR1020090021205

    申请日:2009-03-12

    CPC classification number: G06F17/2715

    Abstract: PURPOSE: A method and an apparatus for automatic classification of sentence corpus are provided to facilitate the guarantee of sentence corpus for each area by re-classifying sentence corpuses of various regions into detailed areas. CONSTITUTION: Au auto area classification apparatus includes a sentence learning unit(100) and a sentence classification unit(200). The sentence learning unit learns training set sentence corpus for each detail area to be classified, and extracts N-gram information of detailed sections. The sentence learning unit converts the N-gram information into weight between the detailed sections, and classifies a test set or classified target sentence corpus to be classified according to the weight.

    Abstract translation: 目的:提供一种自动分类句子语料库的方法和装置,通过将各区域的句子语料库重新分类为详细区域,便于保证每个区域的句子语料库。 构成:Au自动区域分类装置包括句子学习单元(100)和句子分类单元(200)。 句子学习单元对每个要分类的细节区域学习训练集句子语料库,并提取详细章节的N-gram信息。 句子学习单元将N-gram信息转换成详细部分之间的权重,并根据权重将测试集或分类目标句子语料进行分类。

    음성 대화 시스템에서 답변 문장 생성 방법 및 장치
    33.
    发明公开
    음성 대화 시스템에서 답변 문장 생성 방법 및 장치 失效
    在对话系统中产生响应声音的方法和装置

    公开(公告)号:KR1020070058953A

    公开(公告)日:2007-06-11

    申请号:KR1020060060365

    申请日:2006-06-30

    Abstract: A method and an apparatus for generating a response message in a speech dialogue system are provided to modify a search result to a natural expression for a user when the search result is provided to the user. An explanation file information database is constructed. When information on a response to a user's inquiry does not exist in a user information database(S408), an information search request message is transmitted to an information search server(S418). When a search result received from the information search service is a nominal form(S412), vocabularies included in the search result are integrated into vocabulary and it is determined whether the integrated vocabulary exists in the explanation file information database. When the integrated vocabulary does not exist in the explanation file information database, the integrated vocabulary is split into vocabularies based on spacing wards. It is determined whether the split vocabularies exist in the explanation file information database. When the split vocabularies exist in the explanation file information database, a response message is generated using explanations respectively corresponding to the vocabularies(S414).

    Abstract translation: 提供了一种用于在语音对话系统中生成响应消息的方法和装置,用于当将搜索结果提供给用户时将搜索结果修改为用户的自然表达。 构建说明文件信息数据库。 当在用户信息数据库中不存在关于用户询问的响应的信息时(S408),信息搜索请求消息被发送到信息搜索服务器(S418)。 当从信息搜索服务接收的搜索结果是标称形式(S412)时,包括在搜索结果中的词汇被集成到词汇中,并且确定综合词汇是否存在于说明文件信息数据库中。 当解释文件信息数据库中不存在综合词汇时,基于间隔区将综合词汇表分割成词汇。 确定解释文件信息数据库中是否存在拆分词汇。 当分解词汇存在于说明文件信息数据库中时,使用分别对应于词汇的说明来生成响应消息(S414)。

    어절 엔-그램을 이용한 띄어쓰기와 철자 교정장치 및 방법
    34.
    发明授权
    어절 엔-그램을 이용한 띄어쓰기와 철자 교정장치 및 방법 失效
    用于通过形成用于语言词汇的N-GRAM语言模型来检查使用N语言词汇的间隔/语音的装置和方法

    公开(公告)号:KR100509917B1

    公开(公告)日:2005-08-25

    申请号:KR1020030023563

    申请日:2003-04-15

    Inventor: 김정세 김상훈

    Abstract: 본 발명은 어절 엔-그램(n-gram)을 이용한 띄어쓰기와 철자 교정장치 및 방법에 관한 것으로, 어절 n-gram을 저장하는 어절 n-gram DB; 정제되어 오류가 없는 언어 자료를 입력받아 어절 n-gram을 추출하고, 추출된 어절 n-gram을 어절 n-gram DB에 저장하는 어절 n-gram 구축부; 검증해야 할 대상 언어 자료를 제공받아 언어 자료에 포함된 각 어절을 하나의 심볼로 매핑 처리한 구조로 변경하며, 변경된 어절에 대하여 어절 n-gram DB를 검색하여 동일한 어절이 존재하는지를 검색하는 어절 n-gram 검색 및 검증부; 어절 n-gram 검색 및 검증부에 의해 검증이 되지 않은 어절에 대하여 띄어쓰기와 붙여쓰기 오류 및 오타를 수정하는 띄어쓰기 및 붙여쓰기 오류/오타 수정부; 띄어쓰기 및 붙여쓰기 오류/오타 수정부에 의해 수정된 어절에 대하여 형태소 태깅을 수행하여 확률값이 제일 높은 값을 선택하여 적용하는 통계 기반 품사 태깅 시스템; 대상 언어 자료에 대하여 띄어쓰기 및 붙여쓰기 오류/오타 수정부 및 통계 기반 품사 태깅 시스템에 의해 처리되는 과정을 거치면서 수정이 완료된 대상 언어 자료를 출력하는 수정 문장 출력부를 구비한다. 따라서, 입력된 대상 언어 자료에 대하여 띄어쓰기 오류와 철자 오류를 자동으로 정정할 수 있는 효과가 있다.

    음성인식기를 이용한 자막 입력장치 및 그 방법과 그 기록매체
    35.
    发明公开
    음성인식기를 이용한 자막 입력장치 및 그 방법과 그 기록매체 有权
    使用语音识别装置输入字幕的系统和方法

    公开(公告)号:KR1020020048612A

    公开(公告)日:2002-06-24

    申请号:KR1020000077824

    申请日:2000-12-18

    CPC classification number: G10L15/265 G10L17/14 H04N7/035

    Abstract: PURPOSE: A system and a method for inputting subtitle using a voice recognition device are provided to input subtitle in live broadcasting program through a voice recognition device and a stenographer. CONSTITUTION: A system for inputting subtitle using a voice recognition device includes a voice classification unit(120), a voice recognition unit(130), a subject classification unit(140), a subtitle inputting and correcting unit(150), and a character data transmitter(160). The voice classification unit analyzes frequency components of voice signals output from a TV voice output unit(110) to classify voices. The voice recognition unit recognizes the voice signals to extract character data and calculates the reliability of the character data. The subtitle classification unit extracts a key word using the character data to classify subjects. The subtitle inputting and correcting unit outputs the character data and its reliability, voice classification information and subject information and receives corrected information according to the output data and information to output character data. The character data transmitter receives the corrected character data and transmits the data to a broadcasting server.

    Abstract translation: 目的:提供使用语音识别装置输入字幕的系统和方法,以通过语音识别装置和速记员输入现场直播节目中的字幕。 构成:使用语音识别装置输入字幕的系统包括语音分类单元(120),语音识别单元(130),主题分类单元(140),字幕输入和校正单元(150)以及字符 数据发射机(160)。 语音分类单元分析从电视语音输出单元(110)输出的语音信号的频率分量以分类语音。 语音识别单元识别语音信号以提取字符数据并计算字符数据的可靠性。 字幕分类单元使用字符数据提取关键字以对被摄体进行分类。 字幕输入和校正单元输出字符数据及其可靠性,语音分类信息和对象信息,并根据输出数据和信息接收校正信息以输出字符数据。 字符数据发送器接收经校正的字符数据并将数据发送到广播服务器。

    동적 정보검색을 위한 자료의 색인장치 및 그 방법
    36.
    发明公开
    동적 정보검색을 위한 자료의 색인장치 및 그 방법 失效
    用于动态信息检索的索引设备和数据检索方法

    公开(公告)号:KR1019970002712A

    公开(公告)日:1997-01-28

    申请号:KR1019950017178

    申请日:1995-06-23

    Inventor: 김정세 강현규

    Abstract: 본 발명은 동적 정보검색 색인방법에 관한 것으로서, 소정 단어가 선택될 때 해당 단어의 설명이 나타나게 사용자에게 밝게 보이도록 RAW TEXT 화일에서 표제어들을 마크하는 하이퍼 텍스트 색인 과정과, 상기 RAW TEXT 화일을 입력으로 받아서 키워드 사전을 만들고 역색인 화일의 구조로 키워드 인덱스 화일을 자동으로 만드는 자연어 색인 과정을 구비한다.
    따라서, 정보들을 컴퓨터에 저장하고 이를 효과적이고 효율적으로 관리할 수 있어 변화하는 데이타에 따른 최신의 정보를 빠른 시간내에 서비스 할 수 있으며, 또한, 정보를 관리하는 정보 검색의 다양한 분야에 효과적으로 활용할 수 있다.

    원시 발화자의 목소리와 유사한 특성을 갖는 합성음을 생성하는 자동 통역 시스템 및 그 동작 방법
    37.
    发明公开
    원시 발화자의 목소리와 유사한 특성을 갖는 합성음을 생성하는 자동 통역 시스템 및 그 동작 방법 审中-实审
    一种自动解释系统,用于生成具有类似于母语者的特征的合成语音及其操作方法

    公开(公告)号:KR1020170103209A

    公开(公告)日:2017-09-13

    申请号:KR1020160025685

    申请日:2016-03-03

    Abstract: 본발명은원시발화자의목소리와유사한특성을갖는합성음을생성하는자동통역시스템및 그동작방법에관한것으로서, 본발명의실시예에따른원시발화자의목소리와유사한특성을갖는합성음을생성하는자동통역시스템은원시발화자의원시음성신호에대한음성인식을수행하여텍스트데이터를생성하고, 상기원시음성에대한음높이(Pitch) 정보, 발성강도(Intensity) 정보, 발화속도(Speed) 정보및 성도(Vocal Tract) 특징정보중 적어도하나의특성정보를추출하는음성인식모듈, 상기텍스트데이터를번역하여합성대상번역문을생성하는자동번역모듈, 및상기합성대상번역문에대한합성음을생성하는음성합성모듈을포함한다.

    Abstract translation: 本发明涉及一种同声翻译系统,并产生具有相似性质的作为原料讲话者的声音,用于产生具有根据本发明的一个实施例相似的特性作为原料讲话者声音的合成声音同声翻译系统的合成声音及其操作方法 并且对于在原始语音执行期间eunwon音频信号产生文本数据的城市讲话者诊所语音识别,并且间距(间距)信息,语音强度(强度)的信息,发声速度(速度)的信息和成都(发音通道) 功能包括语音识别模块,自动翻译模块,以及用于生成合成语音的合成目标翻译翻译的文本数据,生成合成目标翻译中提取的至少一个属性的信息的信息的语音合成模块。

    음성인식을 위한 언어모델 생성 장치 및 방법
    38.
    发明授权
    음성인식을 위한 언어모델 생성 장치 및 방법 有权
    用于语音识别的语言模型生成装置和方法

    公开(公告)号:KR101747873B1

    公开(公告)日:2017-06-27

    申请号:KR1020130109428

    申请日:2013-09-12

    Inventor: 김정세 김상훈

    CPC classification number: G10L15/183 G10L13/10

    Abstract: 음성인식을위한언어모델생성장치및 방법을공개한다. 본발명은음성인식을위해미리수집된복수개의문장이저장된문장코퍼스, 문장코퍼스로부터복수개의문장중 적어도하나의문장을획득하고, 획득된문장을기설정된인식단위로구분하는인식단위구분부, 인식단위로구분된문장의구문을분석하는구문분석부, 음성합성을위해기설정된끊어읽기규칙을기초로설정되는끊어읽기규칙이기저장된끊어읽기규칙데이터베이스, 구문분석부에의해분석된구문을이용하여복수개의끊어읽기규칙중 대응하는끊어읽기규칙을검색하여획득하고, 획득된끊어읽기규칙에따라인식단위로구분된문장에기설정된끊어읽기표시를삽입하는끊어어읽기삽입부, 언어모델이저장되는언어모델데이터베이스, 및끊어읽기삽입부에서끊어읽기표시가삽입된문장을수신하여기설정된방식으로언어모델로생성하여언어모델데이터베이스에저장하는언어모델생성부를포함한다.

    Abstract translation: 公开了一种用于生成用于语音识别的语言模型的设备和方法。 本发明获得多个从所述存储的多个之前收集的用于语音识别的文本语料库,文本语料库句子的句子中的至少一个句子,以及在所设定的识别单元所获得的句组分开识别单元分割部,识别 多使用由单元语法分析单元分离,用于语音合成的句子的基础断开保存丢失读取被中断阅读规则的基础上设置的规则解析设置阅读规则的数据库,通过解析单元解析 并且存储语言模型的语言,其中语言模型以存储语言模型的语言存储, 模型并存储在数据库中,并通过创建在读入基于插入部语言模型断语言模型数据库设置如何读取显示器接收在插入语句符 语言模型包括创造财富。

    음성인식을 위한 언어모델 생성 장치 및 방법
    39.
    发明公开
    음성인식을 위한 언어모델 생성 장치 및 방법 有权
    装置和建立语音识别语言模型

    公开(公告)号:KR1020150030337A

    公开(公告)日:2015-03-20

    申请号:KR1020130109428

    申请日:2013-09-12

    Inventor: 김정세 김상훈

    CPC classification number: G10L15/183 G10L13/10 G10L15/26

    Abstract: 음성인식을 위한 언어모델 생성 장치 및 방법을 공개한다. 본 발명은 음성 인식을 위해 미리 수집된 복수개의 문장이 저장된 문장 코퍼스, 문장 코퍼스로부터 복수개의 문장 중 적어도 하나의 문장을 획득하고, 획득된 문장을 기설정된 인식 단위로 구분하는 인식단위 구분부, 인식단위로 구분된 문장의 구문을 분석하는 구문 분석부, 음성 합성을 위해 기설정된 끊어읽기 규칙을 기초로 설정되는 끊어읽기 규칙이 기저장된 끊어읽기 규칙 데이터베이스, 구문 분석부에 의해 분석된 구문을 이용하여 복수개의 끊어읽기 규칙 중 대응하는 끊어읽기 규칙을 검색하여 획득하고, 획득된 끊어읽기 규칙에 따라 인식단위로 구분된 문장에 기설정된 끊어읽기 표시를 삽입하는 끊어어읽기 삽입부, 언어모델이 저장되는 언어모델 데이터베이스, 및 끊어읽기 삽입부에서 끊어읽기 표시가 삽입된 문장을 수신하여 기설정된 � ��식으로 언어모델로 생성하여 언어모델 데이터베이스에 저장하는 언어모델 생성부를 포함한다.

    Abstract translation: 公开了一种用于语音识别的语言模型生成装置及其方法。 本发明包括:句子语料库,其中存储有用于语音识别的预先收集的多个句子; 识别单元分类单元,从句子语料库中获取句子中的至少一个句子,并用预定的识别单元对获得的句子进行分类; 构造分析单元,分析用识别单元分类的句子的构造; 标点读取规则数据库,其中预先存储基于用于语音合成的预定标点符号读取规则设置的标点符号读取规则; 标点读取插入单元,通过使用由构造分析单元分析的构造来搜索并获得与多个标点符号读取规则相对应的标点读取规则,并将预定的标点符号读取标记插入到根据识别单元分类的句子中 获得标点阅读规则; 语言模型数据库,其中存储语言模型; 以及语言模型生成单元,其通过从标点符号读取插入单元接收插入有标点符号的标记的句子,通过预定方法生成语言模型,并将语言模型存储在语言模型数据库中。

    유사문장 검색장치 및 그 검색방법
    40.
    发明授权
    유사문장 검색장치 및 그 검색방법 有权
    搜索类似句子的装置和方法

    公开(公告)号:KR101414492B1

    公开(公告)日:2014-07-04

    申请号:KR1020110060206

    申请日:2011-06-21

    Abstract: 유사문장 검색장치 및 그 검색방법이 개시된다. 본 발명의 실시예에 따른 유사문장 검색장치는, 사용자로부터 문장을 입력받는 입력부; 말뭉치를 데이터베이스로 저장하는 말뭉치 데이터베이스부; 입력부를 통해 입력된 문장에 대하여 유사도 계산을 위한 언어처리를 수행하는 언어 처리부; 말뭉치 데이터베이스부에 저장된 후보 말뭉치들에 대해 언어 처리부에 의해 언어처리된 문장과의 유사도를 검색하여 유사도가 일정값 이상인 문장을 추출하는 유사도 검색부; 및 유사도 검색부에 의해 추출된 문장이 다수인 경우, 추출된 문장들의 순위를 결정하는 순위 결정부를 포함하는 것을 특징으로 한다.

Patent Agency Ranking