-
公开(公告)号:KR101120040B1
公开(公告)日:2012-03-23
申请号:KR1020080127490
申请日:2008-12-15
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 검색엔진에서 연관 질의어를 추천하는 장치 및 방법에 있어서, 기존 검색 엔진의 클릭 로그를 이용하여 질의어와 선택된 URL의 관계성을 수치화하여 제시하고, 클릭 로그에 남겨진 시간 정보와 선택된 URL 문서에 대한 분류 정보 등을 이용하여 사용자에 의해 입력된 초기 질의어와 연관성을 가지는 연관 질의어를 카테고리별로 그룹핑하는 방식으로 초기 질의어와 연관 관계가 높은 다양한 연관 질의어를 제시함으로써 사용자가 원하는 정보를 쉽게 찾을 수 있도록 하며, 또한 URL이 선택된 시간 정보를 반영하여 최근의 정보 경향을 반영할 수 있도록 한다.
검색, 질의어, 클릭 로그, 그룹핑, 연관성-
公开(公告)号:KR1020100068531A
公开(公告)日:2010-06-24
申请号:KR1020080126925
申请日:2008-12-15
Applicant: 한국전자통신연구원
IPC: G06Q30/02
CPC classification number: G06Q30/02 , G06Q30/0251 , G06Q30/0254
Abstract: PURPOSE: An online advertisement selecting device of the contents sensibility and intensive analysis base and a method thereof are provided to filter the advertisement or replace the advertisement seen to user. CONSTITUTION: A sensibility information analyzing unit(108) analyzes the sensibility object and the sensitivity information variously described in the contents on the analyzed context. An intention grasping unit(110) grasps the preparation intention of the contents. An advertisement selecting unit excludes the advertisement selected by the contents based on the analyzed context, the sensibility result, and the preparation intention. The advertisement selection unit selects replacing advertisement.
Abstract translation: 目的:提供内容敏感性和密集型分析基础的在线广告选择装置及其方法,以过滤广告或替换用户所看到的广告。 构成:灵敏度信息分析单元(108)分析在所分析的上下文中的内容中各种描述的感觉对象和灵敏度信息。 意图抓取单元(110)掌握内容的准备意图。 广告选择单元基于所分析的上下文,感觉结果和准备意图来排除由内容选择的广告。 广告选择单元选择替换广告。
-
公开(公告)号:KR1020090108530A
公开(公告)日:2009-10-15
申请号:KR1020090023569
申请日:2009-03-19
Applicant: 한국전자통신연구원
CPC classification number: G06F17/21 , G06F17/275 , G06F17/30705
Abstract: PURPOSE: An apparatus and a method of a hierarchical document taxonomy for an intelligent information service are provided to show accurate classification result and systematize large amount of document set for management. CONSTITUTION: An apparatus of a hierarchical document taxonomy for an intelligent information service includes a document pre-pressing unit(110), a language analysis unit(120), a document classification unit(140) and a representative language selection unit(150). The document pre-pressing unit corrects a target document to enable a language analysis, and the language analysis unit performs a language analysis by word and sentence in the corrected target document. The document classification unit allocates the subject of the target document hierarchically, and the representative selection unit selects a keyword that represents the contents of a reconfigured document.
Abstract translation: 目的:提供智能信息服务层次化文档分类的设备和方法,以显示准确的分类结果,并将大量的文档集进行系统化管理。 构成:用于智能信息服务的分层文档分类装置包括文件预压单元(110),语言分析单元(120),文档分类单元(140)和代表语言选择单元(150)。 文档预压单元校正目标文档以启用语言分析,并且语言分析单元通过修正的目标文档中的单词和句子进行语言分析。 文档分类单元分级地分配目标文档的主题,并且代表选择单元选择表示重新配置的文档的内容的关键字。
-
公开(公告)号:KR100918842B1
公开(公告)日:2009-09-28
申请号:KR1020070130721
申请日:2007-12-14
Applicant: 한국전자통신연구원
Abstract: 본 발명에 따른 대용어 참조해결 방법은, 입력된 문자열을 분석하여 문자열에 포함된 대용어를 인식하는 대용어 인식단계; 대용어의 전체의미를 분석하는 의미 분석 단계; 문자열을 청킹(chunking)한 뒤 각각의 청크에 하나의 개념을 배정하고, 개념과 전체의미를 비교분석하여 대용어가 가리킬 수 있는 대상 후보들을 선정하는 대상 후보 선정단계; 대상 후보들을 순위화(ranking)하여 대용어 복원에 사용될 참조 대상을 선정하고, 참조 대상을 이용하여 대용어를 복원하는 대용어 복원단계를 포함한다. 이와 같은 구성에 의하여, 자연어 문장의 이해가 필요한 다양한 응용분야에서 효과적으로 활용될 수 있으며 길고 복잡한 문장에서 높은 정확도로 대용어를 복원할 수 있는데 그 효과가 있다.
-
公开(公告)号:KR100908445B1
公开(公告)日:2009-07-21
申请号:KR1020070066452
申请日:2007-07-03
Applicant: 한국전자통신연구원
Abstract: 본 발명은 응답 문장 생성 장치 및 방법에 관한 것으로, 음성 인식된 문장에 대한 정확한 키 워드를 추출하여 응답 문장을 생성하는 장치 및 방법을 제공하는 데 있다. 이를 위하여, 본 발명에 따른 응답 문장 생성 방법은, 음성 인식된 문장을 형태소 분석하는 단계; 상기 문장으로부터 1차 개념열 추출을 수행하는 단계; 상기 추출된 1차 개념열을 기반으로 상기 문장에 대한 1차 의미 분석을 수행하는 단계; 상기 1차 개념열 추출 단계에서 추출되지 않은 개념열을 더 추출하기 위하여, 상기 1차 의미 분석 결과를 기반으로 상기 문장으로부터 상기 1차 개념열을 포함하는 2차 개념열 추출을 수행하는 단계; 상기 추출된 2차 개념열을 기반으로 상기 문장에 대하여 2차 의미 분석을 수행함으로써 상기 음성 인식된 문장에 대한 의미 분석 결과를 생성하는 단계; 및 상기 생성된 의미 분석 결과를 기반으로 상기 음성 인식된 문장에 대한 응답 문장을 생성하는 단계를 포함한다. 즉 음성 인식된 문장에 대하여 2차 개념열/대용어 추출 및 2차 의미 분석을 수행함으로써 음성 인식된 문장에 대하여 정확한 의미 분석을 할 수 있는 이점이 있다.
응답 문장, 의미 분석Abstract translation: 提供一种用于产生响应句子的设备和方法,以通过对语音识别语句执行第二句子/替代提取和第二含义分析来执行对语音识别句子的精确含义分析。 一种响应语句生成方法,包括以下步骤:对语音识别语句进行语素分析(200,210); 从句子(220)中提取第一句子句子; 基于提取的第一句子句子执行句子的第一含义分析(230); 为了进一步提取在上述第二步骤(240)中未提取的句子的点,基于第一含义分析结果从句子中提取包括第一句子句子的第二句子句子; 通过基于所提取的第二句子句子(250)执行句子的第二含义分析来生成所述语音识别句子的含义分析结果; 并且基于所生成的含义分析结果(260)来生成对语音识别语句的响应句子。
-
公开(公告)号:KR1020090061525A
公开(公告)日:2009-06-16
申请号:KR1020070128556
申请日:2007-12-11
Applicant: 한국전자통신연구원
IPC: G06F17/21
CPC classification number: G06F17/2247 , G06F17/218 , G06F17/272 , G06N5/025
Abstract: A method for extracting the structural information of a web document and a system thereof are provided to extract the attributes of a corresponding web site automatically although the learning is performed by tagging a small amount of data in the web site. By learning a web document, in which attributes are manually tagged and which is collected from a web site to be extracted, an attribute learning processing device(100) generates a studying model. An attribute extraction processing device(200) extracts attributes from an original web document. A boundary recognition studying model database(300) provides a database of a boundary recognition studying model among the studying models to the attribute extraction processing device. An attribute recognition studying model database(302) provides a database of the attribute recognition studying model among the studying models to the attribute extraction processing device.
Abstract translation: 提供用于提取web文档的结构信息的方法及其系统,以自动提取相应网站的属性,尽管通过在网站中标记少量数据来执行学习。 属性学习处理装置(100)通过学习一种web文档,其中属性被手动标记,并且从被提取的网站中收集属性,生成学习模型。 属性提取处理装置(200)从原始web文档中提取属性。 边界识别研究模型数据库(300)为属性提取处理装置的学习模型提供了边界识别学习模型的数据库。 属性识别研究模型数据库(302)在属性提取处理装置的研究模型中提供属性识别研究模型的数据库。
-
公开(公告)号:KR1020090028908A
公开(公告)日:2009-03-20
申请号:KR1020070094047
申请日:2007-09-17
Applicant: 한국전자통신연구원
Abstract: A voice conversation analysis system and a method thereof are provided to obtain the high accuracy and fast processing speed by restoring the abbreviation and substitute based on the general dialogue analysis. A character string and voice signal are inputted to a user input unit(100) from a user. A voice recognition circuit(110) analyzes the voice signal which is inputted from the user input unit, and then converts the analyzed voice signal into a character string having the same content. Data outputted from the voice recognition circuit are inputted to a language analysis part(120), and then performs the morpheme analysis, speech act analysis and concept recognition by referring to data of a storage unit(160).
Abstract translation: 提供语音会话分析系统及其方法,以通过基于一般对话分析恢复缩写和替换来获得高精度和快速的处理速度。 字符串和语音信号从用户输入到用户输入单元(100)。 语音识别电路(110)分析从用户输入单元输入的语音信号,然后将所分析的语音信号转换成具有相同内容的字符串。 从语音识别电路输出的数据被输入到语言分析部(120),然后参照存储部(160)的数据进行语素分析,语音动作分析,概念识别。
-
公开(公告)号:KR1020090003090A
公开(公告)日:2009-01-09
申请号:KR1020070096013
申请日:2007-09-20
Applicant: 한국전자통신연구원
IPC: G06F17/30
CPC classification number: G06F17/30734 , G06F17/30719
Abstract: A document summarizing method and apparatus are provided to extract words, concepts of the words and attributes of the words from language resources and convert the words, concepts and attributes into RDF(Resource Description Framework) format to automatically control ontology. A document summarizing method includes a step of automatically constructing ontology from language resources, a step(610) of analyzing morpheme of an inputted document to extract nouns, a step(620) of extracting domains of the extracted nouns from the ontology, and a step(660) of generating a document summary composed of the extracted domains.
Abstract translation: 提供了一种文档总结方法和装置,用于从语言资源中提取单词,单词和属性的单词和属性,并将单词,概念和属性转换为RDF(资源描述框架)格式以自动控制本体。 文档总结方法包括从语言资源自动构建本体的步骤,分析输入文档的语素以提取名词的步骤(610),从本体提取提取的名词的域的步骤(620),以及步骤 (660)生成由提取的域组成的文档摘要。
-
公开(公告)号:KR1020080052279A
公开(公告)日:2008-06-11
申请号:KR1020070074287
申请日:2007-07-25
Applicant: 한국전자통신연구원
IPC: H04N21/43 , H04N21/2343
Abstract: An interactive TV agency service method for providing real-life information and an apparatus therefor are provided to acquire real-life information updated on a web in real time and expand the acquired information to various region when necessary by performing operation for which a user wishes through an interactive interface including a voice, a remote controller, and a text input and providing a corresponding suitable response. A dialogue sentence analyzing unit(20) analyzes an input sentence received from a user. A dialogue management unit(30) analyzes the request of the user by using the analyzed result of the dialogue sentence analyzing unit. When a real-time information update is requested from the dialogue management unit, a real-time automatic knowledge constructing unit(70) extracts daily life information updated on a web in real time and stores the extracted information in a daily information database. A response generating unit(40) generates a response for the request of the user analyzed in the dialogue management unit and provides the response to the user. When it is impossible to respond to the request of the user or an error is generated in the response for the request of the user, an exception processing unit(80) recovers a system to allow the user to cancel the request of the user.
Abstract translation: 提供用于提供现实生活信息的交互式电视机构服务方法及其装置,用于获取在网络上实时更新的现实生活信息,并且在必要时通过执行用户期望的操作将获取的信息扩展到各个区域 包括语音,遥控器和文本输入的交互式界面,并提供对应的合适响应。 对话句分析单元(20)分析从用户接收的输入语句。 对话管理单元(30)通过使用对话句分析单元的分析结果来分析用户的请求。 当从对话管理单元请求实时信息更新时,实时自动知识构建单元(70)实时地提取在web上更新的日常生活信息,并将提取的信息存储在日常信息数据库中。 响应生成单元(40)生成对话管理单元中分析的用户的请求的响应,并向用户提供响应。 当不可能响应于用户的请求或在针对用户的请求的响应中产生错误时,异常处理单元(80)恢复系统以允许用户取消用户的请求。
-
公开(公告)号:KR100834536B1
公开(公告)日:2008-06-02
申请号:KR1020060094545
申请日:2006-09-28
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 검색어 및 그룹별 표시 유형을 입력 받는 단계, 입력 받은 검색어에 상응하여 검색 정보를 출력하는 단계, 출력된 검색 정보를 온톨로지(Ontology)에 기반을 두어 적어도 하나의 그룹별 표시 유형으로 그룹화하는 단계 및 그룹화된 정보를 표시하는 단계를 포함하는 온톨로지(Ontology) 기반의 정보 표시 방법을 제공할 수 있다.
온톨로지(Ontology), 정보 표시
-
-
-
-
-
-
-
-
-