Abstract:
본 발명은 병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법에 관한 것으로, 각 단어별 특징 벡터를 구성하는데 있어 대역어 뭉치를 이용함으로써 자동 추출되는 유사어(대체어)의 품질을 향상시키는 병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법에 관한 것이다. 대체어 자동 추출을 위한 문장을 수집하여 저장하는 문장 저장 DB(11)를 포함하는 문장 수집 모듈(10)과; 상기 문장 수집 모듈(10)의 데이터를 정제하고 색인어를 추출하는 전처리 모듈(20)과; 상기 전처리 모듈(20)에서 색인된 단어의 동시 출현 빈도를 계산하여 대역어 뭉치와 연관단어 뭉치를 추출하는 단어 간 상관성 분석 모듈(30)과; 상기 단어 간 상관성 분석 모듈(30)에서 계산된 대역어 뭉치가 저장되는 대역어 뭉치 DB(40)와; 상기 단어 간 상관성 분석 모듈(30)에서 계산된 연관단어 뭉치가 저장되는 연관단어 뭉치 DB(50)와; 상기 대역어 뭉치 DB(40) 및 연관단어 뭉치 DB(50)에서 최종 대체어를 추출하여 저장하는 대체어 DB(60)로 구성된다. 따라서, 본 발명은 단어 간의 대체 관계(유의어, 동의어, 이형어, 대역어 포함)를 병렬말뭉치로부터 자동으로 추출함으로써 수작업에 의한 대체어 사전 구축에 필요한 시간과 노력을 최소화할 수 있고, 수작업시 누락될 수 있는 대체 관계까지 추출 가능한 효과가 있다.
Abstract:
본 발명은 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법에 관한 것으로, 다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기(10)와, 상기 상품평 데이터베이스에서 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기(20)와, 상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기(30)와, 상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기(40)와, 상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 사전를 구축하는 공통 사전 구축기(50)와, 상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기(60)로 구성된다. 따라서, 본 발명은 서술어의 긍정 및 부정적인 성향을 자동으로 분류함으로써, 수작업으로 긍정 및 부정 사전을 구축할 때보다 시간과 노력을 최소화시키고, 수작업시 누락될 수 있는 서술어를 실제 데이터를 분석하여 추출할 수 있는 효과가 있다.
Abstract:
본 발명은 다중 사용자를 위한 콘텐츠 추천 방법에 관한 것으로, 보다 자세하게는 단일 사용자만이 콘텐츠를 사용하는 환경뿐만 아니라 다중 사용자가 콘텐츠를 공동으로 사용하는 환경에서도 단일 및 다중 사용자들의 선호 경향을 분석하여 다중 사용자에게 적합한 콘텐츠를 추천할 수 있는 방법에 관한 것이다. 본 발명의 다중 사용자를 위한 콘텐츠 추천 방법은 다중 사용자가 함께 사용한 콘텐츠의 이력이 있다면 이를 이용하여 학습된 다중 사용자 선호 모델에 각 멤버의 개인 사용자 선호 모델을 반영하여 콘텐츠의 추천 정확도를 향상시키고, 함께 사용한 콘텐츠의 이력이 없는 경우 각 멤버의 개인 모델을 이용하여 함께 사용할 콘텐츠에 대한 선호도를 예측하여 추천된 콘텐츠 리스트를 제공하는 방법이다. 다중 사용자, 선호도, 선호도 모델, 콘텐츠, 추천, 코사인 유사도
Abstract:
PURPOSE: A content recommending method using menu preference information is provided to recommend content based on a menu preference and to extract personal preferences by using menu information and using history information. CONSTITUTION: A learning engine extracts menu preference information, popular content, and relation menu by using content watching history information and menu information for using content. The learning engine stores the extracted information in a database(S100). A recommendation engine provides a recommendation list by using content meta data and data stored in the learning engine according to the recommending request of a user(S200).
Abstract:
PURPOSE: An automatic replacement word extracting system and method thereof are provided to minimize the time and effort required for the construction of a replacement word dictionary. CONSTITUTION: A sentence collecting module(10) collects and stores a sentence for automatic replacement word extraction. A preprocessing module(20) refines the data of the sentence collecting module and extracts an index. A word relation analyzing module(30) extracts the replacement corpus and the related corpus. A translation corpus database(40) stores the replacement corpus. A related word corpus database(50) stores the related corpus. A replacement word database(60) extracts the replacement word from the translation corpus database.
Abstract:
PURPOSE: An association analysis method for music recommendation is provided to enhance the entire recommendation performance by combining a history-based cooperative recommendation technique with an improved content-based recommendation technique. CONSTITUTION: The association between contents in accordance with each preference-related element is extracted, and history-based association is extracted. A content-based association is calculated by calculating the weight value between the two kinds of contents in accordance with each reference-related element. The history-based association is combined with the contents-based association in order to generate an association graph. The association graph is used to recommend music, and purchase history-based association is combined with the contents-based association in order to the association between the two kinds of contents.
Abstract:
본 발명은 다중 사용자를 위한 콘텐츠 추천 방법에 관한 것으로, 보다 자세하게는 단일 사용자만이 콘텐츠를 사용하는 환경뿐만 아니라 다중 사용자가 콘텐츠를 공동으로 사용하는 환경에서도 단일 및 다중 사용자들의 선호 경향을 분석하여 다중 사용자에게 적합한 콘텐츠를 추천할 수 있는 방법에 관한 것이다. 본 발명의 다중 사용자를 위한 콘텐츠 추천 방법은 다중 사용자가 함께 사용한 콘텐츠의 이력이 있다면 이를 이용하여 학습된 다중 사용자 선호 모델에 각 멤버의 개인 사용자 선호 모델을 반영하여 콘텐츠의 추천 정확도를 향상시키고, 함께 사용한 콘텐츠의 이력이 없는 경우 각 멤버의 개인 모델을 이용하여 함께 사용할 콘텐츠에 대한 선호도를 예측하여 추천된 콘텐츠 리스트를 제공하는 방법이다. 다중 사용자, 선호도, 선호도 모델, 콘텐츠, 추천, 코사인 유사도
Abstract:
A relative cluster assessment method is provided to measure inter-cluster combination degree more efficiently by using reliability range of each variable at neighbor search of inter-cluster combination degree assessment. A relative cluster assessment method comprises the following several steps. A data average, a standard deviation and the number of data are extracted with respect to an arbitrary cluster. Reliability range is extracted by using the extraction result. All the neighbor data are searched with specific data in the reliability range. Inter-cluster combination degree with respect to at least one cluster is assessed by using the search result.
Abstract:
A method for extracting a related keyword group is provided to enhance importance of keywords existing at plural documents of the same site group, to analyze how many site group related keyword candidates appear at, and to analyze relationship between a specific keyword and related keyword candidates. A method for extracting a related keyword group comprises the following several steps. A site group is formed by grouping sites searched via a specific keyword(S111,S112). Important keywords are extracted from the site group and related keyword candidates are generated by using modified TFIDF(Term Frequency Inverse Document Frequency) which enhances the importance of the keyword appearing at documents of the same site group and reduces the importance of the keyword appearing at various site groups(S113-S118). Relationship between the related keyword candidates and the specific keyword is analyzed by using a modified relation rule to which concentration rate and reliability are applied wherein the concentration rate means how frequently the related keyword candidates appear at the same site group and the reliability means how frequently the related keyword candidates appear at various site groups(S119). Relationship between the related keyword candidates and the specific keyword is analyzed by using Cosine similarity for analyzing content similarity among site groups(S120). Related keyword groups are extracted by intersecting the related keyword candidates analyzed via the modified relation rule with those analyzed via the Cosine similarity(S121,S122).