병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법
    61.
    发明授权
    병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법 有权
    使用并行语料库自动提取替代词的系统和方法

    公开(公告)号:KR101137010B1

    公开(公告)日:2012-04-19

    申请号:KR1020100065674

    申请日:2010-07-08

    Inventor: 이수원 백종범

    Abstract: 본 발명은 병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법에 관한 것으로, 각 단어별 특징 벡터를 구성하는데 있어 대역어 뭉치를 이용함으로써 자동 추출되는 유사어(대체어)의 품질을 향상시키는 병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법에 관한 것이다. 대체어 자동 추출을 위한 문장을 수집하여 저장하는 문장 저장 DB(11)를 포함하는 문장 수집 모듈(10)과; 상기 문장 수집 모듈(10)의 데이터를 정제하고 색인어를 추출하는 전처리 모듈(20)과; 상기 전처리 모듈(20)에서 색인된 단어의 동시 출현 빈도를 계산하여 대역어 뭉치와 연관단어 뭉치를 추출하는 단어 간 상관성 분석 모듈(30)과; 상기 단어 간 상관성 분석 모듈(30)에서 계산된 대역어 뭉치가 저장되는 대역어 뭉치 DB(40)와; 상기 단어 간 상관성 분석 모듈(30)에서 계산된 연관단어 뭉치가 저장되는 연관단어 뭉치 DB(50)와; 상기 대역어 뭉치 DB(40) 및 연관단어 뭉치 DB(50)에서 최종 대체어를 추출하여 저장하는 대체어 DB(60)로 구성된다. 따라서, 본 발명은 단어 간의 대체 관계(유의어, 동의어, 이형어, 대역어 포함)를 병렬말뭉치로부터 자동으로 추출함으로써 수작업에 의한 대체어 사전 구축에 필요한 시간과 노력을 최소화할 수 있고, 수작업시 누락될 수 있는 대체 관계까지 추출 가능한 효과가 있다.

    상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법
    62.
    发明授权
    상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법 有权
    用于自动构建产品评论极性分类的正/负特征谓词词典的方法和系统

    公开(公告)号:KR101134701B1

    公开(公告)日:2012-04-13

    申请号:KR1020100076206

    申请日:2010-08-09

    Inventor: 이수원 송종석

    Abstract: 본 발명은 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법에 관한 것으로, 다양한 도메인에서 평점이 포함된 상품평을 수집하여 상품평 데이터베이스에 저장하는 상품평 수집기(10)와, 상기 상품평 데이터베이스에서 언급되는 주격 명사를 추출하여 제품 특징 데이터베이스에 저장하는 제품 특징 추출기(20)와, 상기 상품평 데이터베이스와 제품 특징 데이터베이스에서 품사 태깅과 제품 특징을 서술하는 서술어 정보를 태깅하는 품사 태깅기(30)와, 상기 상품평 데이터베이스에서 평점이 포함된 상품평 분석을 통해 평점 긍정 및 부정 사전 데이터베이스를 구축하는 평점 사전 구축기(40)와, 상기 평점 긍정 및 부정 사전 데이터베이스를 이용하여 다양한 도메인에서 공통적으로 활용할 수 있는 공통 긍정 및 부정 사전를 구축하는 공통 사전 구축기(50)와, 상기 공통 긍정 및 부정 사전과 접속부사 및 연결어미 정보와 제품 특징을 활용하여 도메인별로 서술어를 긍정 및 부정으로 분류하여 도메인 긍정 및 부정 사전을 구축하는 도메인 사전 구축기(60)로 구성된다. 따라서, 본 발명은 서술어의 긍정 및 부정적인 성향을 자동으로 분류함으로써, 수작업으로 긍정 및 부정 사전을 구축할 때보다 시간과 노력을 최소화시키고, 수작업시 누락될 수 있는 서술어를 실제 데이터를 분석하여 추출할 수 있는 효과가 있다.

    다중 사용자를 위한 콘텐츠 추천 방법
    63.
    发明授权
    다중 사용자를 위한 콘텐츠 추천 방법 有权
    多用户的内容推荐方法

    公开(公告)号:KR101130217B1

    公开(公告)日:2012-03-28

    申请号:KR1020070112461

    申请日:2007-11-06

    Inventor: 이수원 한정석

    Abstract: 본 발명은 다중 사용자를 위한 콘텐츠 추천 방법에 관한 것으로, 보다 자세하게는 단일 사용자만이 콘텐츠를 사용하는 환경뿐만 아니라 다중 사용자가 콘텐츠를 공동으로 사용하는 환경에서도 단일 및 다중 사용자들의 선호 경향을 분석하여 다중 사용자에게 적합한 콘텐츠를 추천할 수 있는 방법에 관한 것이다.
    본 발명의 다중 사용자를 위한 콘텐츠 추천 방법은 다중 사용자가 함께 사용한 콘텐츠의 이력이 있다면 이를 이용하여 학습된 다중 사용자 선호 모델에 각 멤버의 개인 사용자 선호 모델을 반영하여 콘텐츠의 추천 정확도를 향상시키고, 함께 사용한 콘텐츠의 이력이 없는 경우 각 멤버의 개인 모델을 이용하여 함께 사용할 콘텐츠에 대한 선호도를 예측하여 추천된 콘텐츠 리스트를 제공하는 방법이다.
    다중 사용자, 선호도, 선호도 모델, 콘텐츠, 추천, 코사인 유사도

    메뉴 선호 정보를 이용한 콘텐츠 추천 방법
    64.
    发明公开
    메뉴 선호 정보를 이용한 콘텐츠 추천 방법 有权
    使用菜单首选项的内容推荐方法

    公开(公告)号:KR1020120016723A

    公开(公告)日:2012-02-27

    申请号:KR1020100079122

    申请日:2010-08-17

    CPC classification number: G06Q50/10 G06F17/10 G06Q30/0254 G06Q30/0255

    Abstract: PURPOSE: A content recommending method using menu preference information is provided to recommend content based on a menu preference and to extract personal preferences by using menu information and using history information. CONSTITUTION: A learning engine extracts menu preference information, popular content, and relation menu by using content watching history information and menu information for using content. The learning engine stores the extracted information in a database(S100). A recommendation engine provides a recommendation list by using content meta data and data stored in the learning engine according to the recommending request of a user(S200).

    Abstract translation: 目的:提供使用菜单偏好信息的内容推荐方法,以基于菜单偏好来推荐内容,并通过使用菜单信息和使用历史信息来提取个人偏好。 构成:学习引擎通过使用内容观看历史信息和使用内容的菜单信息来提取菜单偏好信息,流行内容和关系菜单。 学习引擎将提取的信息存储在数据库中(S100)。 推荐引擎根据用户的推荐请求,通过使用存储在学习引擎中的内容元数据和数据来提供推荐列表(S200)。

    병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법
    65.
    发明公开
    병렬말뭉치를 이용한 대체어 자동 추출 시스템 및 방법 有权
    使用并行器自动提取替代词的系统和方法

    公开(公告)号:KR1020120005103A

    公开(公告)日:2012-01-16

    申请号:KR1020100065674

    申请日:2010-07-08

    Inventor: 이수원 백종범

    CPC classification number: G06F17/2795 G06F17/10

    Abstract: PURPOSE: An automatic replacement word extracting system and method thereof are provided to minimize the time and effort required for the construction of a replacement word dictionary. CONSTITUTION: A sentence collecting module(10) collects and stores a sentence for automatic replacement word extraction. A preprocessing module(20) refines the data of the sentence collecting module and extracts an index. A word relation analyzing module(30) extracts the replacement corpus and the related corpus. A translation corpus database(40) stores the replacement corpus. A related word corpus database(50) stores the related corpus. A replacement word database(60) extracts the replacement word from the translation corpus database.

    Abstract translation: 目的:提供一种自动替换字提取系统及其方法,以最小化构建替换词典所需的时间和精力。 构成:句子收集模块(10)收集并存储用于自动替换字提取的句子。 预处理模块(20)优化句子收集模块的数据并提取索引。 词关系分析模块(30)提取替换语料库和相关语料库。 翻译语料库数据库(40)存储替换语料库。 相关词语库数据库(50)存储相关语料库。 替换字数据库(60)从翻译语料库数据库中提取替换词。

    음악 추천을 위한 연관성 분석 방법
    66.
    发明公开
    음악 추천을 위한 연관성 분석 방법 无效
    音乐推荐协会分析方法

    公开(公告)号:KR1020110043369A

    公开(公告)日:2011-04-27

    申请号:KR1020090100455

    申请日:2009-10-21

    Inventor: 이수원 이승화

    CPC classification number: G06Q50/10

    Abstract: PURPOSE: An association analysis method for music recommendation is provided to enhance the entire recommendation performance by combining a history-based cooperative recommendation technique with an improved content-based recommendation technique. CONSTITUTION: The association between contents in accordance with each preference-related element is extracted, and history-based association is extracted. A content-based association is calculated by calculating the weight value between the two kinds of contents in accordance with each reference-related element. The history-based association is combined with the contents-based association in order to generate an association graph. The association graph is used to recommend music, and purchase history-based association is combined with the contents-based association in order to the association between the two kinds of contents.

    Abstract translation: 目的:提供音乐推荐的关联分析方法,通过将基于历史的合作推荐技术与改进的基于内容的推荐技术结合起来,提升整个推荐性能。 构成:提取根据每个偏好相关元素的内容之间的关联,并提取基于历史的关联。 通过根据每个参考相关元素计算两种内容之间的权重值来计算基于内容的关联。 基于历史的关联与基于内容的关联相结合以便生成关联图。 关联图用于推荐音乐,并且购买基于历史的关联与基于内容的关联相结合以便两种内容之间的关联。

    다중 사용자를 위한 콘텐츠 추천 방법
    67.
    发明公开
    다중 사용자를 위한 콘텐츠 추천 방법 有权
    多用途内容建议方法

    公开(公告)号:KR1020090046364A

    公开(公告)日:2009-05-11

    申请号:KR1020070112461

    申请日:2007-11-06

    Inventor: 이수원 한정석

    CPC classification number: H04N21/4668 H04N21/4661

    Abstract: 본 발명은 다중 사용자를 위한 콘텐츠 추천 방법에 관한 것으로, 보다 자세하게는 단일 사용자만이 콘텐츠를 사용하는 환경뿐만 아니라 다중 사용자가 콘텐츠를 공동으로 사용하는 환경에서도 단일 및 다중 사용자들의 선호 경향을 분석하여 다중 사용자에게 적합한 콘텐츠를 추천할 수 있는 방법에 관한 것이다.
    본 발명의 다중 사용자를 위한 콘텐츠 추천 방법은 다중 사용자가 함께 사용한 콘텐츠의 이력이 있다면 이를 이용하여 학습된 다중 사용자 선호 모델에 각 멤버의 개인 사용자 선호 모델을 반영하여 콘텐츠의 추천 정확도를 향상시키고, 함께 사용한 콘텐츠의 이력이 없는 경우 각 멤버의 개인 모델을 이용하여 함께 사용할 콘텐츠에 대한 선호도를 예측하여 추천된 콘텐츠 리스트를 제공하는 방법이다.
    다중 사용자, 선호도, 선호도 모델, 콘텐츠, 추천, 코사인 유사도

    상대적 군집 평가 방법
    68.
    发明公开
    상대적 군집 평가 방법 无效
    使用相对标准的聚类有效性评估方法

    公开(公告)号:KR1020080026950A

    公开(公告)日:2008-03-26

    申请号:KR1020060092215

    申请日:2006-09-22

    CPC classification number: G06Q10/04 G06F17/10

    Abstract: A relative cluster assessment method is provided to measure inter-cluster combination degree more efficiently by using reliability range of each variable at neighbor search of inter-cluster combination degree assessment. A relative cluster assessment method comprises the following several steps. A data average, a standard deviation and the number of data are extracted with respect to an arbitrary cluster. Reliability range is extracted by using the extraction result. All the neighbor data are searched with specific data in the reliability range. Inter-cluster combination degree with respect to at least one cluster is assessed by using the search result.

    Abstract translation: 提供了一种相对的聚类评估方法,通过使用每个变量的可靠性范围,在群集间组合度评估的邻域搜索下,更有效地测量群间组合度。 相对集群评估方法包括以下几个步骤。 相对于任意的集群提取数据平均值,标准偏差和数据数。 通过提取结果提取可靠性范围。 在可靠性范围内用特定数据搜索所有邻居数据。 通过使用搜索结果评估与至少一个群集相关的群集间组合度。

    연관 키워드 그룹 추출 방법
    69.
    发明公开
    연관 키워드 그룹 추출 방법 无效
    相关密钥组提取方法

    公开(公告)号:KR1020080026948A

    公开(公告)日:2008-03-26

    申请号:KR1020060092210

    申请日:2006-09-22

    CPC classification number: G06F17/3071 G06F17/10 G06F17/30687 G06F17/30864

    Abstract: A method for extracting a related keyword group is provided to enhance importance of keywords existing at plural documents of the same site group, to analyze how many site group related keyword candidates appear at, and to analyze relationship between a specific keyword and related keyword candidates. A method for extracting a related keyword group comprises the following several steps. A site group is formed by grouping sites searched via a specific keyword(S111,S112). Important keywords are extracted from the site group and related keyword candidates are generated by using modified TFIDF(Term Frequency Inverse Document Frequency) which enhances the importance of the keyword appearing at documents of the same site group and reduces the importance of the keyword appearing at various site groups(S113-S118). Relationship between the related keyword candidates and the specific keyword is analyzed by using a modified relation rule to which concentration rate and reliability are applied wherein the concentration rate means how frequently the related keyword candidates appear at the same site group and the reliability means how frequently the related keyword candidates appear at various site groups(S119). Relationship between the related keyword candidates and the specific keyword is analyzed by using Cosine similarity for analyzing content similarity among site groups(S120). Related keyword groups are extracted by intersecting the related keyword candidates analyzed via the modified relation rule with those analyzed via the Cosine similarity(S121,S122).

    Abstract translation: 提供一种用于提取相关关键字组的方法,以增强存在于同一站点组的多个文档上的关键字的重要性,以分析有多少站点组相关的关键字候选者出现在哪里,并分析特定关键字和相关关键字候选之间的关系。 用于提取相关关键字组的方法包括以下几个步骤。 通过对通过特定关键词搜索的站点进行分组(S111,S112)形成站点组。 从站点组中提取重要关键词,并通过使用修改的TFIDF(术语频率逆文档频率)生成相关的关键词候选者,这增强了在相同站点组的文档中出现的关键字的重要性,并降低了关键字出现在各种各样的重要性 现场组(S113-S118)。 通过使用适用浓度率和可靠性的修正关系规则来分析相关关键词候选人与具体关键词之间的关系,其中集中率是指相关关键字候选人出现在同一地点组的频率,可靠性意味着 相关关键字候选人出现在各种网站组(S119)。 通过使用余弦相似度来分析站点组之间的内容相似性来分析相关关键词候选者与特定关键词之间的关系(S120)。 通过将经修改的关系规则分析的相关关键字候选与通过余弦相似度分析的相关关键字候选相交,提取相关的关键字组(S121,S122)。

    태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치

    公开(公告)号:KR101910424B1

    公开(公告)日:2018-10-22

    申请号:KR1020160169464

    申请日:2016-12-13

    Abstract: 태그의감성분석을이용한영화평점예측방법은, 평가대상인영화에대한사용자의평점을예측할데이터로활용하기위한이웃집단을구성하는단계; 상기이웃집단으로부터상기평가대상인영화에대한태그(tag) 정보와평점(rating) 정보를추출하는단계; 상기태그정보를이용하여감성분석을수행하는단계; 및상기감성분석의결과및 상기평점정보를이용하여, 상기사용자의상기평가대상인영화에대한평점을예측하는단계를포함한다. 이에따라, 태그(tag) 정보를이용한감성분석과평점(rating) 정보를통해사용자가아직평가하지않은영화평점을예측할수 있다.

Patent Agency Ranking