-
公开(公告)号:WO2015122575A1
公开(公告)日:2015-08-20
申请号:PCT/KR2014/004809
申请日:2014-05-29
Applicant: 숭실대학교산학협력단
Abstract: 개인 성향 예측 방법 및 장치가 개시된다. 개인 성향 예측 방법은 소셜 네트워크에서 개인 라이프로그(personal life log)를 수집하는 단계; 상기 개인 라이프로그를 트리플 구조로 분석하여 사용자의 각 행동에 대한 대상을 정의하여 사용자 행동 행렬을 생성하여 사용자 행동 변수를 각각 추출하는 단계; 상기 개인 라이프로그를 분석하여 사용자와 친구간 상호작용 정도를 도출하고, 상기 도출된 상호작용 정도를 이용하여 친구관계 특징 변수를 도출하는 단계; 상기 개인 라이프로그를 분석하여 각 피드에 대해 사용자가 남긴 위치정보를 이용하여 이동 경로 특징 변수를 도출하는 단계; 및 상기 사용자 행동 변수, 상기 친구관계 특징 변수 및 상기 이동 경로 특징 변수를 학습된 네 가지 개인 성향 모델에 적용하여 개인 성향을 예측하는 단계를 포함한다.
Abstract translation: 公开了一种用于预测人格特征的方法和装置。 预测个性特征的方法包括以下步骤:从社交网络收集个人生活日志; 通过三维结构分析个人生活日志,定义用户的动作对象和生成用户动作矩阵来提取每个用户动作变量; 分析个人生活日志以得出用户与朋友之间的一定程度的交互,并通过使用派生的交互程度导出友谊特征变量; 通过使用用户为每个馈送留下的位置信息来分析个人生活日志以导出移动路径特征变量; 并通过将用户动作变量,友谊特征变量和移动路径特征变量应用于四个学习人格特质模型来预测个性特征。
-
公开(公告)号:WO2015023031A1
公开(公告)日:2015-02-19
申请号:PCT/KR2013/011920
申请日:2013-12-20
Applicant: 숭실대학교산학협력단
CPC classification number: G06F17/2735 , G06F17/30616 , G06F17/30864
Abstract: 전문분야 검색 지원 방법 및 장치가 개시된다. 전문분야 검색 지원 방법은 (a)웹 문서에서 질의-답변 데이터를 수집하는 단계; (b) 상기 질의-답변 데이터에서 질문부와 답변부를 구분하여 분석하여 단어를 추출하는 단계; (c) 상기 질문부 및 상기 답변부에 포함된 각 단어들간의 상관성 분석을 통해 일반 용어-전문 용어 매핑 확률을 계산하여 일반 용어-전문용어 매핑 테이블을 생성하는 단계; 및 (d) 상기 용어 매핑 테이블을 이용하여 질의문에 포함된 단어를 포함하는 전문 용어를 추출하여 제공하는 단계를 포함한다.
Abstract translation: 公开了一种在专业领域支持搜索的方法和装置。 在专业领域支持搜索的方法包括以下步骤:(a)从网页收集查询答复数据; (b)通过将查询答复数据分析并分类成查询部分和答复部分,从查询答复数据中提取单词; (c)通过分析分别包括在查询部分和答案部分中的词之间的相关性并创建一个术语技术术语映射表来计算一般的术语技术术语映射概率; 和(d)使用术语映射表提取和提供包括查询中包含的单词的技术术语。
-
公开(公告)号:KR1020140094299A
公开(公告)日:2014-07-30
申请号:KR1020130006942
申请日:2013-01-22
Applicant: 숭실대학교산학협력단
CPC classification number: G06Q50/10 , G06F17/10 , G06F17/2705
Abstract: Existing researches related to news recommendation do not reflect well the characteristics of news contents, that is, ′there is a high possibility that a user is interested in popular news in which many people are interested′, thereby not having advantage in acquiring effects in contrast to costs. According to the present invention, a popularity preference tendency prediction system extracts user topic preference and popularity preference tendency of a user to resolve problems of existing researches and produces a personalized preference prediction model applicable to real news services. As a result, the predicted result according to the present invention is more excellent than the news recommendation method using popularity.
Abstract translation: 与新闻推荐相关的现有研究并不能很好地反映新闻内容的特点,即“用户对许多人感兴趣的热门新闻感兴趣的可能性很高”,因此在获取对比度方面没有优势 费用。 根据本发明,流行偏好倾向预测系统提取用户的用户主题偏好和流行度偏好倾向,以解决现有研究的问题,并且生成适用于真实新闻服务的个性化偏好预测模型。 结果,根据本发明的预测结果比使用流行度的新闻推荐方法更优异。
-
公开(公告)号:KR101291076B1
公开(公告)日:2013-08-23
申请号:KR1020110084554
申请日:2011-08-24
Applicant: 숭실대학교산학협력단
Abstract: 본 발명은 스팸 문서를 판단하는 기술에 관한 것으로, 본 발명의 일 실시예에 따른 스팸 문서 판단 방법은, 문서로부터 특수 문자, 색인어, 링크 정보를 추출하는 단계와, 상기 문서에서 상기 특수 문자의 출현 비율, 상기 특수 문자가 스팸 문서에서 출현할 확률을 이용한 특수 문자 스팸지수, 상기 색인어의 스팸 문서에서 출현할 확률을 이용한 색인어 스팸지수, 상기 색인어의 출현 빈도에 대한 표준편차, 상기 색인어의 출현 빈도의 평균에서 상기 표준편차를 초과하여 반복 출현하는 비정상 색인어의 출현 비율, 상기 반복 출현하는 색인어들의 개수 비율, 웹 페이지 주소로 유도하는 상기 링크의 개수 중 적어도 하나를 포함하는 특징 변수를 설정하는 단계와, 상기 특징 변수들의 값을 기계학습 알고리즘을 이용하여 계산하는 특징 변수를 계산하는 단계와, 상기 계산된 특징 변수들의 값을 미리 설정된 스팸 문서 분류 모델로 분석하여, 상기 문서의 스팸 문서 여부를 판단하는 단계를 포함한다. 이에 따라, 자질어만을 이용하는 기존의 스팸 문서 판단 방법에 비해 스팸 문서 분류의 정확도를 향상시킬 수 있다.
-
公开(公告)号:KR1020130021956A
公开(公告)日:2013-03-06
申请号:KR1020110084554
申请日:2011-08-24
Applicant: 숭실대학교산학협력단
CPC classification number: G06F17/18 , G06F17/2715 , G06N99/005
Abstract: PURPOSE: A spam document determination method and a determination device thereof are provided to improve the accuracy of spam document classification by determining a spam document in a machine learning method. CONSTITUTION: An information extraction unit(110) extracts specific characters, an index word, and link information. A feature variable setting unit(120) sets a characteristic variable including the number of links, the number ratio of index words, specific character spam ratios, and a standard deviation. A characteristic variable calculation unit(130) calculates a value of the characteristic variables by using a machine learning algorithm. A spam document determination unit(140) determines the spam document by analyzing a spam document classification model by using the value of the characteristic variables. [Reference numerals] (110) Information extraction unit; (115) Document DB; (120) Feature variable setting unit; (125) Spam classification model DB; (130) Feature variable calculation unit; (140) Spam document determination unit
Abstract translation: 目的:提供一种垃圾邮件文件确定方法及其确定装置,以通过机器学习方法中的垃圾邮件文档来确定垃圾邮件分类的准确性。 构成:信息提取单元(110)提取特定字符,索引词和链接信息。 特征变量设定单元(120)设定包括链接数,索引字的数量比,特定字符垃圾邮件比率和标准偏差的特征变量。 特征变量计算单元(130)通过使用机器学习算法来计算特征变量的值。 垃圾邮件文件确定单元(140)通过使用特征变量的值分析垃圾邮件文档分类模型来确定垃圾邮件文档。 (附图标记)(110)信息提取单元; (115)文件DB; (120)特征变量设定单位; (125)垃圾邮件分类模型DB; (130)特征变量计算单元; (140)垃圾邮件文件确定单元
-
公开(公告)号:KR1020150019474A
公开(公告)日:2015-02-25
申请号:KR1020130096419
申请日:2013-08-14
Applicant: 숭실대학교산학협력단
CPC classification number: G06F17/2735 , G06F17/30616 , G06F17/30864
Abstract: 전문분야 검색 지원 방법 및 장치가 개시된다. 전문분야 검색 지원 방법은 (a)웹 문서에서 질의-답변 데이터를 수집하는 단계; (b) 상기 질의-답변 데이터에서 질문부와 답변부를 구분하여 분석하여 단어를 추출하는 단계; (c) 상기 질문부 및 상기 답변부에 포함된 각 단어들간의 상관성 분석을 통해 일반 용어-전문 용어 매핑 확률을 계산하여 일반 용어-전문용어 매핑 테이블을 생성하는 단계; 및 (d) 상기 용어 매핑 테이블을 이용하여 질의문에 포함된 단어를 포함하는 전문 용어를 추출하여 제공하는 단계를 포함한다.
Abstract translation: 公开了专业的现场搜索支持方法及其装置。 专业的现场搜索支持方法包括:从web文档收集查询答复数据的步骤(a); 通过将查询答案数据划分成查询部分和答复部分来提取单词并分析部分的步骤(b); 通过通过包括在查询部分中的单词与答复部分之间的相互关系来计算一般术语专业术语映射概率来生成一般术语专业术语映射表的步骤(c); 以及通过使用术语映射表来提取包括查询中的单词的专业术语的步骤(d)。
-
公开(公告)号:KR101524971B1
公开(公告)日:2015-06-02
申请号:KR1020140015212
申请日:2014-02-11
Applicant: 숭실대학교산학협력단
Abstract: 개인성향예측방법및 장치가개시된다. 개인성향예측방법은소셜네트워크에서개인라이프로그(personal life log)를수집하는단계; 상기개인라이프로그를트리플구조로분석하여사용자의각 행동에대한대상을정의하여사용자행동행렬을생성하여사용자행동변수를각각추출하는단계; 상기개인라이프로그를분석하여사용자와친구간상호작용정도를도출하고, 상기도출된상호작용정도를이용하여친구관계특징변수를도출하는단계; 상기개인라이프로그를분석하여각 피드에대해사용자가남긴위치정보를이용하여이동경로특징변수를도출하는단계; 및상기사용자행동변수, 상기친구관계특징변수및 상기이동경로특징변수를학습된네 가지개인성향모델에적용하여개인성향을예측하는단계를포함한다.
Abstract translation: 公开了个性特征预测方法及其装置。 个性特征预测方法包括以下步骤:从社交网络收集个人生活日志; 在三重结构中分析个人生活日志并且相对于用户的每个动作定义对象,以便生成用户动作矩阵并提取用户动作变量; 分析个人生活日志,推断用户和用户的朋友之间的交互程度,并通过使用推导的互动程度推导出朋友关系属性变量; 分析个人生活日志并使用用户相对于每个饲料的位置信息,以推导出运动路线属性变量; 并应用用户动作变量,朋友关系属性变量和运动路线属性变量来学习四个人格特质模型,从而预测人格特质。
-
公开(公告)号:KR101515413B1
公开(公告)日:2015-04-29
申请号:KR1020130096419
申请日:2013-08-14
Applicant: 숭실대학교산학협력단
Abstract: 전문분야 검색 지원 방법 및 장치가 개시된다. 전문분야 검색 지원 방법은 (a)웹 문서에서 질의-답변 데이터를 수집하는 단계; (b) 상기 질의-답변 데이터에서 질문부와 답변부를 구분하여 분석하여 단어를 추출하는 단계; (c) 상기 질문부 및 상기 답변부에 포함된 각 단어들간의 상관성 분석을 통해 일반 용어-전문 용어 매핑 확률을 계산하여 일반 용어-전문용어 매핑 테이블을 생성하는 단계; 및 (d) 상기 용어 매핑 테이블을 이용하여 질의문에 포함된 단어를 포함하는 전문 용어를 추출하여 제공하는 단계를 포함한다.
Abstract translation: 公开了一种用于专业领域搜索支持的方法和装置。 支持专业领域搜索的方法包括以下步骤:(a)收集网络文档中的查询答复数据; (b)通过分析问题答案数据中的问题部分和答案部分来提取单词; (c)通过分析包含在问题部分和答案部分中的单词之间的相关性,通过计算通用术语映射概率来生成通用术语映射表; (d)使用术语映射表提取并提供包括查询中包括的单词的术语。
-
公开(公告)号:KR101381921B1
公开(公告)日:2014-04-08
申请号:KR1020120095666
申请日:2012-08-30
Applicant: 숭실대학교산학협력단
Abstract: 소비자의 성향 분류 장치 및 방법이 개시된다. 소비자 정보 수집부는 온라인 사이트에 접속한 소비자로부터 사전에 설정된 소비자의 성향 분류에 따라 소비자의 성향을 분류할 수 있는 소비자 성향 정보를 입력받고 소비자가 상기 온라인 사이트에서 상품을 구매하기 위해 수행한 행동을 나타내는 웹 쇼핑 로그를 수집한다. 검색로그 산출부는 소비자가 사전에 설정되어 있는 상품 관련 정보를 검색하였는가를 나타내는 검색 로그를 산출한다. 행동로그 산출부는 소비자가 상품 관련 정보에 대응하여 사전에 설정되어 있는 소비자 행동 유형에 해당하는 행동을 수행하였는가를 나타내는 행동 로그를 검색 로그를 기초로 산출한다. 활동성지수 산출부는 소비자가 상품을 구매하기 위해 필요한 정보를 검색하는 정도를 나타내는 활동성 지수를 산출한다. 분류모델 생성부는 산출된 행동 로그 및 활동성 지수와 소비자로부터 입력받은 소비자 성향 정보를 기초로 온라인 사이트에 접속하는 소비자의 성향을 분류할 수 있는 규칙을 생성한다. 소비자성향 분류부는 온라인 사이트에 접속한 소비자에 대하여 산출된 행동 로그 및 활동성 지수와 생성된 규칙을 기초로 소비자의 성향을 분류한다. 본 발명에 따르면, 사회과학분야의 이론을 시스템화함으로써 IT 관련 서비스의 품질을 향상시키고 차별화된 새로운 종류의 IT 서비스를 제공할 수 있다.
-
公开(公告)号:KR1020140031447A
公开(公告)日:2014-03-13
申请号:KR1020120095666
申请日:2012-08-30
Applicant: 숭실대학교산학협력단
CPC classification number: G06Q30/0203 , G06Q30/0255 , G06Q30/0601
Abstract: Disclosed are an apparatus and method for classifying a consumer propensity. A consumer information collection unit receives, from a consumer who accesses an online site, consumer propensity information which is used to classify a consumer propensity according to predetermined consumer propensity classification, and collects a web shopping log which represents actions performed by the consumer to buy a product on the online site. A search log calculation unit calculates a search log which represents whether the consumer has searched for product related information which is previously set. An action log calculation unit calculates an action log based on the search log, wherein the action log represents whether the consumer has performed an action corresponding to predetermined consumer action types in response to the product related information. An activity index calculation unit calculates an activity index which represents a degree of required information search by a consumer to buy a product. A classification model generation unit creates a rule which is applied to classify a propensity of a consumer who accesses the online site based on the calculated action log, the activity index, and the consumer propensity information inputted by the consumer. A consumer propensity classification unit classifies a propensity of a consumer who accesses the online site based on the calculated action log, the activity log, and the generated rule. According to the present invention, service quality related to IT can be improved and a differentiated new kind of IT service can be provided by systematizing social scientific theories. [Reference numerals] (110) Consumer information collection unit; (120) Search log calculation unit; (130) Action log calculation unit; (140) Activity index calculation unit; (150) Classification model generation unit; (160) Consumer propensity classification unit
Abstract translation: 公开了一种用于分类消费者倾向的装置和方法。 消费者信息收集单元从访问在线站点的消费者接收根据预定消费者倾向分类用于对消费者倾向进行分类的消费者倾向信息,并且收集表示消费者执行的购买行为的动作的网络购物日志 产品在网站上。 搜索日志计算单元计算搜索日志,其表示消费者是否已经搜索了先前设置的产品相关信息。 动作日志计算单元基于搜索日志计算动作日志,其中动作日志表示消费者是否响应于与产品相关的信息已经执行了与预定的消费者动作类型对应的动作。 活动指数计算单元计算表示消费者购买产品所需信息的程度的活动指数。 分类模型生成单元创建一个规则,该规则被应用于基于由消费者输入的计算的动作日志,活动指数和消费者倾向信息来分类访问在线站点的消费者的倾向。 消费者倾向分类单元根据计算的动作日志,活动日志和生成的规则对访问在线站点的消费者的倾向进行分类。 根据本发明,可以提高与IT相关的服务质量,并通过系统化社会科学理论来提供差异化的新型IT服务。 (附图标记)(110)消费者信息收集单元; (120)搜索日志计算单位; (130)动作对数计算单位; (140)活动指标计算单位; (150)分类模型生成单元; (160)消费倾向分类单位
-
-
-
-
-
-
-
-
-