-
公开(公告)号:KR101011726B1
公开(公告)日:2011-01-28
申请号:KR1020090051168
申请日:2009-06-09
Applicant: 성균관대학교산학협력단
Abstract: 스니펫 제공 장치는 사용자 단말로부터 수신한 쿼리(Query)를 분석하는 쿼리 분석부, 웹 페이지들로부터 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출하는 스니펫 추출부, 웹 페이지들로부터 이슈 태그를 수집하는 이슈 태그 수집부, 후보 스니펫들에 포함된 키워드의 빈도 수 및 이슈 태그의 포함 여부에 따라 추출된 후보 스니펫들의 랭킹을 결정하는 스니펫 선택부 및 상기 결정된 랭킹에 따라 미리 설정된 개수의 스니펫들을 사용자 단말로 전송하는 검색 결과 전송부를 포함하며, 상기 이슈 태그 수집부는 사회적 이슈와 트렌드를 반영하도록 웹사이트들의 최근의 인기 태그들을 수집하고, 이슈 태그는 수집된 인기 태그들 중에서 선택된다.
스니펫, 블로그, 웹 페이지, 이슈 태그, 제목-
公开(公告)号:KR1020100132376A
公开(公告)日:2010-12-17
申请号:KR1020090051168
申请日:2009-06-09
Applicant: 성균관대학교산학협력단
CPC classification number: G06F17/30864 , G06F17/2715 , G06F17/30616 , G06F17/30663
Abstract: PURPOSE: An apparatus and a method for providing a snippet are provided to supply continued and meaningful information by extracting a snippet from a webpage based on an issue tag. CONSTITUTION: A query analyzer(121) analyzes a query received from a user terminal, and a snippet extractor(122) extracts candidate snippets having a keyword included in the query from webpages. An issue tag collector(123) collects an issue tag from the webpages, and a snippet selector(124) determines ranking of the candidate snippets according to the frequency of the keywords included in the candidate snippets. A search result transmission unit(125) transmits the snippets to a user terminal according to the ranking.
Abstract translation: 目的:提供一种用于提供代码段的设备和方法,以通过基于问题标签从网页中提取代码段来提供持续且有意义的信息。 构成:查询分析器(121)分析从用户终端接收的查询,并且片段提取器(122)从网页中提取具有查询中包含的关键字的候选片断。 问题标签收集器(123)从网页收集问题标签,并且片段选择器(124)根据包括在候选片段中的关键字的频率来确定候选片段的排名。 搜索结果发送单元(125)根据排名将该片段发送给用户终端。
-
公开(公告)号:KR1020100096468A
公开(公告)日:2010-09-02
申请号:KR1020090015361
申请日:2009-02-24
Applicant: 성균관대학교산학협력단
CPC classification number: G06K9/3266 , H04N1/405 , H04N1/409
Abstract: PURPOSE: A method for extracting a Korean caption based on a connected object without respect to a size using a morphological feature and a decision making tree of Korean are provided to generate a connected object of an edge based on color information of a caption, thereby extracting a Korean caption without respect to a size. CONSTITUTION: An area including a caption is extracted(S2). An edge with high possibility of having the caption is extracted by selecting edges with edge correspondence pairs(S3). An edge connected object is generated. A connected object including the caption is selected(S4). A caption and a background used as input of an OCR are binarized in an image(S5).
Abstract translation: 目的:提供一种基于连接对象提取韩文字幕的方法,而不考虑使用韩语的形态特征和决策树的大小,以基于字幕的颜色信息生成边缘的连接对象,从而提取 韩国字幕不符合大小。 构成:提取包括字幕的区域(S2)。 通过选择具有边缘对应对的边缘来提取具有高字幕的高可能性的边(S3)。 生成边连接对象。 选择包括标题的连接对象(S4)。 用作OCR的输入的字幕和背景在图像中被二值化(S5)。
-
公开(公告)号:KR100727555B1
公开(公告)日:2007-06-14
申请号:KR1020060024327
申请日:2006-03-16
Applicant: 성균관대학교산학협력단
IPC: G06F17/30
Abstract: 시간을 고려하여 최근 데이터들의 경향을 더 잘 표현할 수 있는 시간 가중치 엔트로피를 이용한 결정 트리 생성 방법 및 이를 기록한 기록매체에 관한 것으로, 컴퓨터가 외부에서 입력된 다수의 사례 데이터의 패턴을 인식하고 새롭게 분류된 데이터를 창출하기 위한 데이터 마이닝의 분류 기법 중 결정 트리 생성 방법에 있어서, (a) 시간 가중치 엔트로피를 이용하여 다수의 사례 데이터가 갖는 속성들 중에서 현재 레벨의 노드가 될 속성을 선택하기 위한 테스트를 하는 단계, (b) 상기 테스트에서 얻은 정보 획득량이 가장 큰 속성을 노드로 선택하는 단계, (c) 현재 레벨의 모든 노드가 선택될 때까지 상기 단계 (a) 내지 상기 단계 (b)를 반복하는 단계, (d) 현재 레벨의 모든 노드가 선택되면 한 단계 하위 레벨에 대해 상기 단계 (a) 내지 상기 단계 (c)를 반복하는 단계로 이루어진다.
상기와 같은 시간 가중치 엔트로피를 이용한 결정 트리 생성 방법 및 이를 기록한 기록매체를 이용하는 것에 의해, 최근 데이터에 더 중점을 두고 있기 때문에 전체 데이터를 고려해도 최근 데이터의 영향을 볼 수 있다.
데이터마이닝, 결정 트리, ID3, 엔트로피-
公开(公告)号:KR1020070059015A
公开(公告)日:2007-06-11
申请号:KR1020070020537
申请日:2007-02-28
Applicant: 성균관대학교산학협력단
IPC: G06F17/30
CPC classification number: G06F17/30539 , G05B2219/32185 , G06F17/11
Abstract: A method for generating a decision tree using time-weighted entropy and a recording medium thereof are provided to predict activity of a user or recognize a tendency of the user by analyzing preference data of the user in a ubiquitous environment. A test for selecting an attribute to be a node of a current level among the attributes of a plurality of instance data by using the time-weighted entropy is performed(ST2010). The attribute having the highest information quantity obtained from the test is selected as the node(ST2033). Previous two steps are repeatedly performed until all nodes of the current level are selected(ST2034). If all nodes of the current level are selected, all previous steps are repeatedly performed for the level just below the current level(ST2034). The decision tree generated by the previous two steps is generated until all low instance data groups are unified into one class and system entropy gets to be zero(ST2050). The time-weighted entropy of the recent tendency has bigger weight.
Abstract translation: 提供了一种使用时间加权熵及其记录介质生成决策树的方法,用于通过在无所不在的环境中分析用户的偏好数据来预测用户的活动或识别用户的倾向。 执行通过使用时间加权熵来选择属于多个实例数据的属性中的当前级别的节点的属性的测试(ST2010)。 选择从测试获得的具有最高信息量的属性作为节点(ST2033)。 重复执行上述两个步骤,直到当前级别的所有节点被选择(ST2034)。 如果选择了当前级别的所有节点,则对于刚刚低于当前级别的级别(ST2034),重复执行所有先前的步骤。 生成前两个步骤生成的决策树,直到所有的低实例数据组统一成一个类,系统熵变为零(ST2050)。 近期趋势的时间加权熵较大。
-
-
公开(公告)号:KR1020180025691A
公开(公告)日:2018-03-09
申请号:KR1020160112691
申请日:2016-09-01
Applicant: 성균관대학교산학협력단
CPC classification number: G06F17/276 , G06N3/08 , G06N99/005
Abstract: 인공신경망기반의문단생성방법이제공된다. 상기방법은문서데이터세트에포함된복수의문장데이터를기반으로머신러닝을통해문장데이터와상기문장데이터에대응하는문장벡터간의상호변환을위한문장벡터변환모델을생성하는단계, 상기복수의문장데이터에각각대응하는복수의문장벡터를기반으로머신러닝을통해현재문장벡터에대한후속문장벡터를예측하기위한후속문장예측모델을생성하는단계및 상기문장벡터변환모델및 상기후속문장예측모델을이용하여하나의입력문장데이터에대응하는출력문단데이터를생성하는단계를포함할수 있다. 따라서, 앞뒤문맥을고려하여문장을생성하여, 올바른문법과일정한스토리의흐름을고려한문장을생성하도록함으로써스토리의질을향상시킬수 있다.
Abstract translation: 提供了一种基于人工神经网络的段落生成方法。 该方法包括:基于包括在文档数据集中的多个句子数据,通过机器学习生成句子数据和与句子数据对应的句子数据之间的相互转换的句子矢量转换模型, 生成后续语句预测模型,用于根据分别与语句向量转换模型和后续语句预测模型对应的多个语句向量,通过机器学习为当前语句向量预测后续语句向量, 并生成对应于一个输入句子数据的输出段落数据。 因此,可以通过考虑来回的上下文来生成句子并生成考虑正确语法和某个故事的流程的句子来提高故事的质量。
-
公开(公告)号:KR1020180025690A
公开(公告)日:2018-03-09
申请号:KR1020160112690
申请日:2016-09-01
Applicant: 성균관대학교산학협력단
CPC classification number: G06F17/2785 , G06N3/08 , G06N99/005
Abstract: 리뷰데이터의감성을분류하기위한방법이제공된다. 상기방법은텍스트정보및 상기텍스트정보에대응하는감성레벨정보를각각포함하는복수의리뷰데이터들을기반으로머신러닝을통해감성분류모델을생성하는단계와, 상기감성분류모델을이용하여감성레벨정보를포함하지않는리뷰데이터의감성레벨을결정하는단계를포함할수 있으며, 감성분류모델을생성하는단계는상기텍스트정보들간의유사도를기반으로상기감성레벨정보를조정하여상기감성분류모델에반영할수 있다. 따라서, 리뷰가받은추천및 비추천정보와, 다른평점을가진리뷰간의유사도를이용해리뷰의신뢰도를고려하여효과적으로리뷰의감성을분류할수 있다.
Abstract translation: 提供了用于对评论数据的情绪进行分类的方法。 该方法包括基于多个评论数据通过机器学习生成情感分类模型,每个评论数据包括与文本信息对应的文本信息和情绪级别信息, 并且其可以包括:确定所述敏感度水平,不包括数据的审查,生成情感类别模型的步骤可以体现在通过调节基于所述文本信息之间的相似度的灵敏度电平信息的情感分类模型。 因此,可以有效的审查的敏感性进行分类,同时考虑到审查和所接收的审查建议踩信息的可信性,使用具有其他额定值审查之间的相似度。
-
59.
公开(公告)号:KR1020170079429A
公开(公告)日:2017-07-10
申请号:KR1020150189989
申请日:2015-12-30
Applicant: 성균관대학교산학협력단
IPC: H04N21/472 , H04N21/25 , H04N21/45 , H04N21/466 , H04N21/475
Abstract: 본발명은사용자속성을고려한클러스터링기반의협업필터링방법및 그방법을이용하는영화추천시스템에관한발명이다. 상기방법은제1 소정개수의상위영화타이틀에관한데이터를중심점으로이용하는단계, 상기중심점을기준으로클러스터링적용을하는단계와제2 소정개수의상위장르가많이포함된클러스터를선택하는단계를포함한다.
Abstract translation: 本发明涉及考虑用户属性的基于聚类的协同过滤方法和使用该方法的电影推荐系统。 该方法包括使用关于第一预定数量的上部电影标题的数据作为中心点,基于中心点应用聚类,并且选择包含第二预定数量的较高类型的聚类 。
-
60.
公开(公告)号:KR1020170078464A
公开(公告)日:2017-07-07
申请号:KR1020150189006
申请日:2015-12-29
Applicant: 성균관대학교산학협력단
IPC: H04N21/442 , H04N21/466 , H04N21/475 , H04N21/45 , H04N21/25
Abstract: 본발명의 TV 채널추천방법및 장치는 TV를시청하는시청자에대한각각의데이터를수집하고, 일정기간을두고누적된사용자의시간의존성향에따른기본행렬을토대로상황에맞는프로파일링을통해현재 TV를시청하는서로다른시청자에게상위 k개의채널을추천한다.
Abstract translation: 根据本发明的电视频道推荐方法和装置收集观看电视的观看者的各个数据,并且基于基于在一段时间内累积的用户的时间依赖倾向的基本矩阵, 并建议顶级k频道给不同的观众观看。
-
-
-
-
-
-
-
-
-