웹 크롤링 시스템 및 그 방법
    11.
    发明授权
    웹 크롤링 시스템 및 그 방법 失效
    网络抓取系统及其方法

    公开(公告)号:KR100993818B1

    公开(公告)日:2010-11-12

    申请号:KR1020090013597

    申请日:2009-02-18

    Abstract: 본 발명은 웹 크롤링에 소요되는 시간을 획기적으로 단축시킬 수 있는 웹 크롤링 시스템에 관한 것이다.
    본 명세서에서 개시하는 웹 크롤링 시스템은 웹 크롤링을 위한 기준 웹 페이지들(시드 페이지들(seed pages))을 설정하고, 웹 크롤링을 통해 발견되는(Discovered) 상기 시드 페이지들의 각 시드 페이지(p
    i )에의 접근 확률(중요도)을 산출하여 상기 각 시드 페이지(p
    i )에 우선순위를 부여하는 시드 페이지 우선순위 부여부; 상기 부여된 각 시드 페이지(p
    i )의 우선순위 중 가장 높은 순위를 갖는 시드 페이지(p
    i
    ,
    max )를 추출하여 우선적으로 다운로드하되, 상기 시드 페이지(p
    i
    ,
    max )에 링크된 외부링크(outlink) 페이지들도 일괄적으로 다운로드하는 다운로드부; 및 상기 다운로드된 외부링크 페이지들의 각 링크 페이지(p
    j )에 대한 상기 시드 페이지(p
    i,max )내에서의 접근 확률(중요도)을 산출하여, 상기 각 링크 페이지(p
    j )에 우선순위를 부여하는 외부링크 페이지 우선순위 부여부를 포함하여 본 시스템 발명의 과제를 해결한다.

    조상 후손 카테고리를 활용한 오픈 디렉터리 프로젝트 기반 텍스트 분류 방법 및 장치
    12.
    发明公开
    조상 후손 카테고리를 활용한 오픈 디렉터리 프로젝트 기반 텍스트 분류 방법 및 장치 有权
    基于开放目录项目的文本分类器的方法和装置

    公开(公告)号:KR1020150066994A

    公开(公告)日:2015-06-17

    申请号:KR1020140070694

    申请日:2014-06-11

    CPC classification number: G06F17/3069 G06F17/16 G06F17/30625 G06F17/30705

    Abstract: 본발명은오픈디렉터리프로젝트기반의텍스트분류기생성방법에있어서, 오픈디렉터리프로젝트의각 카테고리에저장된텍스트집합을특징벡터로변환하는단계; 카테고리의특징벡터를이용하여카테고리의조상병합특징벡터를생성하는단계; 카테고리의특징벡터를이용하여카테고리의후손병합특징벡터를생성하는단계; 및카테고리의특징벡터, 조상병합특징벡터및 후손병합특징벡터를이용하여조상후손병합특징벡터를생성하는단계를포함하고, 오픈디렉터리프로젝트의구조는미리정의되어있는것을특징으로한다.

    Abstract translation: 本发明涉及一种基于开放目录项目生成文本分类器的方法。 该方法包括以下步骤:将存储在开放目录项目的每个类别中的一组文本转换为特征向量; 通过使用该类别的特征向量生成类别的祖先合并特征向量; 通过使用该类别的特征向量来生成类别的后代合并特征向量; 并通过使用类别的特征向量,祖先合并特征向量和后代合并特征向量来生成祖先和后代合并特征向量。 打开目录项目的结构是预定义的。

    유사도 그래프를 활용한 문맥 광고 시스템
    13.
    发明授权
    유사도 그래프를 활용한 문맥 광고 시스템 有权
    使用简单图形的上下文广告系统

    公开(公告)号:KR101083274B1

    公开(公告)日:2011-11-14

    申请号:KR1020090103497

    申请日:2009-10-29

    Abstract: 문맥광고시스템은광고가게재될하나이상의웹 페이지를관리하는웹 페이지집합관리부, 웹페이지에게재될하나이상의광고를관리하는광고집합관리부및 상기웹 페이지와광고의유사도에기초하여상기광고와상기웹 페이지를매칭시켜, 상기광고가상기웹 페이지상에서실행되도록하는광고매칭부를포함하되, 상기광고매칭부는상기웹 페이지와광고를분류하는클래스들에대한유사도그래프를생성하고, 상기유사도그래프에설정된링크의가중치에기초하여임의의두 클래스간의의미적연관성을산출하여상기광고와상기웹 페이지를매칭시킨다.

    사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법
    14.
    发明公开
    사용자 관심 주제를 추출하는 휴대용 통신 단말기 및 그 방법 有权
    便携式通信设备和提取用户兴趣的方法

    公开(公告)号:KR1020110090354A

    公开(公告)日:2011-08-10

    申请号:KR1020100010078

    申请日:2010-02-03

    Abstract: PURPOSE: A portable communication terminal capable of extracting interest theme of a user and method thereof are provided to grasp interest theme of a user using text data included in data created by portable communication terminal. CONSTITUTION: A word vector creation unit(210) creates word vector that represents each text data according to kinds of text data stored in data created by a portable communication terminal. A theme classification tree storage unit(230) includes one or more learning data. The theme classification tree storage unit stores the theme classification tree connected to plural nodes expressing theme. A similarity output unit(220) produces similarity between each node learning data included in the word vector and theme classification tree.

    Abstract translation: 目的:提供一种能够提取用户的兴趣主题的便携式通信终端及其方法,以便使用由便携式通信终端创建的数据中包含的文本数据来掌握用户的兴趣主题。 构成:字矢量创建单元(210)根据存储在由便携式通信终端创建的数据中的文本数据的种类,创建表示每个文本数据的字向量。 主题分类树存储单元(230)包括一个或多个学习数据。 主题分类树存储单元存储连接到表示主题的多个节点的主题分类树。 相似度输出单元(220)在包括在单词向量和主题分类树中的每个节点学习数据之间产生相似性。

    주제 분류 모듈 및 그를 이용한 문맥 광고 시스템
    15.
    发明公开
    주제 분류 모듈 및 그를 이용한 문맥 광고 시스템 有权
    用于主题分类的模块和使用相同的上下文广告系统

    公开(公告)号:KR1020110052821A

    公开(公告)日:2011-05-19

    申请号:KR1020090109501

    申请日:2009-11-13

    CPC classification number: G06Q30/0241 G06F17/30705 G06F17/30961

    Abstract: PURPOSE: A topic classification module and a contextual advertisement system using the same are provided to minimize the costs for creating the classification module by using an opened directory data. CONSTITUTION: A topic classification tree generator(132) processes the opened directory data and creates a theme classification tree. A training data generator(134) creates a learning data representing the directory based on text information of a web site which is included in the opened directory. A classification unit(136) maps the learning data to the directory. The classification unit determines the web page or the theme of the advertisement by calculating the similarity between the word vector and the directory representing vector.

    Abstract translation: 目的:提供主题分类模块和使用该主题分类模块的上下文广告系统,以通过使用打开的目录数据来最小化创建分类模块的成本。 构成:主题分类树生成器(132)处理打开的目录数据并创建主题分类树。 训练数据生成器(134)基于包括在打开的目录中的网站的文本信息创建表示目录的学习数据。 分类单元(136)将学习数据映射到目录。 分类单元通过计算字矢量和表示向量的目录之间的相似度来确定网页或广告的主题。

    맞춤형 광고 제공 방법 및 장치
    16.
    发明公开
    맞춤형 광고 제공 방법 및 장치 有权
    用于呈现个人化广告的方法和装置

    公开(公告)号:KR1020120107614A

    公开(公告)日:2012-10-04

    申请号:KR1020110025217

    申请日:2011-03-22

    CPC classification number: G06Q30/0255 G06Q30/0254 G06Q30/0269 G06Q30/0277

    Abstract: PURPOSE: A customized advertisement providing method and a device thereof are provided to supply an advertisement according to related subject matter of a web page by checking the related subject matter through history information of the web page. CONSTITUTION: One or more web pages to be visited that are semantically related to an advertisement-containing web page are extracted(S410). Web page subject matter corresponding to each web page are determined through subject matter classification processing for the web pages to be visited and the advertisement-containing web page(S420). Advertisement contents corresponding to the web page subject matter are extracted from the advertisement contents which include the determined advertisement subject matter. [Reference numerals] (S410) Extracting a visiting web page related to an advertisement posting web page; (S420) Classifying subjects of extracted visiting web pages; (S430) Generating a class view according to the subject classification; (S440) Matching an advertisement according to the class view; (S450) Providing a customized advertisement

    Abstract translation: 目的:提供一种定制的广告提供方法及其装置,通过网页的历史信息检查相关的主题,根据网页的相关主题提供广告。 摘要:提取与涉及广告的网页语义相关的要访问的一个或多个网页(S410)。 通过对要访问的网页和包含广告的网页的主题分类处理来确定与每个网页对应的网页主题(S420)。 从包括确定的广告主题的广告内容中提取与网页主题相对应的广告内容。 (附图标记)(S410)提取与广告发布网页相关的访问网页; (S420)分类提取的访问网页的主题; (S430)根据主题分类生成课堂视图; (S440)根据课堂视图匹配广告; (S450)提供定制广告

    무선 방송 환경에서의 인덱스 구성 장치 및 방법과 이를 이용한 스카이라인 질의 처리 시스템 및 방법
    17.
    发明授权
    무선 방송 환경에서의 인덱스 구성 장치 및 방법과 이를 이용한 스카이라인 질의 처리 시스템 및 방법 有权
    用于在无线广播环境中构建索引的装置和方法,以及使用其处理天际线查询的系统和方法

    公开(公告)号:KR101154190B1

    公开(公告)日:2012-06-18

    申请号:KR1020080137451

    申请日:2008-12-30

    Inventor: 이상근 하종우

    Abstract: 본 발명은 무선 방송 환경에서의 스카이라인 질의 처리 기술에 관한 것으로서, 본 발명에 따른 인덱스 구성 장치는, SWEEP 순서를 기반으로 인덱싱(indexing)된 DSI(Distribute Spatial Index) 구조 및 상기 DSI 구조에 대응하는 대응 데이터 객체의 NDP(Nearest Dominating Point) 정보를 포함하여 인덱스 테이블(index table)을 구성하는 인덱스 테이블 구성부; 및 상기 인덱스 테이블 및 상기 데이터 객체를 연관시켜 브로드캐스트하는 브로드캐스트부를 포함하여, 스카이라인 질의 처리시 모바일 클라이언트의 에너지 효율성을 개선하는 이점을 제공한다.

    유사도 그래프를 활용한 문맥 광고 시스템
    18.
    发明公开
    유사도 그래프를 활용한 문맥 광고 시스템 有权
    使用简单图形的上下文广告系统

    公开(公告)号:KR1020110046821A

    公开(公告)日:2011-05-06

    申请号:KR1020090103497

    申请日:2009-10-29

    CPC classification number: G06Q30/0277

    Abstract: PURPOSE: A contextual advertisement system utilizing similarity graph is provided to match higher advertisement semantically related to a web page by generating similarity graph based on weight graph and calculating semantic relevancy from the similarity graph. CONSTITUTION: A web page set manager(222) manage one or more web pages which an advertisement will be published. An advertisement set manager(224) manages at least one advertisement which will be published on the web page. Based on similarity of a web page and an advertisement, an advertisement matching unti(226) matches the advertisement and the web page and exposes the advertisement to the web page. The advertisement matching unit generates similarity graph. The advertisement matching unit calculates semantic relationship and matches the advertisement and the web page.

    Abstract translation: 目的:提供利用相似度图形的上下文广告系统,通过基于权重图生成相似图,并从相似图中计算语义相关性来匹配与网页语义相关的高级广告。 构成:网页集管理器(222)管理将发布广告的一个或多个网页。 广告集管理器(224)管理将在网页上发布的至少一个广告。 基于网页和广告的相似性,广告匹配unti(226)匹配广告和网页,并将广告暴露给网页。 广告匹配单元生成相似图。 广告匹配单元计算语义关系并匹配广告和网页。

    무선 방송 환경에서의 인덱스 구성 장치 및 방법과 이를 이용한 스카이라인 질의 처리 시스템 및 방법
    19.
    发明公开
    무선 방송 환경에서의 인덱스 구성 장치 및 방법과 이를 이용한 스카이라인 질의 처리 시스템 및 방법 有权
    用于在无线广播环境中构建索引的装置和方法,以及使用其处理天线查询的系统和方法

    公开(公告)号:KR1020100079043A

    公开(公告)日:2010-07-08

    申请号:KR1020080137451

    申请日:2008-12-30

    Inventor: 이상근 하종우

    CPC classification number: H04H20/71 H04H60/38

    Abstract: PURPOSE: An apparatus and a method for configuring an index in wireless broadcasting environments, and a system and a method for processing skyline queries using the same are provided to use NDP information of a DSI structure and a data object based on SWEEP order, thereby accurately determining whether a currently read data object is a skyline point. CONSTITUTION: An index table configuring unit(310) configures an index table. The index table includes a DSI structure indexed based on SWEEP order and NDP(Nearest Dominating Point) information of a corresponding data object corresponding to the DSI structure. A broadcasting unit(320) interlinks the index table with the data object. The broadcasting unit broadcasts the index table and the data object.

    Abstract translation: 目的:提供一种用于在无线广播环境中配置索引的装置和方法,并且提供一种用于处理使用该索引的天际线查询的系统和方法,以使用基于SWEEP顺序的DSI结构和数据对象的NDP信息,从而准确地 确定当前读取的数据对象是否是天际线点。 构成:索引表配置单元(310)配置索引表。 索引表包括基于SWEEP顺序索引的DSI结构和对应于DSI结构的相应数据对象的NDP(最近主导点)信息。 广播单元(320)将索引表与数据对象互连。 广播单元广播索引表和数据对象。

Patent Agency Ranking