-
公开(公告)号:KR100284578B1
公开(公告)日:2001-03-15
申请号:KR1019980054167
申请日:1998-12-10
Applicant: 한국전자통신연구원
IPC: H04L12/00
Abstract: 본 발명은, 인터넷의 웹 상에서 HTML(Hypertext Markup Language) 문서의 형태로 지원되는 온라인 잡지와 신문의 각 면(section)을 수집하고, 소정의 처리과정을 거쳐 신문기사 레코드를 추출하여 사용자에게 제공할 수 있는 뉴스 정보 수집 시스템과 수집방법에 관한 것으로, 본 발명의 일면에 따른 뉴스 정보 수집 시스템은, 인터넷의 웹 상에 있는 온라인 신문 또는 잡지 사이트로부터 HTML 문서의 형태로 지원되는 신문의 각 면을 HTTP(Hypertext Transfer Protocol) 통신에 의해 수집하는 HTTP 통신부(10)와, 상기 HTTP 통신부(10)에 의해 수집된 신문기사 문서에 존재하는 잡음을 제거하는 잡음제거부(20)와, 개발자 또는 사용자가 요구하는 정규식 패턴을 입력하는 패턴입력부(40)와, 상기 잡음제거부(20)에 의해 잡음이 제거된 웹 문서를 정규식 스트링으로 변환하고, 변환된 정규식 스트링과 상기 패턴입력부(40)를 통해 개발자 또는 사용자에 의해 입력된 정규식 패턴을 정합하여 신문기사 레코드를 추출하는 패턴정합부(30)를 구비한 것을 특징으로 하며, 본 발명에 따르면, 인터넷의 웹 상에서 HTML 문서의 형태로 지원되는 온라인 잡지와 신문의 각 면을 실시간으로 수집하여, 잡음제거 과정과 패턴정합 과정을 거침으로써, 종래의 방법보다 웹 사이트의 변화에 강하면서도, 개발자가 단순하고 쉬운 방법으로 기사 정보를 추출할 대상을 지적함으로써 실시간으로 원하는 기사 정보를 추출할 수 있다.
-
公开(公告)号:KR1019990034154A
公开(公告)日:1999-05-15
申请号:KR1019970055652
申请日:1997-10-28
Applicant: 한국전자통신연구원
IPC: G06Q50/10
Abstract: 본 발명은 인터넷 웹환경에서 3차원 가상공간을 동적구성할 수 있는 방법에 관한 것으로, 3차원 가상공간 서비스를 받기 원하는 사용자가 원하는 가상세계의 정보를 입력하면 그 정보를 받아들여 그 정보를 컴퓨터 그래픽 인터페이스(CGI) 파라미터로 해석하여 데이터 베이스 검색을 위한 질의어를 생성하여, 웹서버에서 가상 공간을 만드는데 필수적인 장면 그래프를 동적으로 구성하기 위해 상기 질의어에 의거하여 데이터베이스를 상향적으로 검색하여 초기 장면 그래프를 구성하고 그 초기 장면 그래프를 트래버스하여 하향적으로 검색하며, VRML2.0 모델링 언어를 이용하여 장면 그래프를 완성하고 VRML구성파일로 저장하여 사용자에게 전송해줌으로써, 실제의 3차원 공간에 관련된 모든 작업들의 가상 모의 실험, 다양한 서비스가 가능하며, 인터넷 표� ��인 가상현실 모델링 언어인 VRML 2.0을 이용하여 서버에서 가상 객체나 공간을 사용자의 원하는 정보로서 동적으로 구성하여 누구라도 이 표준을 지원하는 웹브라우저만 있으면 사용자가 원하는 가상공간을 실시간으로 전송받을 수 있게 하였다.
-
公开(公告)号:KR100289065B1
公开(公告)日:2001-05-02
申请号:KR1019970052617
申请日:1997-10-14
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: PURPOSE: A method for processing a natural query language is provided to convert into an SQL(structured query language) which is a query language of an RDBMS(relational database management system) by extracting a commodity term in a natural query language when a user requests a search according to a desired commodity using a natural language. CONSTITUTION: If a buyer requests a search for a commodity by a natural query language for buying the commodity through Internet virtual stores(S1), a query language is extracted by an extractor(S3) and stored in a storing place array through an HTTPa(40) which is a web server in an electronic commerce system(S2). A token of the stored natural query language is separated by a separator by making various conditions as a space, a pause, a period, and a symbol such as a delimiters(S4). If a term which indicates a commodity price is existed in the separated token, the term is stored in a storage location array and removes the corresponding token(S5). After a postposition is removed in each token(S6), an unused token is removed(S7). If an ESQL(embedded SQL) is created according to an extracted term and an electronic commerce term table is searched, characteristics(CIC(Company Identification Code), PCC(product Classification Code), BN(Brand name), CFC(Chief Function Code)) of each term may be sensed from a control field(S8). A term, which is not possessed in five categories(company identification code, product classification code, brand name, chief function code, and price), is excluded in a processing object, and an ESQL is created according to the four terms except the price and an electronic commerce synonym table is searched, thus a synonym/similar language/foreign language may be obtained(S9). The synonym/similar language/foreign language is processed as one term group and is not considered in a normal creation according to a query language(S10).
-
公开(公告)号:KR100261272B1
公开(公告)日:2000-07-01
申请号:KR1019970055652
申请日:1997-10-28
Applicant: 한국전자통신연구원
IPC: G06Q50/10
Abstract: PURPOSE: A method for dynamically constructing a three-dimensional virtual space in internet web environment is provided to enable a user to receive the virtual space via a web browser, which supports an internet standard, in real time, by forming virtual object and space with the information desired by the user in a server, using a VRML(Virtual Reality Modeling Language) having the internet standard. CONSTITUTION: An input output management part(12) in a web server provides a three-dimensional virtual space service to a client(11). A CGI(Computer Graphic Interface) parameter interpreter(13) interprets the information inputted from the user to a CGI parameter, and thereby creates a query necessary for searching data. This data is searched in a database(15) in response to the query created. A VRML scene management part(14) receives a VRML configuration file searched from the database(15), forms a VRML scene, and then sends it to the part(12). An application program part(16) receives price data from the database(15), and thereby manages the dynamic formation of the three-dimensional virtual space.
Abstract translation: 目的:提供一种在互联网环境中动态构建三维虚拟空间的方法,使用户能够通过Web浏览器接收虚拟空间,网页浏览器实时支持互联网标准,通过形成虚拟对象和空间, 用户使用具有互联网标准的VRML(虚拟现实建模语言)在服务器中期望的信息。 构成:Web服务器中的输入输出管理部分(12)向客户机(11)提供三维虚拟空间服务。 CGI(计算机图形界面)参数解释器(13)将从用户输入的信息解释为CGI参数,从而创建搜索数据所需的查询。 响应于创建的查询,在数据库(15)中搜索该数据。 VRML场景管理部件(14)从数据库(15)接收搜索到的VRML配置文件,形成VRML场景,然后将其发送到部分(12)。 应用程序部分(16)从数据库(15)接收价格数据,从而管理三维虚拟空间的动态形成。
-
公开(公告)号:KR1019990032183A
公开(公告)日:1999-05-06
申请号:KR1019970053158
申请日:1997-10-16
Applicant: 한국전자통신연구원
IPC: G06F3/14
Abstract: 본 발명은 웹 데이터베이스를 위한 하이퍼텍스트의 시각적 설계 방법에 관한 것으로, 서버의 데이터베이스 시스템과 웹 서버의 디렉토리들을 설정하는 초기화 단계와, 그래프(graph) 구조의 하이퍼텍스트(hypertext) 데이터를 설계하는 단계와, 설계된 상기의 그래프의 노드(node)들 중 정적(static) 문서인 것들을 시각적인 방식으로 편집하는 단계와, 남아있는 그래프의 노드들인 동적 문서의 원형(prototype) 을 시각적인 방식으로 편집하는 단계와, 동적 문서의 내에서 데이터베이스의 결과가 나타나는 부분을 앞에서 정의된 서버의 데이터베이스 시스템에 맞추어 연결하는 단계와, 세부 편집이 끝난 각 노드들을 가지는 그래프 구조를 기반으로 FastCGI 소스 코드를 가지는 응용 서버 프로그램 소스를 생성하는 단계와 그리고 생성된 문서들과 코드들을 정련(refinem ent)하는 단계로 구성되어 웹 상의 데이터베이스 통로(gateway)를 시각적인 프로그래밍 방법을 통해 개발할 수 있게 하는 환경을 제공한다.
-
公开(公告)号:KR1020000037595A
公开(公告)日:2000-07-05
申请号:KR1019980052222
申请日:1998-12-01
Applicant: 한국전자통신연구원
IPC: H04L12/58
CPC classification number: G06Q30/0633
Abstract: PURPOSE: A system and a method for automatically indexing product information of online stores are provided to enable an online comparison shopping around the stores on web sites, by fetching the product information including price data to store it as one file, filtering noises in the file and then automatically extracting the product information from the filtered file. CONSTITUTION: An electronic transaction information collector(11) gathers hyper text markup language(HTML) documents of online shops that include product information, and stores them in a HTML document memory(12). A HTML filter(13) filters the gathered documents and a cost information arranger(14) converts the filtered documents to be suitable for a system extracting the product information and including a formal information arranger(15) and a heuristic interpreter(16). The arranger(15) extracts the product information by calling an analyzing module if the type of the documents correspond to a preliminary analyzed type. The interpreter(16) extracts the product information from the documents from which the arranger(15) has failed to extract it. The extracted product information is stored in a memory(21).
Abstract translation: 目的:提供一种用于自动索引网上商店产品信息的系统和方法,以便通过在网站上的商店进行在线比较购物,通过获取包含价格数据的产品信息将其存储为一个文件,过滤文件中的噪声 然后自动从过滤的文件中提取产品信息。 规定:电子交易信息收集器(11)收集包含产品信息的在线商店的超文本标记语言(HTML)文档,并将其存储在HTML文档存储器(12)中。 HTML过滤器(13)过滤所收集的文档,并且成本信息编排器(14)将过滤的文档转换为适于提取产品信息的系统,并且包括形式信息编排器(15)和启发式解释器(16)。 安排者(15)通过调用分析模块来提取产品信息,如果文档的类型对应于初步分析的类型。 解释器(16)从安排者(15)未能提取的文档中提取产品信息。 所提取的产品信息被存储在存储器(21)中。
-
公开(公告)号:KR1019990031784A
公开(公告)日:1999-05-06
申请号:KR1019970052617
申请日:1997-10-14
Applicant: 한국전자통신연구원
IPC: G06F17/30
Abstract: 본 발명은 전자상거래 상품정보 검색용 자연언어 질의어 처리방법에 관한 것으로서, 사용자의 웹브라우저와 전자상거래정보 서비스 시스템내의 웹서버를 통하여 전달된 자연언어 질의어를 추출하고 토큰을 분리하며, 상품 가격을 나타내는 구간명시형, 구간추략형, 최소최대형의 용어가 존재하는지 조사하여 존재할 경우 기억장소 배열에 저장한 후 해당 토큰을 제거하고, 각 토큰에서 조사를 제거한 후 불용어 토큰을 제거하는 검색대상 용어 추출단계와, 추출된 각각의 용어에 대하여 전자상거래정보 서비스 용어 테이블을 검색하여 각 용어의 특성을 파악하고, 제조회사명, 상품분류명, 상품명, 주요사양에 대하여 동의어/유사어/외래어를 확장한 후, 질의어에 대한 정규식을 생성하는 단계와, 생성된 정규식을 관계형데이터베이스관리시스템의 질� �어인 구조적 질의어로 변환하여, 전자상거래정보 서비스 상품 테이블을 검색하여 제조회사명, 상품분류명, 상품명, 주요사양, 모델번호, 가격, 문서위치와 같은 7가지 상품정보를 가져오고, 문서위치로부터 홈페이지 문서위치를 추출하여 검색결과에 덮붙인 후 HTML 문서를 동적 생성하여 웹서버를 통하여 사용자에게 제공하는 검색결과 생성단계로 구성함으로써, 자연언어 질의어에 대한 정확한 상품정보 추출 및 빠른 처리시간을 통하여 고품질의 검색서비스를 제공하는 효과가 있다.
-
公开(公告)号:KR100283103B1
公开(公告)日:2001-05-02
申请号:KR1019980052222
申请日:1998-12-01
Applicant: 한국전자통신연구원
IPC: H04L12/58
Abstract: 본 발명은 인터넷의 웹 상에서 하이퍼 텍스트 마크업 랭귀지(Hyper Text Markup Language: HTML) 문서의 형태로 존재하는 온라인 상점들의 제품에 관한 HTML 문서들을 가져와서, 〈사이트 ID, 회사명, 제품 분류명, 주요 기능, 상품명, 모델명, 가격, URL〉로 구성되는 제품 정보를 추출하는 온라인 상점 상의 제품 정보 자동 색인 방법 및 시스템에 관한 것이다.
본 발명은 온라인 상점들의 HTML 문서들을 로봇으로 가져오는 단계와, HTML 문서들에서 가격 정보를 찾아내고 그 밖의 필요한 정보들만 남기고 불필요한 정보들을 제거하는 전처리(preprocessing) 단계와, 전처리 단계의 결과를 읽어들여 페이지의 유형을 판별하는 단계와 판별된 각 유형에 맞는 알고리즘을 적용하여 제품 정보를 추출하는 단계와 각각의 유형에 따른 알고리즘을 적용하고 남은 가격 정보에 대해 블라인드 탐색(blind search)을 통해 제품 정보를 추출하는 단계로 이루어져, 온라인 상점들의 제품 정보를 자동으로 추출함으로써 기존의 디렉토리 서비스에서 웹 상의 온라인 상점들에 대한 비교 구매를 가능하게 하는 온라인 상점 상의 제품 정보 자동 색인 방법 및 시스템을 제공한다.-
公开(公告)号:KR1020000038979A
公开(公告)日:2000-07-05
申请号:KR1019980054167
申请日:1998-12-10
Applicant: 한국전자통신연구원
IPC: H04L12/00
CPC classification number: G06F17/30867 , G06F17/30014 , G06F17/30905 , G06F17/40 , G06Q50/10 , H04L67/02
Abstract: PURPOSE: A system supporting a mobile computation for collecting news information and a method for the same are provided to gather sections of an online newspaper and magazine on web sites of the internet, and extract desired news records from the gathered sections in real time, by allowing a developer to indicate a target of the extracted news records easily and simply in response to variance of the web sites. CONSTITUTION: A hypertext transfer protocol(HTTP) communication part(10) collects each section supported with a hypertext markup language(HTML) document from the online newspaper and magazine web sites on the internet. A noise removing part(20) removes a noise in the document collected by the HTTP communication part(10). A pattern input part(40) provides a regular pattern requested by a developer or user. A pattern matching part(30) converts the web document without the noise to a regular string, and matches the converted regular string with the inputted regular pattern and thereby extracts the newspaper records. A personal digital assistance(PDA) installing part(50) supplies the extracted newspaper records to a user and automatically installs the records selected by the user in a PDA(60).
Abstract translation: 目的:提供支持移动计算收集新闻信息的系统及其方法,以收集互联网网站上的在线报纸和杂志的部分,并从收集的部分实时提取所需的新闻记录,由 允许开发者根据网站的差异轻松简单地指出所提取的新闻记录的目标。 规定:超文本传输协议(HTTP)通信部分(10)通过互联网上的在线报纸和杂志网站收集由超文本标记语言(HTML)文档支持的每个部分。 噪声去除部件(20)去除由HTTP通信部件(10)收集的文档中的噪声。 图案输入部分(40)提供由开发者或用户请求的规则图案。 模式匹配部件(30)将没有噪声的web文档转换成常规字符串,并将转换后的常规字符串与输入的规则模式相匹配,从而提取报纸记录。 个人数字助理(PDA)安装部件(50)将所提取的报纸记录提供给用户,并将用户选择的记录自动安装在PDA(60)中。
-
-
-
-
-
-
-
-