유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법
    1.
    发明授权
    유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법 失效
    使用基于URL子关系的相似度重建的有效主体搜索方法

    公开(公告)号:KR100490748B1

    公开(公告)日:2005-05-24

    申请号:KR1020020019647

    申请日:2002-04-11

    CPC classification number: G06F17/30864

    Abstract: 본 발명은 URL 포함 관계에 기반한 유사도 재계산을 통한 효과적인 홈페이지 검색방법에 관한 것이다. 본 발명은 같은 홈페이지에 속하는 웹 문서들의 URL들 간의 포함 관계를 이용하여 웹 문서들 중에서 그 홈페이지의 엔트리 포인트를 찾아내는 기술이다. 본 발명의 핵심은 어떤 문서의 URL이 다른 문서의 URL의 부분열(substring)이면 전자가 후자보다 홈페이지 즉 엔트리 포인트가 될 가능성이 높다는 성질을 이용한 것이다. 즉, 본 발명은 웹 검색에 있어서 종래 정보 검색 기법을 개선하여 홈페이지의 엔트리 포인트가 되는 페이지를 다른 문서들 보다 우선하여 검색되도록 함으로써, 사용자들이 검색된 웹 문서의 URL을 일일이 방문하지 않고도 검색된 웹 문서가 홈페이지인지 여부를 쉽게 알 수 있게 되는 이점이 있으며, 또한 사용자가 입력한 검색 질의가 포함하는 단어를 가지는 웹 문서들의 사이트 정보 즉 홈페이지를 우선적으로 검색하여 줌으로써 홈페이지를 통해서 더욱 많은 정보를 얻을 수 있게 되어 검색이 보다 편리해지는 이점이 있다.

    유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법
    2.
    发明公开
    유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법 失效
    通过网址重建来有效搜索主页的方法,包括基于关系的相似性

    公开(公告)号:KR1020030080826A

    公开(公告)日:2003-10-17

    申请号:KR1020020019647

    申请日:2002-04-11

    CPC classification number: G06F17/30864

    Abstract: PURPOSE: A method for effectively searching a homepage through the recalculation of the URL(Uniform Resource Locator) included relation based similarity is provided to easily know whether a searched web document is the homepage or not without visiting the URL of the searched web document. CONSTITUTION: A text is extracted from the searched web document according to a query from a user(S400). An index file for performing the web searching is generated by indexing the extracted text(S406). The web document and a searching result ranking the web document by considering the weight of a searching query are output. The similarity for the ranked searching result web documents is recalculated by using the URL included relation of the searched web document. The web document corresponding to the homepage is displayed with a high priority by rearranging the rank of the web document through the recalculated similarity.

    Abstract translation: 目的:提供一种通过重新计算URL(统一资源定位器)包括基于关联的相似度来有效搜索主页的方法,以便在不访问所搜索的网络文档的URL的情况下容易地知道所搜索的网页文档是否是主页。 构成:根据来自用户的查询从所搜索的web文档中提取文本(S400)。 通过索引提取的文本来生成用于执行网页搜索的索引文件(S406)。 输出Web文档和通过考虑搜索查询的权重对Web文档排序的搜索结果。 通过使用所搜索的web文档的URL包括的关系来重新计算排名的搜索结果web文档的相似性。 通过重新计算相似度来重新排列Web文档的等级,通过高优先级显示对应于主页的web文档。

Patent Agency Ranking