SCENARIO-BASED CRAWLING
    1.
    发明申请
    SCENARIO-BASED CRAWLING 审中-公开
    基于情景的克隆

    公开(公告)号:WO2013097561A9

    公开(公告)日:2014-05-30

    申请号:PCT/CN2012084954

    申请日:2012-11-21

    CPC classification number: G06F17/30864

    Abstract: An interactive session can be established between a crawling bot and a Web site. The crawling bot can defines a session state representing a user state for interacting with one or more Web sites, a set of conditions, and a set of scenarios to be selectively activated based on whether the set of conditions are satisfied. The crawling bot can receive content from the Web site during the interactive session. The crawling bot can parse the content from the Web site and can matching the parsed content against a previously defined set of items to determine whether the content matching condition is satisfied. If the content matching condition is satisfied and if the state condition is satisfied, the crawling bot, activating of the scenarios defined by the crawling bot can be active, which is not activated if the content matching condition and the state condition are not satisfied.

    Abstract translation: 可以在爬网机器人和网站之间建立交互式会话。 爬行机器人可以基于是否满足一组条件来定义表示用于与一个或多个网站进行交互的用户状态的会话状态,一组条件和一组场景,以被选择性地激活。 爬网机器人可以在互动会话期间从网站接收内容。 抓取机器人可以从网站解析内容,并且可以将解析的内容与先前定义的项目集合进行匹配,以确定内容匹配条件是否满足。 如果满足内容匹配条件,并且如果满足状态条件,则爬行机器人,由爬行机器人定义的场景的激活可以是活动的,如果内容匹配条件和状态条件不满足,则不激活。

    Crawler-Suche auf der Grundlage eines Szenarios

    公开(公告)号:DE112012005528T5

    公开(公告)日:2014-10-09

    申请号:DE112012005528

    申请日:2012-11-21

    Applicant: IBM

    Abstract: Eine interaktive Sitzung zwischen einem Bot-Programm für die Crawler-Suche und einer Website kann hergestellt werden. Das Bot-Programm für die Crawler-Suche kann einen Sitzungszustand, der für einen Benutzerzustand zum Interagieren mit einer oder mehreren Websites steht, einen Satz von Bedingungen und einen Satz von Szenarien definieren, die abhängig davon, ob der Satz von Bedingungen erfüllt ist, wahlweise aktiviert werden. Während der interaktiven Sitzung kann das Bot-Programm für die Crawler-Suche Inhalt von der Website empfangen. Das Bot-Programm für die Crawler-Suche kann den von der Website stammenden Inhalt analysieren und den analysierten Inhalt mit einem zuvor definierten Satz von Elementen vergleichen, um zu ermitteln, ob die Bedingung für die Inhaltsübereinstimmung erfüllt ist. Wenn die Bedingung für die Inhaltsübereinstimmung erfüllt ist und die Zustandsbedingung erfüllt ist, kann das Bot-Programm für die Crawler-Suche die von dem Bot-Programm für die Crawler-Suche definierten Szenarien aktivieren, was nicht der Fall ist, wenn die Bedingung für die Inhaltsübereinstimmung und die Zustandsbedingung nicht erfüllt sind.

Patent Agency Ranking