ZUFALLSABTASTEN AUS EINER SUCHMASCHINE

    公开(公告)号:DE112020002465T5

    公开(公告)日:2022-02-17

    申请号:DE112020002465

    申请日:2020-07-01

    Applicant: IBM

    Abstract: Die Erfindung betrifft ein Verfahren zum Bereitstellen eines oder mehrerer Zufallsabtastdokumente aus einem Korpus von Dokumenten unter Verwendung einer Suchmaschinenschnittstelle einer Suchmaschine. Das Bereitstellen jedes der Zufallsabtastdokumente weist ein zufälliges Auswählen einer zeitbezogenen Gruppierung (bucket) aus einem Satz von zeitbezogenen Gruppierungen auf. Eine Suchabfrage wird an die Suchmaschinenschnittstelle gesendet und definiert eine Suche nach Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Als Reaktion auf das Senden der Suchabfrage wird von der Suchmaschinenschnittstelle ein Suchergebnis empfangen. Das Suchergebnis weist einen Satz aus allen Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters auf, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Des Weiteren wird eines der Dokumente, aus denen der empfangene Satz von Dokumenten besteht, zufällig ausgewählt.

Patent Agency Ranking