-
公开(公告)号:GB2524073A
公开(公告)日:2015-09-16
申请号:GB201404522
申请日:2014-03-14
Applicant: IBM
Inventor: HAMPP-BAHNMUELLER THOMAS , BENTON BRENT J , MORRIS DANA , SCHIEBER DIETER , PITTNER DANIEL , SCHAECK THOMAS
Abstract: A method comprises generating a hierarchy of data entities, comprising nodes (301-307) and connected by edges (127), each edge of the edges being assigned an edge weight value based on a dependency category, such as linked, nested, version, tagged etc. between the two data entities. Each node of the nodes (301-307) is assigned a first access rating value based on, for example, the number of visits, a rating etc. One of the nodes (301-307) is selected as a seed node (305), and for each edge of the linked data structure (126, 300) calculating a rating residue value as the difference between the two first access rating values of the nodes connected by the edge. The linked data structure (126, 300) is then traversed starting from the seed node and for each edge traversed starting from a source node to a destination node calculating for the destination node a second access rating value using the at least one edge weight value of the edge and the first access rating value of the destination node and the source node. This is repeated until the residue values converge. Nodes which have access values meeting a criterion are then removed. The data entities relate to media data which is shared between users, such as wikis, blogs, forums, profiles etc.
-
公开(公告)号:DE112020002465T5
公开(公告)日:2022-02-17
申请号:DE112020002465
申请日:2020-07-01
Applicant: IBM
Inventor: BAESSLER MICHAEL , HAMPP-BAHNMUELLER THOMAS , JOSEPH JOJO , PETRENKO PAVLO
IPC: G06F16/335 , G06F16/9537 , G06F21/60 , G06F40/279
Abstract: Die Erfindung betrifft ein Verfahren zum Bereitstellen eines oder mehrerer Zufallsabtastdokumente aus einem Korpus von Dokumenten unter Verwendung einer Suchmaschinenschnittstelle einer Suchmaschine. Das Bereitstellen jedes der Zufallsabtastdokumente weist ein zufälliges Auswählen einer zeitbezogenen Gruppierung (bucket) aus einem Satz von zeitbezogenen Gruppierungen auf. Eine Suchabfrage wird an die Suchmaschinenschnittstelle gesendet und definiert eine Suche nach Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Als Reaktion auf das Senden der Suchabfrage wird von der Suchmaschinenschnittstelle ein Suchergebnis empfangen. Das Suchergebnis weist einen Satz aus allen Dokumenten des Korpus mit Zeitstempeln innerhalb des Zeitfensters auf, das durch die zufällig ausgewählte zeitbezogene Gruppierung definiert ist. Des Weiteren wird eines der Dokumente, aus denen der empfangene Satz von Dokumenten besteht, zufällig ausgewählt.
-
公开(公告)号:GB2520936A
公开(公告)日:2015-06-10
申请号:GB201321286
申请日:2013-12-03
Applicant: IBM
Inventor: HAMPP-BAHNMUELLER THOMAS , JIANG PENG HUI , JIANG PI JUN , XU YAN
IPC: G06F17/30
Abstract: A search query is performed by providing a first data structure containing information about the correlation between a specific search term attribute and at least one block ID of a block being part of a document, identical blocks having the same block ID; providing a second data structure containing information about the correlation between blocks and documents; processing the search query by searching the first data structure for at least one search term attribute and mapping that to the second data structure to retrieve the desired document or documents. The first data structure is preferably an index, each entry being associated with a specific search term attribute and the second data structure is preferably a list of which block is contained in which document.
-
-