Verteiltes Zusammenführen von Dateien

    公开(公告)号:DE102016216843B4

    公开(公告)日:2024-12-19

    申请号:DE102016216843

    申请日:2016-09-06

    Applicant: IBM

    Abstract: Verfahren zum Betreiben einer verteilten Datenbank (100), wobei das Verfahren aufweist:Ausführen eines Befehlssatzes (118) zum stromorientierten Zusammenführen ununterbrochener, kontinuierlicher Datenströme mehrerer Sensoren eines Sensornetzwerks, um ein Quellen-Element mit einem Ziel-Element zusammenzuführen, wobei das Ausführen durch mehrere Datenverarbeitungsknoten (102, 102', 102'', 102''') in der verteilten Datenbank erfolgt, wobei die mehreren Datenverarbeitungsknoten zum Umsetzen von Speichern und Berechnen für ein System (114) zur Datenbankverwaltung dienen, wobei die mehreren Datenverarbeitungsknoten zum Austauschen von Daten über ein Netzwerk verbunden sind, und das System (114) zur Datenbankverwaltung zum Verwalten wenigstens einer Quellen-Datei (110) und einer Ziel-Datei (112), wobei die Ziel-Datei (112) über die mehreren Datenverarbeitungsknoten (102, 102', 102'', 102''') verteilt gespeichert wird, die Quellen-Datei mehrere Quellen-Elemente aufweist, die Ziel-Datei mehrere Ziel-Elemente aufweist, wobei das Ausführen umfasst:Prüfen (200) auf eine Übereinstimmungsbedingung (116) zwischen einem Quellen-Element, das aus den mehreren Quellen-Elementen ausgewählt wird, und einem der mehreren Ziel-Elemente;Berechnen (202) eines Befehlssatzes (118) einer zusammengeführten Befehlsliste, wobei die Befehlsliste eine Liste von Befehlen zum stromorientierten Zusammenführen ununterbrochener, kontinuierlicher Datenströme des Quellen-Elements mit dem Ziel-Element unter Verwendung der Übereinstimmungsbedingung (116) aufweist; undwiederholtes Ausführen (204) des Befehlssatzes (118) zum stromorientierten Zusammenführen (204) ununterbrochener, kontinuierlicher Datenströme des Quellen-Elements mit dem Ziel-Element vor Prüfen (200) der Übereinstimmungsbedingung (116) zwischen einem nächsten Quellen-Element, das aus mehreren Quellen-Elementen ausgewählt wird, und einem der mehreren Ziel-Elemente,wobei das wiederholte Ausführen (204) des Befehlssatzes (118) weiter umfasst:Reduzieren einer Menge an Rechenressourcen, die erforderlich sind, um die Quellen-Datei (110) mit der Ziel-Datei (112) zusammenzuführen, undauf der Grundlage von Daten eines Sensors des Sensornetzwerks, Anpassen der Daten von einem weiteren Sensor des Sensornetzwerks,wobei es sich bei der verteilten Datenbank (100) um eine verteilte relationale Datenbank handelt, bei der Quellen-Datei (110) um eine Quellen-Tabelle handelt, wobei es sich bei der Quellen-Tabelle um wenigstens einen kontinuierlichen Datenstrom handelt, der durch einen Sensor des Sensornetzwerks bereitgestellt wird, bei der Ziel-Datei (112) um eine Ziel-Tabelle handelt, bei den mehreren Quellen-Elementen um mehrere Quellen-Zeilen handelt, bei den mehreren Ziel-Elementen um mehrere Ziel-Zeilen handelt, bei dem Quellen-Element um eine Quellen-Zeile handelt und bei dem Befehlssatz (118) um eine Befehlsspalte handelt.

    Verteiltes Zusammenführen von Dateien

    公开(公告)号:DE102016216843A1

    公开(公告)日:2017-03-23

    申请号:DE102016216843

    申请日:2016-09-06

    Applicant: IBM

    Abstract: Die Erfindung bezieht sich auf ein Verfahren zum Betreiben einer verteilten Datenbank. Die verteilte Datenbank weist auf: mehrere Datenverarbeitungsknoten zum Umsetzen von Speichern und Berechnen für ein System zur Datenbankverwaltung, wobei die mehreren Datenverarbeitungsknoten zum Austauschen von Daten über ein Netzwerk verbunden sind, das System zur Datenbankverwaltung zum Verwalten wenigstens einer Quellen-Datei und einem Ziel-Datei, wobei die Ziel-Datei über die mehreren Datenverarbeitungsknoten verteilt gespeichert ist, die Quellen-Datei mehrere Quellen-Elemente aufweist, die Ziel-Datei mehrere Ziel-Elemente aufweist. Das Verfahren weist wiederholtes Verwenden der mehreren Datenverarbeitungsknoten auf zum: Prüfen auf eine Übereinstimmungsbedingung zwischen einem Quellen-Element, das aus den mehreren Quellen-Elementen ausgewählt wird, und einem der mehreren Ziel-Elemente; Berechnen eines Befehlssatzes einer Zusammenführungs-Befehlsliste, wobei die Befehlsliste eine liste von Befehlen aufweist zum Zusammenführen des Quellen-Elements mit dem Ziel-Element unter Verwendung der Übereinstimmungsbedingung; und Ausführen des Befehlssatzes zum Zusammenführen des Quellen-Elements mit der Ziel-Datei vor Prüfen der Übereinstimmungsbedingung zwischen einem nächsten Quellen-Element, das aus den mehreren Quellen-Elementen ausgewählt wird, und einem der mehreren Ziel-Elemente.

    Refining a search request to a content provider

    公开(公告)号:AU2021289542A1

    公开(公告)日:2022-11-10

    申请号:AU2021289542

    申请日:2021-05-19

    Applicant: IBM

    Abstract: A computer-implemented method, a computer program product, and a computer system for refining an initial search request to a content provider. The computer-implemented method includes receiving the initial search request from a user, submitting the initial search request to the content provider, receiving from the content provider a set of sample documents and source identifiers for respective ones of the sample documents, applying a topic model to the set of the sample documents to obtain a topic representation, presenting the topic representation to the user, receiving from the user topic relevance scores for respective ones of the topics, and classifying the data sources according to the topic relevance scores to obtain source relevance scores for respective ones of the data sources. The computer-implemented method further includes, based on the source relevance scores, determining a refined search request having an increased selectivity on documents covering a highest-scoring one of the topics.

Patent Agency Ranking