Abfragen und Integrieren strukturierter und unstrukturierter Daten

    公开(公告)号:DE102013209868A1

    公开(公告)日:2013-12-12

    申请号:DE102013209868

    申请日:2013-05-28

    Applicant: IBM

    Abstract: Ein mittels Computer realisiertes Verfahren, System und ein mittels Computer realisierter Herstellungsgegenstand zum Abfragen und Integrieren strukturierter und unstrukturierter Daten. Das Verfahren weist auf: Empfangen von Objektinformationen, die unter Verwendung eines domänenunabhängigen Systems zur Extraktion von Informationen aus einer ersten Menge unstrukturierter Daten extrahiert wurden, wobei die Objektinformationen Informationen über Beziehungen zwischen einem ersten Objekt und einem zweiten Objekt der ersten Menge unstrukturierter Daten aufweisen; Erkennen eines Musters auf der Grundlage der Beziehungsinformationen und Erzeugen eines Schemas für die erste Menge unstrukturierter Daten auf der Grundlage des Musters; und Verknüpfen eines Elements des erzeugten Schemas mit (i) einem Objekt einer zweiten Menge unstrukturierter Daten oder mit (ii) einem Schemaelement einer bestehenden Menge strukturierter Daten, wenn eine ausreichende Gesamtähnlichkeit zwischen dem erzeugten Schemaelement und entweder dem zweiten unstrukturierten Datenobjekt oder dem Schemaelement der bestehenden strukturierten Daten vorliegt.

    Abfragen und Integrieren strukturierter und unstrukturierter Daten

    公开(公告)号:DE102013209868B4

    公开(公告)日:2018-06-21

    申请号:DE102013209868

    申请日:2013-05-28

    Applicant: IBM

    Abstract: [0067] Ein mittels Computer realisiertes Verfahren, System und ein mittels Computer realisierter Herstellungsgegenstand zum Abfragen und Integrieren strukturierter und unstrukturierter Daten. Das Verfahren weist auf: Empfangen von Objektinformationen, die unter Verwendung eines domänenunabhängigen Systems zur Extraktion von Informationen aus einer ersten Menge unstrukturierter Daten extrahiert wurden, wobei die Objektinformationen Informationen über Beziehungen zwischen einem ersten Objekt und einem zweiten Objekt der ersten Menge unstrukturierter Daten aufweisen; Erkennen eines Musters auf der Grundlage der Beziehungsinformationen und Erzeugen eines Schemas für die erste Menge unstrukturierter Daten auf der Grundlage des Musters; und Verknüpfen eines Elements des erzeugten Schemas mit (i) einem Objekt einer zweiten Menge unstrukturierter Daten oder mit (ii) einem Schemaelement einer bestehenden Menge strukturierter Daten, wenn eine ausreichende Gesamtähnlichkeit zwischen dem erzeugten Schemaelement und entweder dem zweiten unstrukturierten Datenobjekt oder dem Schemaelement der bestehenden strukturierten Daten vorliegt.

    Creating benchmark graph data
    5.
    发明专利

    公开(公告)号:GB2501439A

    公开(公告)日:2013-10-23

    申请号:GB201314292

    申请日:2012-01-11

    Applicant: IBM

    Abstract: According to an aspect of the present principles, a method is provided for generating resource description framework benchmarks. The method includes deriving (350) a resultant benchmark dataset with a user specified size and a user specified coherence from and with respect to an input dataset of a given size and a given coherence by determining (340) which triples of subject-property-object to add to the input dataset or remove from the input dataset to derive the resultant benchmark dataset.

Patent Agency Ranking