Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind

    公开(公告)号:DE102013205819B4

    公开(公告)日:2020-04-02

    申请号:DE102013205819

    申请日:2013-04-03

    Applicant: IBM

    Abstract: Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind.Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert.

    Verfahren, Einheit und Computerprogramm zum Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit bei Elementen, die in einem Textdatenstrom enthalten sind

    公开(公告)号:DE102013205819A1

    公开(公告)日:2013-10-17

    申请号:DE102013205819

    申请日:2013-04-03

    Applicant: IBM

    Abstract: Problemstellung Die vorliegende Erfindung bezieht sich auf ein Verfahren, eine Einheit und ein Computerprogramm für das effiziente Identifizieren von Elementen mit einer hohen Auftrittshäufigkeit innerhalb von Elementen, die in einem umfangreichen Textdatenstrom enthalten sind. Mittel zur Problemlösung Identifizierungsdaten zum Identifizieren eines Elements und eines Zählwerts von Elementen werden in einer höheren Speicherebene gespeichert, und lediglich Identifizierungsdaten werden in einer tieferen Speicherebene unterhalb der höheren Speicherebene gespeichert. Eine Textdatenstrom-Eingabe wird empfangen, das Inkrement des Zählwerts eines Elements wird als Reaktion auf das Speichern von Identifizierungsdaten für ein Element, das in einem Intervall enthalten ist, der von der empfangenen Textdatenstrom-Eingabe getrennt ist, in dem Speicher einer höheren Ebene erhöht, die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion auf das Speichern in der tieferen Speicherebene in die höhere Speicherebene übertragen, und die Identifizierungsdaten für das Element werden gemeinsam mit dem anfänglichen Zählwert als Reaktion darauf, dass sie in keiner Ebene gespeichert sind, in der höheren Speicherebene neu gespeichert.

Patent Agency Ranking