-
公开(公告)号:DE102013205737A1
公开(公告)日:2013-12-12
申请号:DE102013205737
申请日:2013-04-02
Applicant: IBM
Inventor: CASTELLI VITTORIO , FLORIAN RADU , LUO XIAOQIANG , RAGHAVAN HEMA
IPC: G06F40/00
Abstract: Bereitgestellt wird ein Verfahren zum automatischen Extrahieren und Organisieren von Informationen aus einer Vielzahl von Datenquellen durch eine Verarbeitungseinheit. Eine Informationenextraktions-Pipeline zum Verarbeiten von natürlicher Sprache, die eine automatische Erkennung von Entitäten aufweist, wird auf die Datenquellen angewendet. Informationen über erkannte Entitäten werden identifiziert, indem Produkte der Pipeline zum Verarbeiten von natürlicher Sprache analysiert werden. Identifizierte Informationen werden in Äquivalenzklassen gruppiert, die äquivalente Informationen enthalten. Mindestens eine anzeigbare Darstellung der Äquivalenzklassen wird erstellt. Eine Reihenfolge, in der die mindestens eine anzeigbare Darstellung angezeigt wird, wird berechnet. Eine kombinierte Darstellung der Äquivalenzklassen, die die Reihenfolge einhält, in der die anzeigbare Darstellung angezeigt wird, wird erzeugt.