-
公开(公告)号:DE102014103072A1
公开(公告)日:2014-09-11
申请号:DE102014103072
申请日:2014-03-07
Applicant: IBM
Inventor: BOUDREAU MICHAEL , MOORE BRAD , MOUSAAD AHMED , TRIM CRAIG M
IPC: G06F17/30
Abstract: Ein Verfahren und System zum Analysieren. Das Verfahren enthält ein Erzeugen eines n-Gramm-Modells einer Domäne und ein Berechnen einer tf-idf-Häufigkeit, die den n-Grammen des n-Gramm-Modells zugehörig ist. Eine Liste, die eine häufig auftretende Gruppe von n-Grammen enthält, wird auf der Grundlage der tf-idf-Häufigkeit erzeugt. Die häufig auftretende Gruppe von n-Grammen wird zu einer tiefen Parserkomponente übertragen, und eine tiefe Analysenausgabe wird aus der tiefen Parserkomponente erzeugt. Die tiefe Analysenausgabe wird in einem Zwischenspeicher gespeichert, und ein Prozessor überprüft, ob eine angegebene Textwortfolge der tiefen Analysenausgabe in dem Zwischenspeicher verfügbar ist.