-
公开(公告)号:DE102012224488A1
公开(公告)日:2013-07-18
申请号:DE102012224488
申请日:2012-12-28
Applicant: IBM
Inventor: ITOH NOBUYASU , YAMAGUCHI YUTO , NISHIMURA MASAFUMI
IPC: G06F40/00
Abstract: Problem Eine Technologie zur Entnahme eines themenfremden Teils aus einem Gespräch bereitzustellen. Lösungsmittel Das System zur Entnahme eines themenfremden Teils zur Entnahme eines themenfremden Teils aus einem Gespräch beinhaltet: einen ersten Korpus, der Dokumente aus einer Vielzahl von Gebieten enthält; einen zweiten Korpus, der nur Dokumente aus einem Gebiet enthält, zu dem das Gespräch gehört; ein Ermittlungsmittel zur Ermittlung eines Wortes als ein Untergrenzengegenstandswort, für das der IDF-Wert für den ersten Korpus und der IDF-Wert für den zweiten Korpus jeweils unterhalb eines ersten bestimmten Schwellenwerts liegen; ein Anzahlberechnungsteil zur Berechnung eines TF-IDF-Wertes als Anzahl für jedes im vorgenannten zweiten Korpus enthaltene Wort, wobei der vorgenannte Anzahlberechnungsteil für das vorgenannte Untergrenzengegenstandswort eine konstante Einstellung einer Untergrenze anstelle eines TF-IDF-Wertes verwendet; ein Herausschneideteil zum sequenziellen Herausschneiden von der Verarbeitung unterzogenen Intervallen aus den Textdaten, die den Inhalt des vorgenannten Gesprächs darstellen; und ein Entnahmeteil zur Entnahme eines Intervalls, bei dem der Durchschnittswert der in dem vorgenannten herausgeschnittenen Intervall enthaltenen vorgenannten Anzahl von Wörtern größer ist als ein zweiter bestimmter Schwellenwert, als themenfremden Teil.
-
公开(公告)号:DE3776783D1
公开(公告)日:1992-03-26
申请号:DE3776783
申请日:1987-12-23
Applicant: IBM
Inventor: ITOH NOBUYASU , TAKAHASHI HIROYASU GOH GREENHI
Abstract: A spelling error correcting system comprises means for storing a number of correctly spelled words, each of which can be accessed by one or more combinations of character categories, each combination consisting of m (m is a constant satisfying m
-