-
公开(公告)号:DE112020002886T5
公开(公告)日:2022-02-24
申请号:DE112020002886
申请日:2020-05-27
Applicant: IBM
Inventor: DOMENICONI GIACOMO , LEE EUN KYUNG , MORARI ALESSANDRO
Abstract: Ein Verfahren für ein kontextabhängiges Data-Mining eines Textdokuments, wobei das Verfahren Folgendes umfasst: Empfangen einer Liste von Wörtern, die aus einer Suchanfrage syntaktisch analysiert und vorverarbeitet wurden; Berechnen einer zugehörigen verteilten Einbettungsdarstellung für jedes Wort in der Wortliste mittels eines Worteinbettungsmodells des abgefragten Textdokuments; Zusammenführen der zugehörigen verteilten Einbettungsdarstellungen aller Wörter in der Wortliste, um die Suchanfrage mit einer einzigen Einbettung darzustellen, mittels eines Durchschnitts aller zugehörigen verteilten Einbettungsdarstellungen oder eines Maximums aller zugehörigen verteilten Einbettungsdarstellungen; Abrufen einer Rangliste von Dokumentensegmenten von N Zeilen, die der zusammengeführten Worteinbettungsdarstellung der Suchanfrage ähnlich sind, wobei N eine positive ganze Zahl ist, die vom Benutzer bereitgestellt wird; und Zurückliefern der Liste der abgerufenen Segmente an einen Benutzer.