KONTEXTABHÄNGIGES DATA-MINING
    1.
    发明专利

    公开(公告)号:DE112020002886T5

    公开(公告)日:2022-02-24

    申请号:DE112020002886

    申请日:2020-05-27

    Applicant: IBM

    Abstract: Ein Verfahren für ein kontextabhängiges Data-Mining eines Textdokuments, wobei das Verfahren Folgendes umfasst: Empfangen einer Liste von Wörtern, die aus einer Suchanfrage syntaktisch analysiert und vorverarbeitet wurden; Berechnen einer zugehörigen verteilten Einbettungsdarstellung für jedes Wort in der Wortliste mittels eines Worteinbettungsmodells des abgefragten Textdokuments; Zusammenführen der zugehörigen verteilten Einbettungsdarstellungen aller Wörter in der Wortliste, um die Suchanfrage mit einer einzigen Einbettung darzustellen, mittels eines Durchschnitts aller zugehörigen verteilten Einbettungsdarstellungen oder eines Maximums aller zugehörigen verteilten Einbettungsdarstellungen; Abrufen einer Rangliste von Dokumentensegmenten von N Zeilen, die der zusammengeführten Worteinbettungsdarstellung der Suchanfrage ähnlich sind, wobei N eine positive ganze Zahl ist, die vom Benutzer bereitgestellt wird; und Zurückliefern der Liste der abgerufenen Segmente an einen Benutzer.

Patent Agency Ranking