SUCHEN VON MEHRSPRACHIGEN DOKUMENTEN AUF GRUNDLAGE EINER EXTRAKTION DER DOKUMENTENSTRUKTUR

    公开(公告)号:DE112018005272T5

    公开(公告)日:2020-07-02

    申请号:DE112018005272

    申请日:2018-11-20

    Applicant: IBM

    Abstract: Bereitgestellt wird ein Ansatz für ein Suchen von mehrsprachigen Dokumenten. Strukturkomponenten werden aus mehrsprachigen Dokumenten extrahiert. Auf Grundlage der extrahierten Komponenten werden die Dokumente in Klassifikationen gruppiert, die entsprechende Sätze von in verschiedenen entsprechenden natürlichen Sprachen ausgedrückten Dokumenten enthalten. Eine natürliche Sprache in einer Abfrage wird erkannt. Eines der Dokumente wird auf Grundlage dessen ausgewählt, dass das Dokument Inhalt aufweist, der durch die Abfrage angegeben wird, und dass die natürliche Sprache des Dokuments mit der erkannten natürlichen Sprache übereinstimmt. Strukturkomponenten des ausgewählten Dokuments werden extrahiert. Auf Grundlage der extrahierten Strukturkomponenten des ausgewählten Dokuments wird eine der Klassifikationen als das ausgewählte Dokument enthaltend identifiziert. Ein oder mehrere weitere Dokumente in der Klassifikation werden identifiziert und als Inhalt aufweisend vorgelegt, der mit dem Inhalt des ausgewählten Dokuments übereinstimmt. Die eine oder die mehreren Sprachen des einen oder der mehreren weiteren Dokumente unterscheiden sich jeweils von der natürlichen Sprache des ausgewählten Dokuments.

Patent Agency Ranking