-
1.
公开(公告)号:DE112018005272T5
公开(公告)日:2020-07-02
申请号:DE112018005272
申请日:2018-11-20
Applicant: IBM
Inventor: TANG XIN , YIN KUN YAN , LI HE , ZHAO XUELIANG , XU XIN
IPC: G06F16/33 , G06F16/93 , G06F40/263
Abstract: Bereitgestellt wird ein Ansatz für ein Suchen von mehrsprachigen Dokumenten. Strukturkomponenten werden aus mehrsprachigen Dokumenten extrahiert. Auf Grundlage der extrahierten Komponenten werden die Dokumente in Klassifikationen gruppiert, die entsprechende Sätze von in verschiedenen entsprechenden natürlichen Sprachen ausgedrückten Dokumenten enthalten. Eine natürliche Sprache in einer Abfrage wird erkannt. Eines der Dokumente wird auf Grundlage dessen ausgewählt, dass das Dokument Inhalt aufweist, der durch die Abfrage angegeben wird, und dass die natürliche Sprache des Dokuments mit der erkannten natürlichen Sprache übereinstimmt. Strukturkomponenten des ausgewählten Dokuments werden extrahiert. Auf Grundlage der extrahierten Strukturkomponenten des ausgewählten Dokuments wird eine der Klassifikationen als das ausgewählte Dokument enthaltend identifiziert. Ein oder mehrere weitere Dokumente in der Klassifikation werden identifiziert und als Inhalt aufweisend vorgelegt, der mit dem Inhalt des ausgewählten Dokuments übereinstimmt. Die eine oder die mehreren Sprachen des einen oder der mehreren weiteren Dokumente unterscheiden sich jeweils von der natürlichen Sprache des ausgewählten Dokuments.