Abstract:
A system, method and computer program product for efficiently retrieving relevant passages to questions based on a corpus of data. A processor device receives an input query and performs a query analysis to obtain searchable query terms. The processor performs: matching metadata associated with one or more documents against the query terms. The document metadata includes one or more of: a title of the documents, one or more user tags or clouds. Then the processor device performs: mapping matched document metadata to corresponding one or more documents; identifying corresponding matched documents to form a subcorpus of documents; and conducting a search in the data subcorpus using the searchable query terms to obtain one or more passages relevant input query from the identified documents.
Abstract:
A system, method and computer program product for conducting questions and answers with deferred type evaluation based on any corpus of data. The method includes processing a query including waiting until a “Type” (i.e. a descriptor) is determined AND a candidate answer is provided. Then, a search is conducted to look (search) for evidence that the candidate answer has the required Lexical Answer Type (e.g., as determined by a matching function that can leverage a parser, a semantic interpreter and/or a simple pattern matcher). Prior to or during candidate answer evaluation, a process is provided for extracting and storing collections of entity-type pairs from semi-structured text documents. During QA processing and candidate answer scoring, a process is implemented to match the query LAT against the lexical type of each provided candidate answer and generate a score judging a degree of match.
Abstract:
Bei einem Verfahren zum Beantworten von Fragen wird eine Frage empfangen, ein LAT der Frage wird ermittelt, und eine mögliche Antwort auf die Frage wird ermittelt. Vorläufige Typen für die mögliche Antwort werden unter Verwendung erster Komponenten ermittelt, um die vorläufigen Typen zu erzeugen. Jede der ersten Komponenten erzeugt einen vorläufigen Typ unter Verwendung unterschiedlicher Verfahren. Eine erste Typ-Bewertungszahl wird erzeugt, die ein Maß der Übereinstimmung zwischen dem vorläufigen Typ und dem LAT der Frage repräsentiert. Jeder vorläufige Typ und jede erste Bewertungszahl werden beurteilt. Jede der zweiten Komponenten erzeugt eine zweite Bewertungszahl anhand einer Verknüpfung der ersten Typ-Bewertungszahl und einer Maßzahl, dass der vorläufige Typ mit dem LAT der Frage übereinstimmt. Die zweiten Komponenten verwenden unterschiedliche Verfahren, um die zweite Bewertungszahl zu erzeugen. Eine endgültige Bewertungszahl, die ein Maß der Sicherheit repräsentiert, dass die mögliche Antwort mit dem LAT der Frage übereinstimmt, wird anhand der zweiten Bewertungszahl berechnet.