SELTENE FÄLLE BERÜCKSICHTIGENDE TRAININGSDATEN FÜR KÜNSTLICHE INTELLIGENZ

    公开(公告)号:DE112020001034T5

    公开(公告)日:2021-12-02

    申请号:DE112020001034

    申请日:2020-04-28

    Applicant: IBM

    Abstract: Ein System zum Verbessern einer Klassifikatorvorhersage in Bezug auf unterrepräsentierte Klassen kann bereitgestellt werden. Ein Klassifikatorsystem, das mit Trainingsdaten trainiert wird, um ein Modell zu erstellen, wird zum Klassifizieren unbekannter Eingabedaten verwendet, und eine Bewertungs-Steuerkomponente ist für eine Bestimmung einer unterrepräsentierten Klasse geeignet. Zusätzlich umfasst das System eine Extraktions-Steuerkomponente, die für eine Extraktion zugehöriger Daten aus einer zusätzlichen Quelle geeignet ist, und eine Ähnlichkeits-Steuerkomponente, die für eine Auswahl von Datensätzen aus den zugehörigen Daten geeignet ist, wobei die Ähnlichkeits-Steuerkomponente zudem zum Vergleichen von Merkmalen der zugehörigen Daten und eines repräsentativen Datensatzes für die unterrepräsentierte Klasse geeignet ist. Schließlich weist das System eine Rekursionseinheit auf, die geeignet ist, die Bewertungs-Steuerkomponente, die Extraktions-Steuerkomponente und die Ähnlichkeits-Steuerkomponente auszulösen, die den ausgewählten Datensatz als Eingabedaten behandeln, bis die Bewertungs-Steuerkomponente den ausgewählten Datensatz mit einem Konfidenzniveau klassifiziert, das über einem Konfidenzschwellenniveau liegt.

Patent Agency Ranking