AKTIVES LERNEN FÜR DEN DATENABGLEICH

    公开(公告)号:DE112020002892T5

    公开(公告)日:2022-03-17

    申请号:DE112020002892

    申请日:2020-07-24

    Applicant: IBM

    Abstract: Das Verfahren umfasst: a) Trainieren eines maschinellen Lernmodells unter Verwendung einer aktuellen Menge von gekennzeichneten Datensätzen, wobei jeder der Datenpunkte mehrere Datensätze ist, wobei eine Kennzeichnung eines Datenpunkts eine Klassifizierung des Datenpunkts angibt, wobei das Trainieren zu einem trainierten maschinellen Lernmodell führt, das so konfiguriert ist, dass es einen Datenpunkt als eine gleiche Entität oder verschiedene Entitäten repräsentierend klassifiziert. b) eine Teilmenge von nicht gekennzeichneten Datenpunkten kann aus einer aktuellen Menge von nicht gekennzeichneten Datenpunkten unter Verwendung von Klassifizierungsergebnissen der aktuellen Menge von nicht gekennzeichneten Datenpunkten ausgewählt werden. c) die Teilmenge von nicht gekennzeichneten Datenpunkten kann an einen Klassifikator bereitgestellt werden und in Reaktion auf das Bereitstellen empfangener Kennzeichnungen der Teilmenge von nicht gekennzeichneten Datenpunkten. Die Schritte a) bis c) können unter Verwendung der Teilmenge von gekennzeichneten Datenpunkten zusätzlich zur aktuellen Menge von gekennzeichneten Datenpunkten als aktuelle Menge von gekennzeichneten Datenpunkten wiederholt werden.

Patent Agency Ranking