ERWEITERUNG VON TRAININGSDATEN ÜBER PROGRAMMVEREINFACHUNG

    公开(公告)号:DE112022004894T5

    公开(公告)日:2024-08-08

    申请号:DE112022004894

    申请日:2022-09-22

    Applicant: IBM

    Abstract: Bereitgestellt werden Techniken in Bezug auf ein Erweitern von einem oder mehreren Trainingsdatensätzen zum Trainieren von einem oder mehreren KI-Modellen. Zum Beispiel können eine oder mehrere hierin beschriebene Ausführungsformen ein System aufweisen, das einen Arbeitsspeicher aufweisen kann, der durch einen Computer ausführbare Komponenten speichern kann. Das System kann auch einen Prozessor aufweisen, der betriebsfähig mit dem Arbeitsspeicher verbunden ist, und der die durch den Computer ausführbaren Komponenten ausführen kann, die in dem Arbeitsspeicher gespeichert sind. Die durch einen Computer ausführbaren Komponenten können eine Trainingserweiterungs-Komponente aufweisen, die einen erweiterten Trainingsdatensatz zum Trainieren eines Künstliche-Intelligenz-Modells durch Extrahieren eines vereinfachten Quellcodebeispiels aus einem Quellcodebeispiel generieren kann, das sich in einem Trainingsdatensatz befindet.

    KONTEXTABHÄNGIGES DATA-MINING
    2.
    发明专利

    公开(公告)号:DE112020002886T5

    公开(公告)日:2022-02-24

    申请号:DE112020002886

    申请日:2020-05-27

    Applicant: IBM

    Abstract: Ein Verfahren für ein kontextabhängiges Data-Mining eines Textdokuments, wobei das Verfahren Folgendes umfasst: Empfangen einer Liste von Wörtern, die aus einer Suchanfrage syntaktisch analysiert und vorverarbeitet wurden; Berechnen einer zugehörigen verteilten Einbettungsdarstellung für jedes Wort in der Wortliste mittels eines Worteinbettungsmodells des abgefragten Textdokuments; Zusammenführen der zugehörigen verteilten Einbettungsdarstellungen aller Wörter in der Wortliste, um die Suchanfrage mit einer einzigen Einbettung darzustellen, mittels eines Durchschnitts aller zugehörigen verteilten Einbettungsdarstellungen oder eines Maximums aller zugehörigen verteilten Einbettungsdarstellungen; Abrufen einer Rangliste von Dokumentensegmenten von N Zeilen, die der zusammengeführten Worteinbettungsdarstellung der Suchanfrage ähnlich sind, wobei N eine positive ganze Zahl ist, die vom Benutzer bereitgestellt wird; und Zurückliefern der Liste der abgerufenen Segmente an einen Benutzer.

Patent Agency Ranking