VERBESSERTE BILD- UND VIDEOOBJEKTERKENNUNG UNTER VERWENDUNG EINES MEHRSTUFEN-PARADIGMAS

    公开(公告)号:DE112022007398T5

    公开(公告)日:2025-04-03

    申请号:DE112022007398

    申请日:2022-09-09

    Applicant: INTEL CORP

    Abstract: Diese Offenbarung beschreibt Systeme, Verfahren und Vorrichtungen, die eine Objekterkennung in Bildern betreffen. Eine Vorrichtung kann ein Bild, das ein Objekt repräsentiert, in ein Manuellkennzeichnungs-Lernsystem eingeben; unter Verwendung des Systems, erste Koordinaten einer oberen linken Ecke eines Begrenzungsrahmens, der das Objekt repräsentiert, auf Grundlage einer Heatmap, die eine Wahrscheinlichkeit angibt, dass die ersten Koordinaten die obere linke Ecke repräsentieren, identifizieren, unter Verwendung des Systems zweite Koordinaten einer unteren rechten Ecke des Begrenzungsrahmens auf Grundlage der ersten Koordinaten und einer ersten Distanzregressionskarte identifizieren, die Koordinatendifferenzen zwischen den zweiten Koordinaten und Ground-Truth-Koordinaten angibt, die in das Maschinenlernmodell als Trainingsdaten eingegeben sind; unter Verwendung des Systems Anpassungen an den ersten Koordinaten und den zweiten Koordinaten auf Grundlage einer zweiten Distanzregressionskarte generieren; und unter Verwendung des Systems die angepassten ersten und zweiten Koordinaten, den Begrenzungsrahmen generieren.

    Kontinuierliches Lernen zur Objektverfolgung

    公开(公告)号:DE112019006564T5

    公开(公告)日:2021-10-14

    申请号:DE112019006564

    申请日:2019-01-03

    Applicant: INTEL CORP

    Abstract: Ein Langzeit-Objektverfolger setzt ein Rahmenwerk für kontinuierliches Lernen ein, um Wanderung in der Verfolgungsposition eines verfolgten Objektes zu beseitigen. Das Rahmenwerk für kontinuierliches Lernen besteht aus einem Modul für kontinuierliches Lernen, das Muster des verfolgten Objektes akkumuliert, um die Genauigkeit der Objektverfolgung über verlängerte Zeiträume zu verbessern. Das Modul für kontinuierliches Lernen kann einen Musterpräprozessor, um einen Ort eines Kandidatenobjektes zu verfeinern, das während der Objektverfolgung gefunden wurde, und einen Ausschneider beinhalten, um einen Teil eines Einzelbildes, der ein verfolgtes Objekt enthält, als ein Muster auszuschneiden und das Muster in eine Datenbank für kontinuierliches Lernen einzufügen, um zukünftige Verfolgung zu unterstützen.

    VERFAHREN UND VORRICHTUNG ZUM ABGLEICHEN VON BILDERN ANHAND SEMANTISCHER MERKMALE

    公开(公告)号:DE112018006782T5

    公开(公告)日:2020-09-17

    申请号:DE112018006782

    申请日:2018-03-01

    Applicant: INTEL CORP

    Abstract: Es werden Verfahren und Vorrichtungen zum Abgleichen von Bildern anhand semantischer Merkmale offenbart. Eine beispielhafte Vorrichtung enthält einen semantischen Bezeichner zum Bestimmen einer semantischen Bezeichnung für jeden eines ersten Satzes von Punkten eines ersten Bildes und jeden eines zweiten Satzes von Punkten eines zweiten Bildes; einen Binary Robust Independent Element Features (BRIEF)-Bestimmer zum Bestimmen semantischer BRIEF-Deskriptoren für eine erste Teilmenge des ersten Satzes von Punkten und eine zweite Teilmenge des zweiten Satzes von Punkten auf der Grundlage der semantischen Bezeichnungen; und einen Punktabgleicher zum Abgleichen erster Punkte der ersten Teilmenge von Punkten mit zweiten Punkten der zweiten Teilmenge von Punkten auf der Grundlage der semantischen BRIEF-Deskriptoren.

    Sequenzielle Modellierung mit Speicher einschließlich Mehrfachbereichsarrays

    公开(公告)号:DE112022007395T5

    公开(公告)日:2025-04-10

    申请号:DE112022007395

    申请日:2022-10-11

    Applicant: INTEL CORP

    Abstract: Ein System zur Videosegmentierung kann ein neuronales Netzwerk und einen Speicher beinhalten, der Mehrfachbereichsarrays beinhaltet. Die Mehrfachbereichsarrays können Merkmalsabbildungsarrays speichern, die eine unterschiedliche Anzahl von Merkmalsabbildungen beinhalten. Das System kann jeweils eine Merkmalsabbildung aus einem Frame in einem Video erzeugen und die Merkmalsabbildung im Speicher speichern. Die Merkmalsabbildung kann sich in einem Merkmalsabbildungsarray befinden, das auch eine oder mehrere Kontextmerkmalsabbildungen beinhaltet, die aus anderen Frames in dem Video erzeugt werden. Das System verwendet das Merkmalsabbildungsarray, um zu bestimmen, ob der Frame in ein Segment des Videos fällt. Das System kann später eine neue Merkmalsabbildung aus einem anderen Frame erzeugen und die neue Merkmalsabbildung in einem neuen Merkmalsabbildungsarray einschließen, das auch die erste Merkmalsabbildung beinhaltet. Das System verwendet das neue Merkmalsabbildungsarray, um zu bestimmen, ob der neue Frame in ein Segment fällt.

Patent Agency Ranking