Mechanismus zum gemeinsamen Benutzen von Registern

    公开(公告)号:DE102019123443A1

    公开(公告)日:2020-03-12

    申请号:DE102019123443

    申请日:2019-09-02

    Applicant: INTEL CORP

    Abstract: Es wird eine Vorrichtung zum Fördern des gemeinsamen Benutzens von Registern offenbart. Die Vorrichtung enthält einen oder mehrere Prozessoren, um einen ersten Maschinencode, der ein erstes Universalregister-pro-Thread-Verhältnis (GRF-pro-Thread-Verhältnis) aufweist, zu erzeugen, ein Auftreten einer oder mehrerer Überlauf-/Füllanweisungen in dem ersten Maschinencode zu detektieren und einen zweiten Maschinencode, der ein zweites GRF-pro-Thread-Verhältnis aufweist, bei der Detektion einer oder mehrerer Überlauf-/Füllanweisungen in dem ersten Maschinencode zu erzeugen, wobei das zweite GRF-pro-Thread-Verhältnis auf einem Deaktivieren eines ersten von mehreren Hardware-Threads basiert.

    OPTIMIERUNGSMECHANISMUS MIT SPÄRLICH BESETZTEN MATRIZEN

    公开(公告)号:DE102020130184A1

    公开(公告)日:2021-06-17

    申请号:DE102020130184

    申请日:2020-11-16

    Applicant: INTEL CORP

    Abstract: Offenbart ist eine Vorrichtung zum Erleichtern von Matrixverarbeitung. Die Vorrichtung umfasst einen Matrixbeschleuniger, um Eingabematrixdaten zu empfangen, die Eingabematrixdaten in eine Vielzahl von Teilblöcken zu transformieren, einen ersten Block der Teilblöcke zu untersuchen, um zu bestimmen, ob der erste Block spärliche Daten umfasst, eine erste Kachelgröße auszuwählen, wenn bestimmt wird, dass der erste Block spärliche Daten umfasst, und Ausgabematrixdaten auf Grundlage der ersten Kachelgröße zu erzeugen.

    VERWENDUNG EINES EFEHLS EINER RCHITEKTUR MIT EINEM EFEHLSSATZ (ISA) ZUR EKTORNORMALISIERUNG

    公开(公告)号:DE102020129756A1

    公开(公告)日:2021-05-20

    申请号:DE102020129756

    申请日:2020-11-11

    Applicant: INTEL CORP

    Abstract: Hier beschriebene Ausführungsformen sind im Allgemeinen auf einen verbesserten Vektornormalisierungsbefehl gerichtet. Eine Ausführungsform eines Verfahrens weist in Antwort auf Empfang durch eine GPU eines einzelnen Befehls, der eine Vektornormalisierungsoperation spezifiziert, die an V Vektoren durchzuführen ist, auf: (i) Erzeugen V quadratischer Längenwerte, mit jeweils N, durch eine erste Verarbeitungseinheit, indem, für jeweils N Sätze von Eingängen, die jeweils mehrere Komponentenvektoren für N der Vektoren darstellen, N parallele Skalarproduktoperationen an den N Sätzen von Eingängen durchgeführt werden. Erzeugen von V Sätzen von Ausgängen, die mehrere normalisierte Komponentenvektoren der V Vektoren darstellen, mit jeweils N, durch eine zweite Verarbeitungseinheit, indem, für jeweils N quadratische Längenwerte der V quadratischen Längenwerte, N parallele Operationen an den N quadratischen Längenwerten durchgeführt werden, wobei jede der N parallelen Operationen eine Kombination einer reziproken Quadratwurzelfunktion und einer Vektorskalierungsfunktion implementiert.

Patent Agency Ranking