-
公开(公告)号:DE102020115578A1
公开(公告)日:2020-12-31
申请号:DE102020115578
申请日:2020-06-12
Applicant: INTEL CORP
Inventor: VALERIO JAMES , RAY JOYDEEP , ASHBAUGH BEN , STRIRAMASSARMA LAKSHMINARAYANAN
IPC: G06T1/60 , G06F12/0802
Abstract: Hier beschriebene Ausführungsformen stellen einen Allzweckgrafikprozessor bereit, der mehrere Kacheln, wobei jede Kachel aus den mehreren Kacheln wenigstens eine Ausführungseinheit, einen lokalen Cache und eine Cache-Steuereinheit umfasst, und einen Speicher mit hoher Bandbreite, der mit den mehreren Kacheln kommunikationstechnisch gekoppelt ist, umfasst, wobei der Speicher mit hoher Bandbreite von den mehreren Kacheln gemeinsam verwendet wird. Die Cache-Steuereinheit dient zum Implementieren eines Protokolls für das Management von partiellem Schreiben zum Empfangen einer partiellen Schreiboperation, die auf eine Cache-Zeile in dem lokalen Cache gerichtet ist, wobei die partielle Schreiboperation Schreibdaten umfasst, Schreiben der Daten, die der partiellen Schreiboperation zugeordnet sind, in den lokalen Cache, wenn die Cache-Zeile in einem modifizierten Zustand ist, und Weiterleiten der Schreibdaten, die der partiellen Schreiboperation zugeordnet sind, zu dem Speicher mit hoher Bandbreite, wenn die partielle Schreiboperation einen Cache-Fehlschlag auslöst oder wenn die Cache-Zeile in einem exklusiven Zustand oder einem gemeinsam verwendeten Zustand ist. Andere Ausführungsformen weniger Merkmale und können beschrieben und beansprucht sein.
-
公开(公告)号:DE102020130880A1
公开(公告)日:2021-08-05
申请号:DE102020130880
申请日:2020-11-23
Applicant: INTEL CORP
Inventor: RAY JOYDEEP , RANGANATHAN VASANTH , ASHBAUGH BEN , VALERIO JAMES
Abstract: Eine Einrichtung, um Partitionierung lokalen Speichers zu erleichtern, ist offenbart. Die Einrichtung weist mehrere Ausführungseinheiten auf, um mehrere Ausführungsthreads auszuführen, einen Speicher, der gekoppelt ist, um Zugriff zwischen mehreren Ausführungseinheiten zu teilen, und Partitionierungshardware, um den Speicher zu partitionieren, der als Cache und geteilter lokaler Speicher (SLM) zu verwenden ist, wobei die Partitionierungshardware den Speicher basierend auf einer Menge der mehreren Ausführungsthreads partitioniert, die auf den aktiven Ausführungseinheiten ausgeführt sind.
-
3.
公开(公告)号:DE112020000874T5
公开(公告)日:2021-11-11
申请号:DE112020000874
申请日:2020-03-14
Applicant: INTEL CORP
Inventor: KOKER ALTUG , RAY JOYDEEP , ANANTARAMAN ARAVINDH , ANDREI VALENTIN , APPU ABHISHEK , COLEMAN SEAN , GALOPPO VON BORRIES NICOLAS , GEORGE VARGHESE , K PATTABHIRAMAN , KIM SUNGYE , MACPHERSON MIKE , MAIYURAN SUBRAMANIAM , OULD-AHMED-VALL ELMOUSTAPHA , RANGANATHAN VASANTH , VALERIO JAMES
IPC: G06F12/0806
Abstract: Systeme und Methoden zum Aktualisieren von fernen speicherseitigen Caches in einer Multi-GPU-Konfiguration sind hier offenbart. In einer Ausführungsform beinhaltet ein Grafikprozessor für eine Multi-Kachel-Architektur eine erste Grafikverarbeitungseinheit (GPU) mit einem ersten Speicher, einen ersten speicherseitigen Cachespeicher, einem erstem Kommunikations-Fabric und einer ersten Speicherverwaltungseinheit (MMU). Der Grafikprozessor beinhaltet eine zweite Grafikverarbeitungseinheit (GPU) mit einem zweiten Speicher, einen zweiten speicherseitigen Cachespeicher, einer zweiten Speicherverwaltungseinheit (MMU) und einem zweiten Kommunikations-Fabric, das kommunikativ mit dem ersten Kommunikations-Fabric gekoppelt ist. Die erste MMU ist zum Steuern von Speicheranforderungen für den ersten Speicher, zum Aktualisieren von Inhalt in dem ersten Speicher, zum Aktualisieren von Inhalt in dem ersten speicherseitigen Cachespeicher und zum Bestimmen, ob der Inhalt in dem zweiten speicherseitigen Cachespeicher aktualisiert werden soll, konfiguriert ist.
-
公开(公告)号:DE102019108051A1
公开(公告)日:2019-10-24
申请号:DE102019108051
申请日:2019-03-28
Applicant: INTEL CORP
Inventor: VALERIO JAMES , ASHBAUGH BEN , RAMANI PRADEEP , DAVID REBECCA , GANAPATHY SABAREESH , HASHEMI HASHEM
IPC: G06T1/20
Abstract: Hierin beschriebene Ausführungsformen stellen Techniken bereit, um eine hohe zeitliche Zwischenspeicherlokalisierung zwischen unabhängigen Threads mit dem gleichen oder einem ähnlichen Arbeitsspeicherzugriffsmuster beizubehalten. Eine Ausführungsform sieht eine Grafikverarbeitungseinheit vor, die eine Anweisungsausführungspipeline umfasst, die Hardwareausführungslogik und einen Thread-Dispatcher enthält, um einen Satz von Befehlen zur Ausführung zu verarbeiten und mehrere Gruppen von Hardwarethreads an die Hardwareausführungslogik zu verteilen, um den Satz von Befehlen auszuführen. Der Thread-Dispatcher kann ausgelegt sein, gleichzeitig eine erste Gruppe der mehreren Gruppen von Hardwarethreads an die Hardwareausführungslogik zu verteilen und eine Verteilung von zusätzlichen Hardwarethreads für den Satz von Befehlen zurückzuhalten, bis die erste Gruppe die Ausführung abgeschlossen hat.
-
公开(公告)号:DE102024120736A1
公开(公告)日:2025-02-27
申请号:DE102024120736
申请日:2024-07-22
Applicant: INTEL CORP
Inventor: PARRA OSORIO JORGE EDUARDO , CHEN JIASHENG , PAL SUPRATIM , RANGANATHAN VASANTH , LUEH GUEI-YUAN , VALERIO JAMES , GOLCONDA PRADEEP , SCHWARTZ BRENT , FU FANGWEN , GANAPATHY SABAREESH , CADAY PETER , CHEN WEI-YU , CHEN PO-YU , BAUER TIMOTHY , KAZAKOV MAXIM , GAMBARIN STANLEY , PANDYA SAMIR
Abstract: Hier ist ein Grafikprozessor beschrieben, der eine erste Schaltungsanordnung umfasst, die dazu ausgelegt ist, eine decodierte Anweisung auszuführen, und eine zweite Schaltungsanordnung, die dazu ausgelegt ist, eine Anweisung in die decodierte Anweisung zu decodieren. Die zweite Schaltungsanordnung ist dazu ausgelegt, eine Anzahl von Registern innerhalb einer Registerdatei zu bestimmen, die für einen Thread der Verarbeitungsressource verfügbar sind, und die Anweisung basierend auf dieser Anzahl von Registern zu decodieren.
-
公开(公告)号:DE102021122245A1
公开(公告)日:2022-03-10
申请号:DE102021122245
申请日:2021-08-27
Applicant: INTEL CORP
Inventor: CHAND NALLURI HEMA , SHAH ANKUR , RAY JOYDEEP , NAVALE ADITYA , KOKER ALTUG , RAMADOSS MURALI , COORAY NIRANJAN L , BOLES JEFFERY S , ANANTARAMAN ARAVINDH V , PUFFER DAVID , VALERIO JAMES , RANGANATHAN VASANTH
Abstract: Offenbart wird eine Einrichtung zum Erleichtern von Speicherbarrieren. Die Einrichtung umfasst eine Zwischenverbindung, einen Vorrichtungsspeicher, eine Vielzahl von Verarbeitungsressourcen, die mit dem Vorrichtungsspeicher gekoppelt sind, um eine Vielzahl von Ausführungs-Threads als Speicherdatenerzeuger und Speicherdatenverbraucher an einen Vorrichtungsspeicher und einen Systemspeicher auszuführen, und Fence-Hardware zum Generieren von Fence-Operationen zum Durchsetzen einer Datenordnung bei Speicheroperationen, die an den Vorrichtungsspeicher und einen Systemspeicher ausgegeben werden, der über die Zwischenverbindung gekoppelt ist.
-
公开(公告)号:DE102020106002A1
公开(公告)日:2020-10-01
申请号:DE102020106002
申请日:2020-03-05
Applicant: INTEL CORP
Inventor: VALERIO JAMES , RANGANATHAN VASANTH , RAY JOYDEEP , KULKARNI RAHUL A , APPU ABHISHEK R , BOLES JEFFERY S , NALLURI HEMA C
IPC: G06F9/50
Abstract: Es werden hier Beispiele beschrieben, die verwendet werden können, um Befehle aus mehreren Quellen zur Ausführung durch ein oder mehrere Segmente einer Verarbeitungsvorrichtung zuzuweisen. Beispielsweise kann eine Verarbeitungsvorrichtung in mehrere Abschnitte segmentiert sein, und jeder Abschnitt ist zugewiesen, um Befehle aus einer speziellen Quelle zu verarbeiten. In dem Fall, in dem eine einzige Quelle Befehle bereitstellt, kann die gesamte Verarbeitungsvorrichtung (alle Segmente) zugewiesen sein, um Befehle aus der einzigen Quelle zu verarbeiten. Wenn eine zweite Quelle Befehle bereitstellt, können einige Segmente zugewiesen sein, um Befehle aus der ersten Quelle zu verarbeiten, und andere Segmente können zugewiesen sein, um Befehle aus der zweiten Quelle zu verarbeiten. Dementsprechend können Befehle aus mehreren Anwendungen durch eine Verarbeitungseinheit zur gleichen Zeit ausgeführt werden.
-
-
-
-
-
-