-
公开(公告)号:DE102020130073A1
公开(公告)日:2021-05-20
申请号:DE102020130073
申请日:2020-11-13
Applicant: INTEL CORP
Inventor: SURTI PRASOONKUMAR , LAKE ADAM , HUGHES CHRISTOPHER , LUEH GUEI-YUAN , MAIYURAN SUBRAMANIAM , KOKER ALTUG , RANGANATHAN VASANTH , KABURLASOS NIKOS , XU LIDONG , APPU ABHISHEK , HOLLAND JAMES , BOYCE JILL
IPC: G06F9/50
Abstract: Ausführungsformen, die hierin beschrieben sind, umfassen eine Vorrichtung, die mehrere Verarbeitungsressourcen, die eine erste Verarbeitungsressource und eine zweite Verarbeitungsressource umfassen, einen Speicher, der kommunikativ mit der ersten Verarbeitungsressource und der zweiten Verarbeitungsressource gekoppelt ist; und einen Prozessor zum Empfangen von Datenabhängigkeiten für eine oder mehrere Aufgaben, die eine oder mehrere Erzeugeraufgaben, die auf der ersten Verarbeitungsressource ausgeführt werden, und eine oder mehrere Verbraucheraufgaben, die auf der zweiten Verarbeitungsressource ausgeführt werden, umfassen, und eine Datenausgabe von einer oder mehreren Erzeugeraufgaben, die auf der ersten Verarbeitungsressource ausgeführt werden, zu einem kommunikativ mit der zweiten Verarbeitungsressource gekoppelten Cache-Speicher zu bewegen, umfasst. Andere Ausführungsformen können beschrieben und beansprucht sein.
-
12.
公开(公告)号:DE102020129970A1
公开(公告)日:2021-05-20
申请号:DE102020129970
申请日:2020-11-13
Applicant: INTEL CORP
Inventor: RANGANATHAN VASANTH , RAY JOYDEEP , APPU ABHISHEK R , KABURLASOS NIKOS , XU LIDONG , MAIYURAN SUBRAMANIAM , KOKER ALTUG , MATAM NAVEEN , HOLLAND JAMES , INSKO BRENT , JAHAGIRDAR SANJEEV , JANUS SCOTT , BILAGI DURGAPRASAD , TIAN XINMIN
IPC: G06F11/10
Abstract: Es werden Vorrichtungen, einschließlich einer Grafikverarbeitungseinheit, eines Grafikmultiprozessors oder eines Grafikprozessors, die eine Fehlererkennungs-Korrekturlogik für Cache-Arbeitsspeicher oder gemeinsam genutzten Arbeitsspeicher aufweisen, offenbart. In einer Ausführungsform weist ein Grafikmultiprozessor Cache- oder lokalen Arbeitsspeicher zum Speichern von Daten und Fehlererkennungs-Korrekturschaltungen, die in den Cache- oder lokalen Arbeitsspeicher integriert oder daran gekoppelt sind, auf. Die Fehlererkennungs-Korrekturschaltungen sind konfiguriert zum Durchführen eines Tag-Lesevorgangs für Daten des Cache- oder lokalen Arbeitsspeichers zum Überprüfen von Fehlererkennungs-Korrekturinformationen.
-
公开(公告)号:DE102020115680A1
公开(公告)日:2020-12-24
申请号:DE102020115680
申请日:2020-06-15
Applicant: INTEL CORP
Inventor: RAY JOYDEEP , MAIYURAN SUBRAMANIAM , GEORGE VARGHESE , ILANCHELIAN VIVEK KUMAR
Abstract: Es wird ein Graphikprozessor für allgemeine Zwecke beschrieben, der einen ersten Satz von Recheneinheiten, einen zweiten Satz von Recheneinheiten und einen Speicher, der mit dem ersten Satz von Recheneinheiten und dem zweiten Satz von Recheneinheiten gekoppelt ist, umfasst. Der Speicher ist dafür ausgelegt, eine erste Leseanforderung an einen Adressblock des Speichers mit einer zweiten Leseanforderung an den Adressblock des Speichers zusammenzufügen, um die Anzahl der Speicherzugriffe auf eine Speicherbank in Zusammenhang mit dem Adressblock zu verringern. Der Graphikprozessor kann auch einen Speicher-Arbiter aufweisen, der zusammengefügte Lesevorgänge zu den Recheneinheiten in Zusammenhang mit den zusammengefügten Lesevorgängen Multicast-übertragen kann.
-
公开(公告)号:SG11201609371WA
公开(公告)日:2016-12-29
申请号:SG11201609371W
申请日:2015-06-18
Applicant: INTEL CORP
Inventor: BHIRAVABHATLA KALYAN K , DOYLE PETER L , MAIYURAN SUBRAMANIAM
Abstract: Methods and hardware may process single plane clipping operations using a pipeline specialized for single plane clipping. A second pipeline may be provided to handle clipping in multi-clipping plane cases. By optimizing the hardware and methods around single plane clipping, polygon throughput may be enhanced.
-
公开(公告)号:CA2423497C
公开(公告)日:2009-07-28
申请号:CA2423497
申请日:2001-09-26
Applicant: INTEL CORP
Inventor: MAIYURAN SUBRAMANIAM , TSAI HSIN-CHU , WANG CHUNG-CHI
Abstract: According to one embodiment, a computer system is disclosed. The computer system includes a graphics accelerator and a graphics cache coupled to the graphics accelerator. The graphics cache stores texture data, color data and depth data.
-
公开(公告)号:GB2401227A
公开(公告)日:2004-11-03
申请号:GB0415931
申请日:2000-12-28
Applicant: INTEL CORP
Inventor: PALANCA SALVADOR , FISCHER STEPHEN A , MAIYURAN SUBRAMANIAM
IPC: G06F12/08 , G06F12/0804 , G06F12/0811
Abstract: A cache line flush instruction (CPFLUSH) micro-architectural implementation process and system allow a processor to flush a cache line associated with a linear memory address from all caches in a coherency domain. A cache controller receives a cache flush instruction having an associated memory address and performs a self snoop to flush the cache line corresponding to the memory address from its cache memory. The cache controller then generates a bus transaction regardless of whether the cache line was present in its cache memory and regardless of the state of the cache line if present. The bus transaction includes the memory address and causes other instances of the memory address in other caches of the coherency domain to be flushed or invalidated.
-
公开(公告)号:GB2374962A
公开(公告)日:2002-10-30
申请号:GB0217123
申请日:2000-12-28
Applicant: INTEL CORP
Inventor: PALANCA SALVADOR , FISCHER STEPHEN A , MAIYURAN SUBRAMANIAM
IPC: G06F12/08
Abstract: A system and method for flushing a cache line associated with a linear memory address from all caches in the coherency domain. A cache controller receives a memory address, and determines whether the memory address is stored within the closest cache memory in the coherency domain. If a cache line stores the memory address, it is flushed from the cache. The flush instruction is allocated to a write-combining buffer within the cache controller. The write-combining buffer transmits the information to the bus controller. The bus controller locates instances of the memory address stored within external and intel cache memories within the coherency domain; these instances are flushed. The flush instruction can then be evicted from the write-combining buffer. Control bits may be used to indicate whether a write-combining buffer is allocated to the flush instruction, whether the memory address is stored within the closest cache memory, and whether the flush instruction should be evicted from the write-combining buffer.
-
公开(公告)号:DE112020000846T5
公开(公告)日:2021-11-18
申请号:DE112020000846
申请日:2020-03-14
Applicant: INTEL CORP
Inventor: APPU ABHISHEK , MAIYURAN SUBRAMANIAM , MACPHERSON MIKE , FU FANGWEN , CHEN JIASHENG , GEORGE VARGHESE , RANGANATHAN VASANTH , GARG ASHUTOSH , RAY JOYDEEP
IPC: G06F9/30
Abstract: Hierin beschriebene Ausführungsformen beinhalten Software-, Firmware- und Hardwarelogik, die Techniken zum Durchführen von Arithmetik an Sparse-Daten über eine systolische Verarbeitungseinheit bereitstellt. Eine Ausführungsform stellt datenbewusste Sparsity über komprimierte Bitströme bereit. Eine Ausführungsform stellt Block-Sparse-Skalarprodukt-Anweisungen bereit. Eine Ausführungsform stellt einen tiefenweisen Adapter für ein systolisches Array bereit.
-
公开(公告)号:DE102020133275A1
公开(公告)日:2021-06-24
申请号:DE102020133275
申请日:2020-12-14
Applicant: INTEL CORP
Inventor: GURRAM CHANDRA S , CHEN GANG Y , MAIYURAN SUBRAMANIAM , PAL SUPRATIM , GARG ASHUTOSH , PARRA JORGE E , STARKEY DARIN M , LUEH GUEI-YUAN , CHEN WEI-YU
IPC: G06F9/30
Abstract: Hier beschriebene Beispiele betreffen eine Software- und Hardwareoptimierung, wodurch Szenarien behandelt werden, bei denen ein Schreibvorgang in ein Register weniger als das gesamte Register betrifft. Ein Compiler erkennt Befehle, die Teilschreibvorgänge in dasselbe Register vornehmen, gruppiert diese Befehle und stellt Hardware Hinweise über das teilweise Schreiben bereit. Die Ausführungseinheit kombiniert die Ausgangsdaten für gruppierte Befehle und aktualisiert das Zielregister als Einzelschreibvorgang an Stelle mehrerer getrennter Teilschreibvorgänge.
-
公开(公告)号:DE102020129969A1
公开(公告)日:2021-05-20
申请号:DE102020129969
申请日:2020-11-13
Applicant: INTEL CORP
Inventor: MAIYURAN SUBRAMANIAM , BILAGI DURGAPRASAD , RAY JOYDEEP , JANUS SCOTT , JAHAGIRDAR SANJEEV , INSKO BRENT , XU LIDONG , APPU ABHISHEK R , HOLLAND JAMES , RANGANATHAN VASANTH , KABURLASOS NIKOS , KOKER ALTUG , TIAN XINMIN , LUEH GUEI-YUAN , WANG CHANGLIANG
Abstract: Die hier beschriebenen Ausführungsformen sind im Allgemeinen auf Verbesserungen bezüglich der Leistungs-, Latenzzeit-, Bandbreiten- und/oder Leistungsfähigkeitsprobleme bezüglich der GPU-Verarbeitung/des Cachings gerichtet. Gemäß einer Ausführungsform enthält ein System ein geistiges Eigentum (IP) eines Produzenten (z. B. ein Medien-IP), einen Rechenkern (z. B. eine GPU oder einen KI-spezifischen Kern der GPU), einen Streaming-Puffer, der logisch zwischen dem Produzenten-IP und dem Rechenkern angeordnet ist. Das Produzenten-IP ist betreibbar, Daten aus dem Speicher zu verbrauchen und die Ergebnisse an den Streaming-Puffer auszugeben. Der Rechenkern ist betreibbar, eine KI-Folgerungsverarbeitung basierend auf den Daten aus dem Streaming-Puffer auszuführen und die Ergebnisse der KI-Folgerungsverarbeitung an den Speicher auszugeben.
-
-
-
-
-
-
-
-
-