Patent search ap:("INTEL CORP") AND inv:"PAL SUPRATIM" Page 1

1.

发明专利
Anweisungscodierung zum Implementieren einer erhöhten Registerkapazität pro Thread 未知

公开(公告)号：DE102024120736A1

公开(公告)日：2025-02-27

申请号：DE102024120736

申请日：2024-07-22

Applicant: INTEL CORP

Inventor： PARRA OSORIO JORGE EDUARDO , CHEN JIASHENG , PAL SUPRATIM , RANGANATHAN VASANTH , LUEH GUEI-YUAN , VALERIO JAMES , GOLCONDA PRADEEP , SCHWARTZ BRENT , FU FANGWEN , GANAPATHY SABAREESH , CADAY PETER , CHEN WEI-YU , CHEN PO-YU , BAUER TIMOTHY , KAZAKOV MAXIM , GAMBARIN STANLEY , PANDYA SAMIR

IPC: G06F9/38 , G06T1/20

Abstract: Hier ist ein Grafikprozessor beschrieben, der eine erste Schaltungsanordnung umfasst, die dazu ausgelegt ist, eine decodierte Anweisung auszuführen, und eine zweite Schaltungsanordnung, die dazu ausgelegt ist, eine Anweisung in die decodierte Anweisung zu decodieren. Die zweite Schaltungsanordnung ist dazu ausgelegt, eine Anzahl von Registern innerhalb einer Registerdatei zu bestimmen, die für einen Thread der Verarbeitungsressource verfügbar sind, und die Anweisung basierend auf dieser Anzahl von Registern zu decodieren.

2.

发明专利
REGISTERTEILUNGSMECHANISMUS 未知

公开(公告)号：DE102020113400A1

公开(公告)日：2020-12-17

申请号：DE102020113400

申请日：2020-05-18

Applicant: INTEL CORP

Inventor： LUEH GUEI-YUAN , MAIYURAN SUBRAMANIAM , CHEN WEI-YU , TRIFUNOVIC KONRAD , PAL SUPRATIM , GURRAM CHANDRA S , PARRA JORGE E , ASHAR PRATIK J , BUJEWSKI TOMASZ

IPC: G06F9/38

Abstract: Es wird ein Prozessor zum Erleichtern einer Registerteilung offenbart. Der Prozessor weist Folgendes auf: mehrere Ausführungseinheiten (EUs), die jeweils Folgendes aufweisen: eine Registerdatei für allgemeine Zwecke (GRF) mit mehreren Registern und Registerteilungshardware zur Unterteilung der mehreren Register in einen ersten Registersatz, der dediziert für die Ausführung eines ersten Thread-Satzes vorgesehen ist, und einen zweiten Register-Satz, der für die Ausführung eines zweiten Thread-Satzes geteilt wird.

3.

发明专利
COMPILER-UNTERSTÜTZTE REGISTERDATEI-SCHREIBVERRINGERUNG 未知

公开(公告)号：DE102020133275A1

公开(公告)日：2021-06-24

申请号：DE102020133275

申请日：2020-12-14

Applicant: INTEL CORP

Inventor： GURRAM CHANDRA S , CHEN GANG Y , MAIYURAN SUBRAMANIAM , PAL SUPRATIM , GARG ASHUTOSH , PARRA JORGE E , STARKEY DARIN M , LUEH GUEI-YUAN , CHEN WEI-YU

IPC: G06F9/30

Abstract: Hier beschriebene Beispiele betreffen eine Software- und Hardwareoptimierung, wodurch Szenarien behandelt werden, bei denen ein Schreibvorgang in ein Register weniger als das gesamte Register betrifft. Ein Compiler erkennt Befehle, die Teilschreibvorgänge in dasselbe Register vornehmen, gruppiert diese Befehle und stellt Hardware Hinweise über das teilweise Schreiben bereit. Die Ausführungseinheit kombiniert die Ausgangsdaten für gruppierte Befehle und aktualisiert das Zielregister als Einzelschreibvorgang an Stelle mehrerer getrennter Teilschreibvorgänge.

4.

发明专利
Anweisung und Logik für systolisches Skalarprodukt mit Akkumulation 未知

公开(公告)号：DE102019101118A1

公开(公告)日：2019-10-24

申请号：DE102019101118

申请日：2019-01-17

Applicant: INTEL CORP

Inventor： GARG ASHUTOSH , GURRAM CHANDRA S , LUEH GUEI-YUAN , PARRA JORGE E , GU JUNJIE , TRIFUNOVIC KONRAD , MACPHERSON MIKE B , SHAH SHUBH B , MARWAHA SHUBRA , JUNKINS STEPHEN , MAIYURAN SUBRAMANIAM , PAL SUPRATIM , BAUER TIMOTHY R , GEORGE VARGHESE , CHEN WEIYU , LIAO HONG BIN

IPC: G06F9/38

Abstract: Die hierin beschriebenen Ausführungsformen stellen bereit, dass eine Anweisung und die zugeordnete Logik GPGPU-Programmcode ermöglichen, auf Spezial-Hardwarelogik zuzugreifen, um Skalarproduktoperationen zu beschleunigen. Eine Ausführungsform stellt eine Grafikverarbeitungseinheit bereit, die eine Abrufeinheit zum Abrufen einer Anweisung zur Ausführung und eine Entschlüsselungseinheit zum Entschlüsseln der Anweisung in eine entschlüsselte Anweisung umfasst. Die entschlüsselte Anweisung ist ein Matrixanweisung, um die Grafikprozessoreinheit zu veranlassen, eine parallele Skalarproduktoperation durchzuführen. Die GPGPU umfasst auch eine systolische Skalarprodukteinheit zum Ausführen der entschlüsselten Anweisung in einer oder mehreren SIMD-Spuren unter Verwendung mehrerer systolischer Schichten, wobei zum Ausführen der entschlüsselten Anweisung ein auf einer ersten systolischen Schicht berechnetes Skalarprodukt an eine zweite systolische Schicht ausgegeben werden soll, wobei jede systolische Schicht einen oder mehrere Sätze von miteinander verbundenen Multiplizierern und Addierern umfasst, wobei jeder Satz von Multiplizierern und Addierern dazu dient, ein Skalarprodukt zu erzeugen.

5.

发明公开
SIMPLIFICATION OF LOCAL CONTRAST COMPENSATION BY USING WEIGHTED LOOK-UP TABLE 审中-公开
Title translation: SIMPLIFICATION局部对比度补偿与加权检索表

公开(公告)号：EP2807627A4

公开(公告)日：2015-12-09

申请号：EP12862903

申请日：2012-12-21

Applicant: INTEL CORP

Inventor： GUPTA NIRAJ , PAL SUPRATIM , CHAPMALLI MAHESH B , CHIU YI-JEN , JIANG HONG

IPC: G06T5/00 , H04N5/57 , H04N21/431

CPC classification number: G09G5/10 , G09G5/06 , G09G2320/029 , G09G2320/066 , H04N5/57 , H04N21/4318

Abstract: Systems, apparatus, articles, and methods are described including operations to generate a weighted look-up-table based at least in part on individual pixel input values within an active block region and on a plurality of contrast compensation functions. A second level compensation may be performed for a center pixel block of the active region based at least in part on the weighted look-up-table.

6.

发明公开
IMPROVED BANKED MEMORY ACCESS EFFICIENCY BY A GRAPHICS PROCESSOR 审中-公开

公开(公告)号：EP3129953A4

公开(公告)日：2017-12-06

申请号：EP15777360

申请日：2015-04-08

Applicant: INTEL CORP

Inventor： PAL SUPRATIM , SUNDARESAN MURALI

IPC: G06T1/60 , G06F12/02 , G06F12/06 , G06F12/0811 , G06F12/084 , G06F12/0846 , G06F12/0893

CPC classification number: G06F9/445 , G06F12/0207 , G06F12/0607 , G06F12/08 , G06F12/0811 , G06F12/084 , G06F12/0851 , G06F12/0893 , Y02B60/1225 , Y02D10/13

Abstract: Conversion of an array of structures (AOS) to a structure of arrays (SOA) improves the efficiency of transfer from the AOS to the SOA. A similar technique can be used to convert efficiently from an SOA to an AOS. The controller performing the conversion computes a partition size as the highest common factor between the structure size of structures in AOS and the number of banks in a first memory device, and transfers data based on the partition size, rather than on the structure size. The controller can read a partition size number of elements from multiple different structures to ensure that full data transfer bandwidth is used for each transfer.

7.

发明专利
未知

公开(公告)号：ES2996958T3

公开(公告)日：2025-02-13

申请号：ES21192702

申请日：2020-03-14

Applicant: INTEL CORP

Inventor： MAIYURAN SUBRAMANIAM , MARWAHA SHUBRA , GARG ASHUTOSH , PAL SUPRATIM , PARRA JORGE , GURRAM CHANDRA , GEORGE VARGHESE , STARKEY DARIN , LUEH GUEI-YUAN

IPC: G06F9/38 , G06F9/30

Abstract: Se describen procesadores gráficos y unidades de procesamiento gráfico que tienen instrucciones de acumulación de producto de punto para un formato de punto flotante híbrido. En una realización, una unidad de procesamiento gráfico comprende: un multiprocesador de instrucción única, subproceso múltiple (SIMT). El multiprocesador SIMT comprende: una caché de instrucciones; una memoria compartida acoplada con la caché de instrucciones; y circuitos acoplados con la memoria compartida y la caché de instrucciones. Los circuitos incluyen: múltiples unidades de textura; un primer núcleo que incluye hardware para acelerar las operaciones de matriz; y un segundo núcleo. El segundo núcleo está configurado para: recibir una instrucción que tiene múltiples operandos en un formato de número bfloat16, BF16, en donde los múltiples operandos incluyen un primer operando de origen, un segundo operando de origen y un tercer operando de origen, y el formato de número BF16 es un formato de punto flotante de dieciséis bits que tiene un exponente de ocho bits; y procesar la instrucción, en donde procesar la instrucción incluye multiplicar el segundo operando de origen por el tercer operando de origen y agregar un primer operando de origen a un resultado de la multiplicación. (Traducción automática con Google Translate, sin valor legal)

8.

发明专利
Procesory graficzne i jednostki przetwarzania grafiki mające instrukcję akumulowania iloczynów skalarnych dla hybrydowego formatu zmiennoprzecinkowego 未知

公开(公告)号：PL3974968T3

公开(公告)日：2025-01-13

申请号：PL21192702

申请日：2020-03-14

Applicant: INTEL CORP

Inventor： MAIYURAN SUBRAMANIAM , MARWAHA SHUBRA , GARG ASHUTOSH , PAL SUPRATIM , PARRA JORGE , GURRAM CHANDRA , GEORGE VARGHESE , STARKEY DARIN , LUEH GUEI-YUAN

IPC: G06F9/38 , G06F9/30

9.

发明专利
Grafikprozessoren und Grafikverarbeitungseinheiten mit Skalarproduktakkumulationsanweisungen für ein Hybrid-Gleitkommaformat 未知

公开(公告)号：DE112020001258T5

公开(公告)日：2021-12-23

申请号：DE112020001258

申请日：2020-03-14

Applicant: INTEL CORP

Inventor： MAIYURAN SUBRAMANIAM , MARWAHA SHUBRA , GARG ASHUTOSH , PAL SUPRATIM , PARRA JORGE , GURRAM CHANDRA , GEORGE VARGHESE , STARKEY DARIN , LUEH GUEI-YUAN

IPC: G06F7/38

Abstract: Grafikprozessoren und Grafikverarbeitungseinheiten mit Skalarproduktakkumulationsanweisungen für ein Hybrid-Gleitkommaformat werden offenbart. Bei einer Ausführungsform umfasst ein Grafikmultiprozessor, eine Anweisungseinheit zum Versenden von Anweisungen undeine Verarbeitungsressource, die mit der Anweisungseinheit gekoppelt ist. Die Verarbeitungsressource ist dafür ausgelegt, eine Skalarproduktakkumulationsanweisung von der Anweisungseinheit zu empfangen und die Skalarproduktakkumulationsanweisung unter Verwendung eines bfloat16(BF16)-Zahlenformats zu verarbeiten.

10.

发明专利
BERECHNUNG EFFIZIENTER KANALÜBERGREIFENDER OPERATIONEN IN PARALLELRECHENMASCHINEN MIT SYSTOLISCHEN ARRAYS 未知

公开(公告)号：DE102020132088A1

公开(公告)日：2021-11-04

申请号：DE102020132088

申请日：2020-12-03

Applicant: INTEL CORP

Inventor： MAIYURAN SUBRAMANIAM , PARRA JORGE , PAL SUPRATIM , GURRAM CHANDRA

IPC: G06F9/38 , G06F15/80 , G06T1/20

Abstract: Es wird eine Vorrichtung zum Ermöglichen recheneffizienter kanalübergreifender Operationen in Parallelrechenmaschinen unter Verwendung systolischer Arrays offenbart. Die Vorrichtung umfasst mehrere Register und ein oder mehrere Verarbeitungselemente, die kommunikativ mit den mehreren Registern gekoppelt sind. Das eine oder die mehreren Verarbeitungselemente umfassen eine systolische Arrayschaltung zum Durchführen von kanalübergreifenden Operationen an Quelldaten, die von einem einzelnen Quellregister der mehreren Register empfangen werden, wobei die systolische Arrayschaltung modifiziert ist, Eingaben von dem einzelnen Quellregister zu empfangen und Elemente des einzelnen Quellregisters an mehrere Kanäle in der systolischen Arrayschaltung weiterzuleiten.

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification