-
公开(公告)号:ES2865201T3
公开(公告)日:2021-10-15
申请号:ES19182892
申请日:2018-03-26
Applicant: INTEL CORP
Inventor: OULD-AHMED-VALL ELMOUSTAPHA , BAGHSORKHI SARA S , YAO ANBANG , NEALIS KEVIN , CHEN XIAOMING , KOKER ALTUG , APPU ABHISHEK R , WEAST JOHN C , MACPHERSON MIKE B , KIM DUKHWAN , HURD LINDA L , ASHBAUGH BEN J , LAKSHMANAN BARATH , MA LIWEI , RAY JOYDEEP , TANG PING T , STRICKLAND MICHAEL S
Abstract: Un acelerador (446) en un módulo multichip, comprendiendo el acelerador: una pila de memorias que incluye múltiples chips de memoria; y una unidad de procesamiento de gráficos, GPU (410-413), acoplada con la pila de memorias mediante uno o más controladores de memoria, incluyendo la GPU una pluralidad de multiprocesadores (234) con una arquitectura de instrucción única para múltiples hilos, SIMT, los multiprocesadores para ejecutar al menos una única instrucción, la al menos una única instrucción para acelerar un subprograma algebraico lineal asociado con una estructura de aprendizaje automático; la al menos una única instrucción para hacer que al menos una porción de la GPU lleve a cabo una operación de coma flotante en entrada con precisiones diferentes; en donde al menos una porción de la pluralidad de multiprocesadores es para ejecutar un hilo de la al menos una única instrucción, incluyendo la porción de la pluralidad de multiprocesadores una unidad de coma flotante para llevar a cabo, como una operación doble de precisión FP16/FP32 mixta, una primera operación del hilo a una primera precisión y una segunda operación del hilo con una segunda precisión; y en donde la primera operación es una operación con dos o más entradas de coma flotante de 16 bits y la segunda operación es una operación con dos o más entradas de coma flotante de 32 bits.
-
公开(公告)号:PL3594813T3
公开(公告)日:2021-06-28
申请号:PL19182892
申请日:2018-03-26
Applicant: INTEL CORP
-
公开(公告)号:PL3396547T3
公开(公告)日:2022-11-14
申请号:PL18164092
申请日:2018-03-26
Applicant: INTEL CORP
-
公开(公告)号:ES2922233T3
公开(公告)日:2022-09-12
申请号:ES19218464
申请日:2018-03-02
Applicant: INTEL CORP
Inventor: APPU ABHISHEK R , KOKER ALTUG , HURD LINDA L , KIM DUKHWAN , MACPHERSON MIKE B , WEAST JOHN C , CHEN FENG , AKHBARI FARSHAD , SRINIVASA NARAYAN , SATISH NADATHUR RAJAGOPALAN , TANG PING T , RAY JOYDEEP , STRICKLAND MICHAEL S , CHEN XIAOMING , YAO ANBANG , SHPEISMAN TATIANA
IPC: G06F9/30 , G06F3/14 , G06F9/38 , G06F9/46 , G06N3/04 , G06N3/063 , G06N3/08 , G06T1/20 , G06T15/00 , G09G5/36
Abstract: Una unidad de procesamiento de gráficos tiene un conjunto de controladores de memoria, una memoria de caché y al menos un clúster de cálculo con al menos un multiprocesador de gráficos acoplado al conjunto de controladores de memoria. El al menos un multiprocesador de gráficos incluye una unidad de instrucción, una pluralidad de núcleos de procesamiento y una memoria compartida junto con la pluralidad de los núcleos de procesamiento. La unidad de instrucción está configurada para enviar instrucciones para la ejecución mediante un núcleo de procesamiento. La ejecución de un mecanismo de cálculo de precisión de precisión mixta fusionada es compatible con un mecanismo de cómputo, en el que la operación FMAC comprende una unidad lógica aritmética, ALU, operación de D = A * B + C con A y A y B es elementos de datos enteros de 8 bits, y C es un elemento de datos enteros de 32 bits. (Traducción automática con Google Translate, sin valor legal)
-
公开(公告)号:DE102018110369A1
公开(公告)日:2018-10-31
申请号:DE102018110369
申请日:2018-04-30
Applicant: INTEL CORP
Inventor: LEWIS BRIAN T , CHEN FENG , JACKSON JEFFREY R , GOTTSCHLICH JUSTIN E , BARIK RAJKISHORE , CHEN XIAOMING , SURTI PRASOONKUMAR , SUNDARESAN MURALI , MACPHERSON MIKE B
IPC: G06F9/50
Abstract: Beschrieben ist ein Mechanismus zur Ermöglichung einer intelligenten Sammlung von Daten und zur intelligenten Verwaltung von autonomen Maschinen. Ein Verfahren von Ausführungsformen, wie hierin beschrieben, beinhaltet das Erkennen eines oder mehrerer Sätze von Daten von einer oder mehreren Quellen über ein oder mehrere Netzwerke, und das Kombinieren einer ersten Berechnung, die lokal an einer lokalen Rechenvorrichtung ausgeführt wird, mit einer zweiten Berechnung, die entfernt an einer entfernten Rechenvorrichtung in Kommunikation mit der lokalen Rechenvorrichtung über das eine oder die mehreren Netzwerke ausgeführt wird, wobei die erste Berechnung wenig Energie verbraucht, wobei die zweite Berechnung viel Energie verbraucht.
-
公开(公告)号:AU2012379689B2
公开(公告)日:2016-06-30
申请号:AU2012379689
申请日:2012-05-09
Applicant: INTEL CORP
Inventor: MACPHERSON MIKE B
Abstract: Embodiments of techniques and systems for execution of code with multiple page tables are described. In embodiments, a heterogenous system utilizing multiple processors may use multiple page tables to selectively execute appropriate ones of different versions of executable code. The system may be configured to support use of function pointers to virtual memory addresses. In embodiments, a virtual memory address may be mapped, such as during a code fetch, in embodiments, when a processor seeks to perform a code fetch using the function pointer, a page table associated with the processor may be used to translate the virtual memory address to a physical memory address where code executable by the processor may be found. Usage of multiple page tables may allow the system to support function pointers while utilizing only one virtual memory address for each function that is pointed to. Other embodiments may be described and claimed.
-
-
-
-
-