-
11.
公开(公告)号:PL3396533T3
公开(公告)日:2022-06-06
申请号:PL18162635
申请日:2018-03-19
Applicant: INTEL CORP
Inventor: NURVITADHI ERIKO , VEMBU BALAJI , GALOPPO VON BORRIES NICOLAS C , BARIK RAJKISHORE , LIN TSUNG-HAN , SINHA KAMAL , SATISH NADATHUR RAJAGOPALAN , BOTTLESON JEREMY , AKHBARI FARSHAD , KOKER ALTUG , SRINIVASA NARAYAN , KIM DUKHWAN , BAGHSORKHI SARA S , GOTTSCHLICH JUSTIN E , CHEN FENG , OULD-AHMED-VALL ELMOUSTAPHA , NEALIS KEVIN , CHEN XIAOMING , YAO ANBANG
-
公开(公告)号:PL3385901T3
公开(公告)日:2025-03-31
申请号:PL18160825
申请日:2018-03-08
Applicant: INTEL CORP
Inventor: NURVITADHI ERIKO , VEMBU BALAJI , LIN TSUNG-HAN , SINHA KAMAL , BARIK RAJKISHORE , GALOPPO VON BORRIES NICOLAS C
IPC: G06T1/20
-
公开(公告)号:ES2995657T3
公开(公告)日:2025-02-10
申请号:ES22210195
申请日:2018-03-26
Applicant: INTEL CORP
Inventor: KAUL HIMANSHU , ANDERS MARK A , MATHEW SANU K , YAO ANBANG , RAY JOYDEEP , TANG PING T , STRICKLAND MICHAEL S , CHEN XIAOMING , APPU ABHISHEK R , KOKER ALTUG , SINHA KAMAL , VEMBU BALAJI , GALOPPO VON BORRIES NICOLAS C , NURVITADHI ERIKO , BARIK RAJKISHORE , LIN TSUNG-HAN , RANGANATHAN VASANTH , JAHAGIRDAR SANJEEV , SHPEISMAN TATIANA
Abstract: La presente divulgación proporciona un sistema de procesamiento de datos, un método, un medio legible por computadora y una unidad de procesamiento de gráficos, GPU, para acelerar las operaciones de aprendizaje automático, comprendiendo la GPU: un multiprocesador que incluye una arquitectura de instrucción única, subproceso múltiple, SIMT, el multiprocesador para ejecutar una instrucción única a través de múltiples subprocesos; y una primera unidad de cómputo incluida dentro del multiprocesador, la instrucción única para hacer que la primera unidad de cómputo realice al menos una operación de multiplicación y acumulación de matriz bidimensional, en donde realizar la operación de multiplicación y acumulación de matriz bidimensional incluye calcular un producto intermedio de operandos de 16 bits y calcular una suma de 32 bits basada en el producto intermedio; en donde para calcular una suma de 32 bits basada en el producto intermedio, la primera unidad de cómputo debe: realizar una multiplicación de punto flotante de dos o más operandos de 16 bits para generar el producto intermedio, calcular una suma intermedia basada en el producto intermedio; y convertir la suma intermedia en un resultado de 32 bits. (Traducción automática con Google Translate, sin valor legal)
-
公开(公告)号:PL4160387T3
公开(公告)日:2025-01-07
申请号:PL22210195
申请日:2018-03-26
Applicant: INTEL CORP
Inventor: KAUL HIMANSHU , ANDERS MARK A , MATHEW SANU K , YAO ANBANG , RAY JOYDEEP , TANG PING T , STRICKLAND MICHAEL S , CHEN XIAOMING , APPU ABHISHEK R , KOKER ALTUG , SINHA KAMAL , VEMBU BALAJI , GALOPPO VON BORRIES NICOLAS C , NURVITADHI ERIKO , BARIK RAJKISHORE , LIN TSUNG-HAN , RANGANATHAN VASANTH , JAHAGIRDAR SANJEEV , SHPEISMAN TATIANA
-
公开(公告)号:ES2929978T3
公开(公告)日:2022-12-05
申请号:ES18160823
申请日:2018-03-08
Applicant: INTEL CORP
Inventor: APPU ABHISHEK R , KOKER ALTUG , RAY JOYDEEP , SINHA KAMAL , VEERNAPU KIRAN C , MAIYURAN SUBRAMANIAM , SURTI PRASOONKUMAR , LUEH GUEI-YUAN , PUFFER DAVID , PAL SUPRATIM , HOEKSTRA ERIC J , SCHLUESSLER TRAVIS T , HURD LINDA L
Abstract: En un ejemplo, un aparato comprende una pluralidad de unidades de ejecución y un primer archivo de registro general (GRF) acoplado comunicativamente a la pluralidad de unidades de ejecución, donde el primer GRF es compartido por la pluralidad de unidades de ejecución. También se describen y reivindican otras realizaciones. (Traducción automática con Google Translate, sin valor legal)
-
公开(公告)号:PL3637247T3
公开(公告)日:2022-11-21
申请号:PL19214829
申请日:2018-03-26
Applicant: INTEL CORP
Inventor: KAUL HIMANSHU , ANDERS MARK A , MATHEW SANU K , YAO ANBANG , RAY JOYDEEP , TANG PING T , STRICKLAND MICHAEL S , CHEN XIAOMING , SHPEISMAN TATIANA , APPU ABHISHEK R , KOKER ALTUG , SINHA KAMAL , VEMBU BALAJI , NURVITADHI ERIKO , BARIK RAJKISHORE , LIN TSUNG-HAN , RANGANATHAN VASANTH , JAHAGIRDAR SANJEEV , GALOPPO VON BORRIES NICOLAS
-
17.
公开(公告)号:ES2913992T3
公开(公告)日:2022-06-07
申请号:ES18162635
申请日:2018-03-19
Applicant: INTEL CORP
Inventor: NURVITADHI ERIKO , VEMBU BALAJI , GALOPPO VON BORRIES NICOLAS C , BARIK RAJKISHORE , LIN TSUNG-HAN , SINHA KAMAL , SATISH NADATHUR RAJAGOPALAN , BOTTLESON JEREMY , AKHBARI FARSHAD , KOKER ALTUG , SRINIVASA NARAYAN , KIM DUKHWAN , BAGHSORKHI SARA S , GOTTSCHLICH JUSTIN E , CHEN FENG , OULD-AHMED-VALL ELMOUSTAPHA , NEALIS KEVIN , CHEN XIAOMING , YAO ANBANG
Abstract: Un aparato de cálculo (1400) para realizar operaciones de aprendizaje automático, comprendiendo el aparato de cálculo: una unidad de decodificación (1421) para decodificar una instrucción sencilla en una instrucción decodificada, la instrucción decodificada para hacer que el aparato de cálculo realice una operación de cálculo de aprendizaje automático compleja, en donde la operación de cálculo de aprendizaje automático compleja es para realizar una convolución para una red neuronal convolucional, en donde la convolución incluye múltiples operaciones matriciales; una unidad de extracción (1421) para extraer la instrucción sencilla; lógica de análisis de parámetro (1512) para determinar un tipo de operaciones de aprendizaje automático para realizar para la instrucción sencilla basándose en parámetros que incluyen dimensiones de filtro convolucional; lógica de aceleración de aprendizaje automático (1516) para determinar un conjunto de operaciones para realizar la instrucción decodificada; un controlador del planificador (1422) para planificar las múltiples operaciones matriciales a uno o más de múltiples tipos de unidades de cálculo, en donde los múltiples tipos de unidades de cálculo incluyen una unidad de cálculo de gráficos de fin general y una unidad de cálculo de datos cercanos; y un microcontrolador (1510) para ejecutar instrucciones de firmware, las instrucciones de firmware para posibilitar la lógica de análisis de parámetro y la lógica de aceleración de aprendizaje automático.
-
公开(公告)号:PL3382504T4
公开(公告)日:2022-02-21
申请号:PL18158485
申请日:2018-02-23
Applicant: INTEL CORP
-
公开(公告)号:DE112020000902T5
公开(公告)日:2021-11-04
申请号:DE112020000902
申请日:2020-02-12
Applicant: INTEL CORP
Inventor: VEMULAPALLI VIKRANTH , STRIRAMASSARMA LAKSHMINARAYANAN , MACPHERSON MIKE , ANANTARAMAN ARAVINDH , ASHBAUGH BEN , RAMADOSS MURALI , SADLER WILLIAM B , PEARCE JONATHAN , JANUS SCOTT , INSKO BRENT , RANGANATHAN VASANTH , SINHA KAMAL , HUNTER ARTHUR , SURTI PRASOONKUMAR , GALOPPO VON BORRIES NICOLAS , RAY JOYDEEP , APPU ABHISHEK R , OULD-AHMED-VALL ELMOUSTAPHA , KOKER ALTUG , KIM SUNGYE , MAIYURAN SUBRAMANIAM , ANDREI VALENTIN
IPC: G06F12/0862
Abstract: Ausführungsbeispiele sind im Allgemeinen auf das Vorabrufen von Daten für die Grafikdatenverarbeitung gerichtet. Eine Ausführungsform einer Vorrichtung umfasst einen oder mehrere Prozessoren, einschließlich einer oder mehrerer Grafikverarbeitungseinheiten (GPUs); und mehrere Caches zum Bereitstellen von Speicher für die eine oder mehreren GPUs, wobei die mehreren Caches mindestens einen L1-Cache und einen L3-Cache umfassen, wobei die Vorrichtung zum Bereitstellen eines intelligenten Vorabrufens von Daten durch einen Vorabrufer einer ersten GPU des einen oder mehr GPUs, einschließlich der Messung einer Trefferrate für den L1-Cache; beim Bestimmen, dass die Trefferrate für den L1-Cache gleich oder größer als ein Schwellenwert ist, Begrenzen eines Vorabrufens von Daten auf den Speicher im L3-Cache und beim Bestimmen, dass die Trefferrate für den L1-Cache kleiner als ein Schwellenwert ist, Ermöglichen des Vorabrufens von Daten in den L1-Cache.
-
-
-
-
-
-
-
-