Abstract:
Ein System zur Videosegmentierung kann ein neuronales Netzwerk und einen Speicher beinhalten, der Mehrfachbereichsarrays beinhaltet. Die Mehrfachbereichsarrays können Merkmalsabbildungsarrays speichern, die eine unterschiedliche Anzahl von Merkmalsabbildungen beinhalten. Das System kann jeweils eine Merkmalsabbildung aus einem Frame in einem Video erzeugen und die Merkmalsabbildung im Speicher speichern. Die Merkmalsabbildung kann sich in einem Merkmalsabbildungsarray befinden, das auch eine oder mehrere Kontextmerkmalsabbildungen beinhaltet, die aus anderen Frames in dem Video erzeugt werden. Das System verwendet das Merkmalsabbildungsarray, um zu bestimmen, ob der Frame in ein Segment des Videos fällt. Das System kann später eine neue Merkmalsabbildung aus einem anderen Frame erzeugen und die neue Merkmalsabbildung in einem neuen Merkmalsabbildungsarray einschließen, das auch die erste Merkmalsabbildung beinhaltet. Das System verwendet das neue Merkmalsabbildungsarray, um zu bestimmen, ob der neue Frame in ein Segment fällt.
Abstract:
Una unidad de procesamiento de gráficos, GPU, para acelerar operaciones de aprendizaje automático, comprendiendo la GPU: un multiprocesador (1400) en donde el multiprocesador (1400) ha de ejecutar una misma instrucción para múltiples hilos y de ejecutar hilos paralelos de un grupo de hilos, teniendo cada hilo del grupo de hilos un estado de hilo independiente, siendo la instrucción para hacer que una primera unidad de cómputo (1411,..., 1418) realice al menos una operación de multiplicación de matrices bidimensionales; en donde la operación se realiza sobre tres operandos de entrada enteros sin signo de 16 bits a, b y c, e incluye computar, por un multiplicador de 16 bits × 16 bits con signo, un producto intermedio de 32 bits entre un operando entero sin signo de 16 bits a y un operando de entrada entero sin signo de 16 bits b y computar, por un sumador de 32 bits, una suma de 32 bits basándose en el producto intermedio de 32 bits y en un operando de entrada entero sin signo de 16 bits c.
Abstract:
Una unidad de procesamiento de gráficos de propósito general (214), que incluye: un multiprocesador de transmisión continua (234, 1400) que tiene una arquitectura de tipo "una sola instrucción, múltiples subprocesos", SIMT, que incluye múltiples subprocesos de hardware, donde el multiprocesador de transmisión continua (234, 1400) comprende: múltiples conjuntos de unidades de cálculo (1411-1418), presentando cada unidad de cálculo (1411-1418) una unidad lógica de coma flotante (1411B - 1418B) configurada para realizar operaciones de coma flotante y una unidad lógica de números enteros (1411A - 1418A) configurada para realizar operaciones de números enteros; y una memoria (270, 272) acoplada a los múltiples conjuntos de unidades de cálculo, caracterizada por que en una unidad de cálculo, la unidad lógica de números enteros está habilitada para ejecutar un subproceso de una primera instrucción, mientras que la unidad lógica de coma flotante está habilitada para ejecutar un subproceso de una segunda instrucción, siendo la segunda instrucción diferente de la primera instrucción y ejecutándose el subproceso de la primera instrucción simultáneamente con el subproceso de la segunda instrucción.
Abstract:
Die Offenbarung betrifft eine Bruchteil-Bit-Netzquantisierung und den Einsatz von CNN-Modellen. Ein KI-Beschleuniger, der Folgendes beinhaltet: einen Eingabepuffer, der dazu konfiguriert ist, ein Eingabebild zu puffern; einen Gewichstpuffer, der dazu konfiguriert ist, Faltungskernindices für eine Faltungsschicht eines CNN-Modells zu puffern; einen Kernmusterpuffer, der dazu konfiguriert ist, eine 1-Bit-Faltungskern-Teilmenge für die Faltungsschicht des CNN-Modells zu puffern, wobei die 1-Bit-Faltungskern-Teilmenge 2τ1-Bit-Faltungskerne mit einer Größe von K × K beinhaltet; ein PE-Array, das einen oder mehrere PE-Knoten beinhaltet, von denen jeder dazu konfiguriert ist, Faltungsergebnisse eines Bildgebiets des Eingabebildes und der 1-Bit-Faltungskerne, die den Faltungskernindices in der 1-Bit-Faltungskern-Teilmenge entsprechen, zu erzeugen; und einen Ausgabepuffer, der dazu konfiguriert ist, Faltungsergebnisse jeweiliger Bildgebiete des Eingabebildes und die 1-Bit-Faltungskerne, die den Faltungskernindices entsprechen, zu puffern.
Abstract:
Una realización proporciona un acelerador de hardware de aprendizaje automático que comprende una unidad de cómputo que tiene un sumador y un multiplicador que se comparten entre la ruta de datos enteros y una ruta de datos de punto flotante, los bits superiores de los operandos de entrada al multiplicador se activan durante el punto flotante. operación. (Traducción automática con Google Translate, sin valor legal)
Abstract:
Una realización proporciona una unidad de procesamiento de gráficos de propósito general que comprende una unidad de punto flotante de precisión dinámica que incluye una unidad de control que tiene lógica de hardware de seguimiento de precisión para rastrear un número disponible de bits de precisión para datos computados en relación con una precisión objetivo, en donde la precisión dinámica la unidad de punto flotante incluye lógica computacional para generar datos con múltiples precisiones. (Traducción automática con Google Translate, sin valor legal)