-
公开(公告)号:DE112010003810B4
公开(公告)日:2019-02-21
申请号:DE112010003810
申请日:2010-11-15
Applicant: IBM
Inventor: DOI JUN , NEGISHI YASUSHI
IPC: G06F9/50 , G06F15/173 , G06F15/80
Abstract: Eine Vielzahl von Berechnungsverfahren einschließlich All-to-All Kommunikation (A2A) wird optimal zwischen einer Vielzahl von Knoten (Prozessoren), die ein n-dimensionales (Ring oder Maschen)-Netzwerk bilden, geplant. Die Vielzahl von Knoten (Prozessoren), die das Netzwerk formen, sind aufgeteilt in eine Kommunikations- (Berechnungsverfahren) Phase (A2A-L), in der All-to-All Kommunikation nur zwischen einer Vielzahl von Knoten, enthalten in einer ersten Teil-Gruppe, erforderlich ist, und eine Kommunikations- (Berechnungsverfahren) Phase (A2A-P), in der All-to-All Kommunikation nur zwischen einer Vielzahl von Knoten, enthalten in einer zweiten Teil-Gruppe, erforderlich ist, und die Phasen werden gebildet, um für die parallele Verarbeitung über eine Vielzahl von Threads(Thread 1, Thread 2, Thread 3 und Thread 4) zu überlappen. Die parallele Verarbeitung kann für eine solche Vielzahl von Berechnungsverfahren wie FFT (schnelle Fourier-Transformation) und auch T (Transponierte) (interne Transponierte) durchgeführt werden.
-
公开(公告)号:DE112019000382T5
公开(公告)日:2020-09-24
申请号:DE112019000382
申请日:2019-03-04
Applicant: IBM
Inventor: DOI JUN
IPC: G06F9/38
Abstract: Ein computer-implementiertes Verfahren, ein Computerprogrammprodukt und eine Vorrichtung werden bereitgestellt. Das Verfahren umfasst das Einsetzen von N×N ersten ganzzahligen Elementen einer Vielzahl von ersten ganzzahligen Elementen, die durch Aufteilen, in einer ersten Stellenrichtung, erster ganzzahliger Daten erhalten werden, die eine erste ganze Zahl darstellen, in eine erste Matrix mit N Zeilen und N Spalten. Das Verfahren umfasst ferner das Einsetzen jedes von einem oder mehreren zweiten ganzzahligen Elementen einer Vielzahl von zweiten ganzzahligen Elementen, die durch Aufteilen, in einer zweiten Stellenrichtung, zweiter ganzzahliger Daten erhalten werden, die eine zweite ganze Zahl darstellen, in mindestens ein Matrixelement einer zweiten Matrix mit N Zeilen und N Spalten. Das Verfahren umfasst auch das Berechnen einer dritten Matrix, die ein Produkt aus der ersten Matrix und der zweiten Matrix ist. Das Verfahren umfasst das Ausgeben jedes Matrixelements der dritten Matrix als ein Teilprodukt in einer Berechnung eines Produkts aus der ersten ganzen Zahl und der zweiten ganzen Zahl.
-
公开(公告)号:DE112010003810T5
公开(公告)日:2012-11-22
申请号:DE112010003810
申请日:2010-11-15
Applicant: IBM
Inventor: DOI JUN , NEGISHI YASUSHI
IPC: G06F9/50 , G06F15/173 , G06F15/80
Abstract: Eine Vielzahl von Berechnungsverfahren einschließlich All-to-All Kommunikation (A2A) wird optimal zwischen einer Vielzahl von Knoten (Prozessoren), die ein n-dimensionales (Ring oder Maschen)-Netzwerk bilden, geplant. Die Vielzahl von Knoten (Prozessoren), die das Netzwerk formen, sind aufgeteilt in eine Kommunikations-(Berechnungsverfahren) Phase (A2A-L), in der All-to-All Kommunikation nur zwischen einer Vielzahl von Knoten, enthalten in einer ersten Teil-Gruppe, erforderlich ist, und eine Kommunikations-(Berechnungsverfahren) Phase (A2A-P), in der All-to-All Kommunikation nur zwischen einer Vielzahl von Knoten, enthalten in einer zweiten Teil-Gruppe, erforderlich ist, und die Phasen werden gebildet, um für die parallele Verarbeitung über eine Vielzahl von Threads (Thread 1, Thread 2, Thread 3 und Thread 4) zu überlappen. Die parallele Verarbeitung kann für eine solche Vielzahl von Berechnungsverfahren wie FFT (schnelle Fourier-Transformation) und auch T (Transponierte) (interne Transponierte) durchgeführt werden.
-
公开(公告)号:GB2487684A
公开(公告)日:2012-08-01
申请号:GB201206822
申请日:2010-11-15
Applicant: IBM
Inventor: DOI JUN , NEGISHI YASUSHI
Abstract: A plurality of computing processes including all-to-all (A2A) communication are optimally scheduled across a plurality of nodes (processors) constituting an n-dimensional (torus or mesh) network. The plurality of nodes (processors) constituting a network are partitioned into a communication (computing process) phase (A2A-L) requiring all-to-all communication for only among a plurality of nodes included in a first partial group, and a communication (computing) phase (A2A-P) requiring all-to-all communication for only among a plurality of nodes included in a second partial group, and the phases are made to overlap for parallel processing across a plurality of threads (thread 1, thread 2, thread 3, and thread 4). Parallel processing can be performed for such a plurality of computing processes as FFT (Fast Fourier Transform) and T (transpose) (internal transpose) as well.
-
-
-