Abstract:
PROBLEM TO BE SOLVED: To provide a method and an apparatus for implementing a power of two estimation function in a general purpose floating point processor. SOLUTION: The floating point number is stored within a memory. The floating point number includes a sign bit, a plurality of exponent bits, and a mantissa having an implied bit and multiple fraction bits. In response to a floating point instruction, the mantissa is partitioned into an integer part and a fraction part, based on the value of the exponent bits. A floating number result is formed by assigning an integer part of the floating-point number as an unbiased exponent of the floating-point result, and by utilizing combinational logic hardware for converting a fraction part of the floating point number to the fraction part of the floating point result. COPYRIGHT: (C)2005,JPO&NCIPI
Abstract:
In einer Multithread-Grafikverarbeitungsarchitektur verwendete, häufig genutzte Zustandsdaten werden in einer Vektorregisterdatei einer Verarbeitungseinheit zwischengespeichert, um Zugriffe auf die Zustandsdaten zu optimieren und die damit verbundene Verwendung des Speicherbusses zu minimieren. Eine Verarbeitungseinheit kann eine Festkomma-Ausführungseinheit sowie eine Vektor-Gleitkomma-Ausführungseinheit enthalten, und eine von der Vektor-Gleitkomma-Ausführungseinheit verwendete Vektorregisterdatei kann dazu verwendet werden, von der Festkomma-Ausführungseinheit verwendete und nach Bedarf in die Universalregister übertragene Zustandsdaten zwischenzuspeichern, wodurch der Bedarf für das wiederholte Abrufen und Zurückschreiben der Zustandsdaten von und in einen L1-Cachespeicher oder einen Cachespeicher auf niedrigerer Ebene, auf den die Festkomma-Ausführungseinheit zugreift, verringert wird.
Abstract:
Schaltkreisanordnung, die Folgendes umfasst:Network-on-Chip-Hardware-Logik, die eine Vielzahl von eine Vielzahl von Hardware-Threads festlegenden Verarbeitungskernen und ein chipintegriertes Netzwerk enthält, das die Vielzahl von Verarbeitungskernen miteinander verbindet; undeine von mindestens einem Teil der Vielzahl von Hardware-Threads ausgeführte Physik-Engine, wobei die Physik-Engine eine Multithread-Software-Pipeline enthält, die eine Vielzahl von Stufen enthält, die so konfiguriert sind, dass sie Zusammenstöße zwischen Objekten aus einer Vielzahl von Objekten in einer Szene erkennen, sowie eine Vielzahl von Impuls-Weiterleitungs-Threads enthält, die so konfiguriert sind, dass sie Impulse zwischen einer Reihe von benachbarten Objekten aus der Vielzahl von sich berührenden Objekten weiterleiten;wobei die Physik-Engine so konfiguriert ist, dass sie für jedes aus der Reihe von benachbarten Objekten den Besitz an dem Objekt einem der Vielzahl von Impuls-Weiterleitungs-Threads zuweist und eine Tabelle über benachbarte Objekte für den Impuls-Weiterleitungs-Thread erzeugt, dem das Objekt zugewiesen ist, die jedes Objekt aus der Reihe von benachbarten Objekten identifiziert, die das Objekt berührt;wobei die Physik-Engine so konfiguriert ist, dass sie als Reaktion auf einen erkannten Zusammenstoß mit einem ersten Objekt aus der Reihe von benachbarten Objekten eine erste thread-übergreifende Impulsnachricht erzeugt, die eine Größenordnung und eine Richtung enthält;wobei jeder Impuls-Weiterleitungs-Thread unter der Vielzahl von Impuls-Weiterleitungs-Threads so konfiguriert ist, dass er als Reaktion auf das Empfangen einer einem Impuls zugehörigen thread-übergreifenden Impulsnachricht den Impuls lokal durch ein Objekt weiterleitet, dessen Besitz dem Impuls-Weiterleitungs-Thread zugewiesen ist, für jedes in der Tabelle über benachbarte Objekte für den Impuls-Weiterleitungs-Thread identifizierte benachbarte Objekt eine Größenordnung und eine Richtung einer weitergeleiteten Kraft ermittelt, den Impuls für jedes in der Tabelle über benachbarte Objekte für den Impuls-Weiterleitungs-Thread identifizierte benachbarte Objekt an den Impuls-Weiterleitungs-Thread weiterleitet, indem er eine thread-übergreifende Impulsnachricht an diesen sendet, welche die dafür ermittelte Größenordnung und Richtung der weitergeleiteten Kraft enthält, eine thread-übergreifende Impulsbestätigungsnachricht von jedem benachbarten Objekt empfängt, das in der Tabelle über benachbarte Objekte für den Impuls-Weiterleitungs-Thread identifiziert wurde,eine Größenordnung und eine Richtung einer Reaktionskraft zumindest teilweise beruhend auf den thread-übergreifenden Impulsbestätigungsnachrichten ermittelt und eine thread-übergreifende Impulsbestätigungsnachricht mit der Größenordnung und Richtung der Reaktionskraft als Bestätigung für die empfangene thread-übergreifende Impulsnachricht sendet, undwobei die Physik-Engine so konfiguriert ist, dass sie als Reaktion auf das Erkennen eines zukünftigen Zusammenstoßes zwischen Objekten in einer Szene eine Neuzuordnung der Arbeitslast unter der Vielzahl von Impuls-Weiterleitungs-Threads wahlweise in Abhängigkeit von Objekteigenschaften der als zukünftig zusammenstoßend erkannten Objekten einleitet,
Abstract:
In einer Multithread-Grafikverarbeitungsarchitektur verwendete, häufig genutzte Zustandsdaten werden in einer Vektorregisterdatei einer Verarbeitungseinheit zwischengespeichert, um Zugriffe auf die Zustandsdaten zu optimieren und die damit verbundene Verwendung des Speicherbusses zu minimieren. Eine Verarbeitungseinheit kann eine Festkomma-Ausführungseinheit sowie eine Vektor-Gleitkomma-Ausführungseinheit enthalten, und eine von der Vektor-Gleitkomma-Ausführungseinheit verwendete Vektorregisterdatei kann dazu verwendet werden, von der Festkomma-Ausführungseinheit verwendete und nach Bedarf in die Universalregister übertragene Zustandsdaten zwischenzuspeichern, wodurch der Bedarf für das wiederholte Abrufen und Zurückschreiben der Zustandsdaten von und in einen L1-Cachespeicher oder einen Cachespeicher auf niedrigerer Ebene, auf den die Festkomma-Ausführungseinheit zugreift, verringert wird.
Abstract:
Ein Hypervisor und ein oder mehrere Programme, z. B. Guest-Betriebssysteme und/oder Benutzerprozessoren oder von dem Hypervisor gehostete Anwendungen sind so konfiguriert, dass sie selektiv über separate Hypervisor-Modus- und Guest-Modus- und/oder Benutzermodus-Anweisungen die Zustände der Sprungvorhersage-Logik speichern und wiederherstellen. Dadurch können unterschiedliche Sprungvorhersage-Strategien für unterschiedliche gehostete Betriebssysteme und Benutzeranwendungen verwendet werden, wodurch ein differenzierteres Optimieren der Sprungvorhersage-Logik gewährleistet werden kann.
Abstract:
Verfahren für das Zugreifen auf Daten in einem Datenverarbeitungssystem, wobei das Verfahren aufweist:in Reaktion auf eine Speicherzugriffs-Anforderung, die von einem Thread in einem Verarbeitungskern (450) eingeleitet wurde, Zugreifen auf eine Speicheradressübersetzungs-Datenstruktur (456), um eine Speicheradressübersetzung für die Speicherzugriffs-Anforderung durchzuführen, wobei der Verarbeitungskern einen sicheren L1-Cahcespeicher (460) zur Speicherung von verschlüsselten Daten, einen anderen L1-Cachespeicher (458) zur Speicherung von nicht verschlüsselten Daten und ein integriertes Verschlüsselungsmodul (452) aufweist;Zugreifen auf ein verschlüsselungsbezogenes Seitenattribut in der Speicheradressübersetzungs-Datenstruktur, um zu ermitteln, ob die mit der Speicherzugriffs-Anforderung verknüpfte Speicherseite verschlüsselt ist; undErfüllen der Speicherzugriffs-Anforderung durchselektives Leiten von sicheren Daten auf der Speicherseite durch das integriertes Verschlüsselungsmodul, um sie einem Entschlüsselungsvorgang zu unterziehen, davon abhängig, ob die mit der Speicherzugriffs-Anforderung verknüpfte Speicherseite als verschlüsselt ermittelt wurde und in dem sicheren L1-Cachespeicher gespeichert ist; undVerwenden von Daten auf der Speicherseite, davon abhängig, ob die mit der Speicherzugriffs-Anforderung verknüpfte Speicherseite in dem anderen L1-Cachespeicher gespeichert ist.
Abstract:
Eine Schaltkreisanordnung und ein Verfahren realisieren die Impulsweiterleitung in einer Multithread-Physik-Engine, indem der Besitz von Objekten in einer Szene einzelnen Threads zugewiesen wird und Impulse zwischen sich berührenden Objekten weitergeleitet werden, indem thread-übergreifende Impulsnachrichten zwischen den Threads weitergeleitet werden, denen die sich berührenden Objekte gehören, während durch Verwendung der Threads, denen derartige Objekte zugewiesen sind, Impulse lokal durch Objekte weitergeleitet werden.
Abstract:
Ein Verfahren und eine Schaltungsanordnung leiten Daten auf der Grundlage von verschlüsselungs- und/oder komprimierungsbezogenen Seitenattributen, die in einer Speicheradressübersetzungs-Datenstruktur, wie Effective To Real Translation (ERAT) oder Adressumsetzpuffer (TLB), gespeichert sind, selektiv zu einem Verschlüsselungs- oder Komprimierungsmodul. Auf eine Speicheradressübersetzungs-Datenstruktur kann beispielsweise in Verbindung mit einer Speicherzugriffs-Anforderung für Daten auf einer Speicherseite zugegriffen werden, so dass mit der Speicherseite in der Datenstruktur verknüpfte Attribute verwendet werden können, um im Rahmen der Bearbeitung der Speicherzugriffs-Anforderung zu steuern, ob Daten ver-/entschlüsselt und/oder komprimiert/dekomprimiert sind.
Abstract:
Ein bestimmtes Verfahren weist ein Empfangen durch einen Prozessor einer Instruktion und einer Adresse der Instruktion auf. Das Verfahren weist außerdem ein Verhindern einer Aufführung der Instruktion mindestens in Teilen basierend auf einer Bestimmung, dass die Adresse innerhalb eines Bereiches von Adressen liegt, auf.