EFFICIENT ZERO-BASED DECOMPRESSION
    51.
    发明公开
    EFFICIENT ZERO-BASED DECOMPRESSION 审中-公开
    高效从零开始减压术

    公开(公告)号:EP2798478A4

    公开(公告)日:2016-12-21

    申请号:EP11878962

    申请日:2011-12-30

    Applicant: INTEL CORP

    CPC classification number: G06F9/30018 G06F9/30036 H03M7/46

    Abstract: A processor core including a hardware decode unit to decode vector instructions for decompressing a run length encoded (RLE) set of source data elements and an execution unit to execute the decoded instructions. The execution unit generates a first mask by comparing set of source data elements with a set of zeros and then counts the trailing zeros in the mask. A second mask is made based on the count of trailing zeros. The execution unit then copies the set of source data elements to a buffer using the second mask and then reads the number of RLE zeros from the set of source data elements. The buffer is shifted and copied to a result and the set of source data elements is shifted to the right. If more valid data elements are in the set of source data elements this is repeated until all valid data is processed.

    EFFIZIENTES BEREICHSBASIERTES SPEICHER-RÜCKSCHREIBEN ZUM VERBESSERN DER HOST-ZU-GERÄTE-KOMMUNIKATION FÜR OPTIMALE ENERGIE UND LEISTUNG

    公开(公告)号:DE102018002294A1

    公开(公告)日:2018-10-04

    申请号:DE102018002294

    申请日:2018-03-19

    Applicant: INTEL CORP

    Abstract: Ein Verfahren und eine Vorrichtung für effizientes bereichsbasiertes Speicher-Rückschreiben werden hier beschrieben. Eine Ausführungsform einer Vorrichtung beinhaltet einen Systemspeicher, eine Vielzahl von Hardware-Prozessorkernen, von denen jeder einen ersten Cache enthält, eine Decoderschaltung zum Decodieren eines Befehls, die Felder für eine erste Speicheradresse und einen Bereichsindikator aufweist, und eine Ausführungsschaltung zum Ausführen des decodierten Befehls. Zusammen definieren die erste Speicheradresse und der Bereichsindikator einen zusammenhängenden Bereich im Systemspeicher, der eine oder mehrere Cache-Zeilen enthält. Eine Ausführung des decodierten Befehls bewirkt, dass beliebige Instanzen der einen oder mehreren Cache-Zeilen im ersten Cache annulliert werden. Außerdem sind jegliche annullierten Instanzen der einen oder mehreren Cache-Zeilen, die schmutzig sind, im Systemspeicher zu speichern.

    Verfahren, Vorrichtungen, Befehle und Logik zum Bereitstellen von Vektoradressenkonflikt-Detektionsfunktionalität

    公开(公告)号:DE112013005416T5

    公开(公告)日:2015-07-30

    申请号:DE112013005416

    申请日:2013-06-30

    Applicant: INTEL CORP

    Abstract: Befehle und eine Logik stellen eine SIMD-Adressenkonflikt-Detektionsfunktionalität bereit. Einige Ausführungsformen umfassen Prozessoren mit einem Register mit einer variablen Anzahl von Datenfeldern, wobei jedes der Datenfelder einen Versatz für ein Datenelement in einem Speicher speichern soll. Ein Zielregister hat entsprechende Datenfelder, wobei jedes dieser Datenfelder eine variable zweite Anzahl von Bits speichern soll, um eine Konfliktmaske mit einem Maskenbit für jeden Versatz zu speichern. Als Antwort auf die Decodierung eines Vektorkonfliktbefehls vergleichen Ausführungseinheiten den Versatz in jedem Datenfeld mit jedem niedrigerwertigen Datenfeld, um zu bestimmen, ob sie einen übereinstimmenden Versatz tragen, und setzen in entsprechenden Konfliktmasken in dem Zielregister jegliche Maskenbits, die einem niedrigerwertigen Datenfeld entsprechen, das einen übereinstimmenden Versatz aufweist. Eine Vektoradressenkonfliktdetektion kann mit Elementen variabler Größe verwendet werden und zum Erzeugen von Konfliktmasken verwendet werden, um Abhängigkeiten in Sammeln-Modifizieren-Verteilen-SIMD-Operationen zu lösen.

    Addierbefehle, um drei Quelloperanden zu addieren

    公开(公告)号:DE102010051476B4

    公开(公告)日:2015-05-13

    申请号:DE102010051476

    申请日:2010-11-15

    Applicant: INTEL CORP

    Abstract: Verfahren (100), umfassend: Empfangen (102) eines Addierbefehls, wobei der Addierbefehl einen ersten Quelloperanden, einen zweiten Quelloperanden und einen dritten Quelloperanden anzeigt; und Speichern (104) einer Summe, die unter Verwendung des ersten, zweiten und dritten Quelloperanden als ein Resultat des Addierbefehls berechnet wurde, wobei die Summe teilweise in einem Zieloperanden angezeigt durch den Addierbefehl und teilweise in einer Mehrzahl von Flags gespeichert wird, wobei teilweises Speichern (104) der Summe in der Mehrzahl von Flags das Speichern der Summe teilweise in einem Carry-Flag und teilweise in einem zweiten Flag umfasst, wobei das zweite Flag ein im Zweck neu bestimmtes architektonisches Flag umfasst, das in einer Befehlssatz-Architektur vor einer Einfügung des Addier-Befehls in die Befehlssatz-Architektur existierte, und wobei der Addier-Befehl das im Zweck neu bestimmte Architektur-Flag in einer anderen Weise verwendet als eine Mehrzahl anderer Befehle in der Befehlssatz-Architektur das im Zweck neu bestimmte Architektur-Flag verwenden.

    Instruction emulation processors, methods, and systems

    公开(公告)号:GB2514882A

    公开(公告)日:2014-12-10

    申请号:GB201404410

    申请日:2014-03-13

    Applicant: INTEL CORP

    Abstract: A processor of an aspect includes decode logic (105) to receive a first instruction and to determine that the first instruction is to be emulated. The processor also includes emulation mode aware post-decode instruction processor logic (107) coupled with the decode logic. The emulation mode aware post-decode instruction processor logic is to process one or more control signals decoded from an instruction. The instruction is one of a set of one or more instructions used to emulate the first instruction. The one or more control signals are to be processed differently by the emulation mode aware post-decode instruction processor logic when in an emulation mode than when not in the emulation mode. Exceptions may be handled differently or different resources (processor, memory, security logic, random number generator logic, encryption logic) may be accessed. Other apparatus are also disclosed as well as methods and systems. The processor might not use microcode.

    Befehle und Logik zur Vektorisierung von bedingten Schleifen

    公开(公告)号:DE102013021221A1

    公开(公告)日:2014-07-03

    申请号:DE102013021221

    申请日:2013-12-17

    Applicant: INTEL CORP

    Abstract: Befehle und Logik stellen eine Vektorisierung von bedingten Schleifen bereit. Ein Vektorerweiterungsbefehl weist einen Parameter zur Bestimmung eines Quellenvektors, einen Parameter zur Bestimmung eines Bedingungsmaskenregisters und einen Destinationsparameter zur Bestimmung eines Destinationsvektors zum Halten von n fortlaufenden Vektorelementen auf, wobei jedes der Vielzahl von n fortlaufenden Vektorelementen eine gleiche variable Unterteilungsgröße von m Bytes aufweist. Als Reaktion auf den Prozessorbefehl werden Daten von fortlaufenden Vektorelementen in dem Quellenvektor kopiert und in unmaskierte Vektorelemente des bestimmten Destinationsvektors erweitert, ohne dass Daten in maskierte Vektorelemente des Destinationsvektors kopiert werden, wobei sich n als Reaktion auf den ausgeführten Prozessorbefehl verändert. Der Quellenvektor kann ein Register sein, und der Destinationsvektor kann sich im Speicher befinden. Einige Ausführungsformen speichern Zählwerte der Bedingungsentscheidungen. Alternative Ausführungsformen können andere Daten speichern, zum Beispiel etwa Zieladressen oder den Tabellenversatz oder Indikatoren von Verarbeitungsanweisungen usw.

Patent Agency Ranking