FUSIONIERBARE BEFEHLE UND LOGIK ZUM VERSEHEN MIT OR-TEST- UND AND-TEST-FUNKTIONALITÄT UNTER BENUTZEN VON MEHRFACHTESTQUELLEN

    公开(公告)号:DE102014003563A1

    公开(公告)日:2014-09-18

    申请号:DE102014003563

    申请日:2014-03-13

    Applicant: INTEL CORP

    Abstract: Fusionierbare Befehle und Logik versehen Mehrfachtestquellen mit OR-Test- und AND-Testfunktionalität. Einige Ausführungsformen beinhalten eine Prozessor-Decodierstufe, um einen Testbefehl zur Ausführung zu decodieren, wobei der Befehl den ersten, zweiten und dritten Quelldatenoperanden und einen Operationstyp spezifiziert. Ausführungseinheiten, die auf den decodierten Testbefehl reagieren können, führen entsprechend dem spezifizierten Operationstyp eine logische Operation zwischen Daten von dem ersten und dem zweiten Quelldatenoperanden durch und führen eine zweite logische Operation zwischen den Daten von dem dritten Quelldatenoperanden und dem Ergebnis der ersten logischen Operation durch, um ein Bedingungs-Flag zu setzen. Einige Ausführungsformen erzeugen. den Testbefehl dynamisch, indem sie einen logischen Befehl mit einem Testbefehl des Standes der Technik fusionieren. Andere Ausführungsformen erzeugen den Testbefehl durch einen Just-in-Time-Compiler. Einige Ausführungsformen fusionieren auch den Testbefehl mit einem nachfolgenden bedingten Verzweigungsbefehl und führen je nachdem, wie das Bedingungs-Flag gesetzt ist, eine Verzweigung aus.

    VORRICHTUNG UND VERFAHREN ZUR VEKTOR-MULTIPLIKATIONSAKKUMULATION VON GEPACKTEN BYTES

    公开(公告)号:DE102018133018A1

    公开(公告)日:2019-07-25

    申请号:DE102018133018

    申请日:2018-12-20

    Applicant: INTEL CORP

    Abstract: Eine Vorrichtung und ein Verfahren zum Durchführen von Multiplikationsakkumulationsoperationen. Beispielsweise umfasst eine Ausführungsform eines Prozessors: einen Decoder zum Decodieren von Befehlen; ein erstes Quellregister zum Speichern einer ersten Mehrzahl von gepackten Bytes; ein zweites Quellregister zum Speichern einer zweiten Mehrzahl von gepackten Bytes; ein drittes Quellregister zum Speichern einer Mehrzahl von gepackten Doppelwörtern; Ausführungsschaltungen zum Ausführen eines ersten Befehls, die Ausführungsschaltungen umfassend: Erweiterungsschaltungen zum Durchführen einer Vorzeichenerweiterung oder Nullerweiterung der ersten und der zweiten Mehrzahl von gepackten Bytes, um eine erste und eine zweite Mehrzahl von Wörtern zu generieren, die der ersten und der zweiten Mehrzahl von gepackten Bytes entsprechen; Multiplizierschaltungen zum Multiplizieren von jedem der ersten Mehrzahl von Wörtern mit einem entsprechenden der zweiten Mehrzahl von Wörtern, um eine Mehrzahl von temporären Produkten zu generieren; Addierschaltungen zum Addieren von wenigstens einem ersten Satz der temporären Produkte, um eine erste temporäre Summe zu generieren; Akkumulationsschaltungen zum Kombinieren der ersten temporären Summe mit einem ersten gepackten Doppelwortwert von einem ersten Doppelwortort im dritten Quellregister, um ein erstes akkumuliertes Doppelwortergebnis zu generieren; ein Zielregister zum Speichern des ersten akkumulierten Doppelwortergebnisses am ersten Doppelwortort.

    Einrichtung und Verfahren zum Vektormultiplizieren und Akkumulieren von gepackten Wörtern

    公开(公告)号:DE102018131842A1

    公开(公告)日:2019-07-25

    申请号:DE102018131842

    申请日:2018-12-12

    Applicant: INTEL CORP

    Abstract: Eine Einrichtung und ein Verfahren zum Durchführen von Multiply-Accumulate-Operationen. Zum Beispiel umfasst eine Ausführungsform eines Prozessors: einen Decoder zum Decodieren von Befehlen; ein erstes Quellregister zum Speichern einer ersten Vielzahl von gepackten Wörtern; ein zweites Quellregister zum Speichern einer zweiten Vielzahl von gepackten Wörtern; ein drittes Quellregister zum Speichern einer Vielzahl von gepackten Quadwörtern; eine Ausführungsschaltung zum Ausführen eines ersten Befehls, die Ausführungsschaltung umfassend: eine Erweiterungsschaltung zum Vorzeichenerweitern oder Nullerweitern der ersten und zweiten Vielzahl von gepackten Wörtern, um eine erste und zweite Vielzahl von Doppelwörtern entsprechend der ersten und zweiten Vielzahl von gepackten Wörtern zu erzeugen; eine Multipliziererschaltung zum Multiplizieren von jedem der ersten Vielzahl von Doppelwörtern mit einem entsprechenden der zweiten Vielzahl von Doppelwörtern, um eine Vielzahl von temporären Produkten zu erzeugen; eine Addiererschaltung zum Addieren von zumindest einem ersten Satz der temporären Produkte, um eine erste temporäre Summe zu erzeugen; eine Akkumulationsschaltung zum Kombinieren der ersten temporären Summe mit einem ersten gepackten Quadwort-Wert von einem ersten Quadwort-Ort in dem dritten Quellregister, um ein erstes akkumuliertes Quadwort-Ergebnis zu erzeugen; ein Zielregister zum Speichern des ersten akkumulierten Quadwort-Ergebnisses in dem ersten Quadwort-Ort.

Patent Agency Ranking