Vorrichtung und Verfahren zum Vektormultiplizieren und Akkumulieren von vorzeichenbehafteten Doppelwörtern

    公开(公告)号:DE102018129298A1

    公开(公告)日:2019-06-27

    申请号:DE102018129298

    申请日:2018-11-21

    Applicant: INTEL CORP

    Abstract: Eine Vorrichtung und ein Verfahren zum Durchführen von vorzeichenbehafteter Multiplikation von gepackten vorzeichenbehafteten Doppelwörtern und Akkumulation mit einem vorzeichenbehafteten Quadwort. Zum Beispiel umfasst eine Ausführungsform eines Prozessors Folgendes: ein erstes Quellregister, um eine erste Vielzahl von gepackten vorzeichenbehafteten Doppelwort-Datenelementen zu speichern; ein zweites Quellregister, um eine zweite Vielzahl von gepackten vorzeichenbehafteten Doppelwort-Datenelementen zu speichern; ein drittes Quellregister, um eine Vielzahl von gepackten vorzeichenbehafteten Quadwort-Datenelementen zu speichern;Ausführungsschaltungsanordnung, um den decodierten Befehl auszuführen, wobei die Ausführungsschaltungsanordnung Folgendes umfasst:Multipliziererschaltungsanordnung, um ein erstes und zweites gepacktes vorzeichenbehaftetes Doppelwort-Datenelement aus dem ersten Quellregister mit einem dritten bzw. vierten gepackten vorzeichenbehafteten Doppelwort-Datenelement aus dem zweiten Quellregister zu multiplizieren, um ein erstes und zweites temporäres vorzeichenbehaftetes Quadwortprodukt zu generieren, wobei die Multipliziererschaltungsanordnung dazu dient, ein erstes, zweites, drittes und viertes vorzeichenbehaftetes Doppelwort-Datenelement auf Basis des Opcodes des Befehls auszuwählen; Akkumulationsschaltungsanordnung, um das erste temporäre vorzeichenbehaftete Quadwortprodukt mit einem ersten gepackten vorzeichenbehafteten Quadwortwert, der aus dem dritten Quellregister gelesen wird, zu kombinieren, um ein erstes akkumuliertes vorzeichenbehaftetes Quadwortergebnis zu generieren, und um das zweite temporäre vorzeichenbehaftete Quadwortprodukt mit einem zweiten gepackten vorzeichenbehafteten Quadwortwert, der aus dem dritten Quellregister gelesen wird, zu kombinieren, um ein zweites akkumuliertes vorzeichenbehaftetes Quadwortergebnis zu generieren; ein Zielregister oder das dritte

    Vorrichtung und Verfahren zur Vektormultiplikation vorzeichenbehafteter Wörter, Rundung und Sättigung

    公开(公告)号:DE102018128939A1

    公开(公告)日:2019-06-27

    申请号:DE102018128939

    申请日:2018-11-19

    Applicant: INTEL CORP

    Abstract: Vorrichtung und Verfahren zum Ausführen einer vorzeichenbehafteten gebrochenen Multiplikation gepackter Datenelemente. Eine Ausführungsform eines Prozessors umfasst z. B. Folgendes: einen Decodierer, um einen Befehl zu decodieren; ein erstes Quellregister, um erste mehrere gepackte vorzeichenbehaftete Wortdatenelemente zu speichern; ein zweites Quellregister, um zweite mehrere gepackte vorzeichenbehaftete Wortdatenelemente zu speichern; ein Steuerregister, um einen Rundungssteuerwert zu speichern, um eine Rundungsbetriebsart anzugeben; eine Ausführungsschaltungsanordnung, um den decodierten Befehl auszuführen, wobei die Ausführungsschaltungsanordnung Folgendes umfasst: eine Multipliziererschaltungsanordnung, um jedes der gepackten vorzeichenbehafteten Wortdatenelemente der ersten Mehreren mit einem entsprechenden gepackten vorzeichenbehafteten Wortdatenelement der zweiten Mehreren gleichzeitig zu multiplizieren, um mehrere vorzeichenbehaftete Doppelwortprodukte zu erzeugen; eine Umsetzungsschaltungsanordnung, um die mehreren vorzeichenbehafteten Doppelwortprodukte in mehrere gebrochene vorzeichenbehaftete Wörter umzusetzen, wobei die Umsetzungsschaltungsanordnung eine Rundungsschaltungsanordnung enthält, um die vorzeichenbehafteten Doppelwortprodukte in Übereinstimmung mit der durch den Rundungssteuerwert angegebenen Rundungsbetriebsart zu runden, um die mehreren gebrochenen vorzeichenbehafteten Wörter zu erzeugen; und ein Zielregister, um die mehreren gebrochenen vorzeichenbehafteten Wörter als gepackte vorzeichenbehaftete gebrochene Wortdatenelemente an spezifizierten Datenelementpositionen innerhalb des Zielregisters zu speichern.

    Einrichtung und Verfahren zum Verschieben und Extrahieren von gepackten Datenelementen

    公开(公告)号:DE102018006801A1

    公开(公告)日:2019-04-04

    申请号:DE102018006801

    申请日:2018-08-28

    Applicant: INTEL CORP

    Abstract: Eine Einrichtung und ein Verfahren zum Durchführen von Linksverschiebungsoperationen bei gepackten Quadword-Daten. Zum Beispiel umfasst eine Ausführungsform eines Prozessors: einen Decodierer zum Decodieren eines Linksverschiebungsbefehls zum Erzeugen eines decodierten Linksverschiebungsbefehls; ein erstes Quellregister zum Speichern von mehreren gepackten Quadword-Datenelementen; eine Ausführungsschaltung zum Ausführen des decodierten Linksverschiebungsbefehls, wobei die Ausführungsschaltung eine Verschiebungsschaltung zum Linksverschieben mindestens von ersten und zweiten gepackten Quadword-Datenelementen jeweils von ersten und zweiten gepackten Quadword-Datenelementorten in dem ersten Quellregister um einen Betrag, der in einem unmittelbaren Wert oder in einem Steuerwert in einem zweiten Quellregister spezifiziert ist, zum Erzeugen von ersten und zweiten nach links verschobenen Quadwords umfasst; wobei die Ausführungsschaltung die Auswahl einer spezifizierten Gruppe von höchstwertigen Bits der ersten und zweiten nach links verschobenen Quadwords veranlasst, die in die niederwertigsten Bit-Regionen von jeweils ersten und zweiten Quadword-Datenelementorten eines Zielregisters zu schreiben sind; und das Zielregister die spezifizierte Gruppe der höchstwertigen Bits der ersten und zweiten nach links verschobenen Quadwords speichert.

    FESTKOMMA-ZU-GLEITKOMMA-UMWANDLUNG
    24.
    发明专利

    公开(公告)号:DE102018006757A1

    公开(公告)日:2019-04-04

    申请号:DE102018006757

    申请日:2018-08-27

    Applicant: INTEL CORP

    Abstract: Es werden Ausführungsformen von Befehlen und Verfahren zur Ausführung der Befehle und Ressourcen zum Ausführen der Befehle ausführlich beschrieben. Zum Beispiel ist in einer Ausführungsform ein Prozessor beschrieben, der Folgendes aufweist: eine Decodierschaltung zum Decodieren eines Befehls, der Bereiche für einen Opcode, eine gepackte Datenquelloperandkennung und eine gepackte Datenzieloperandkennung aufweist; und eine Ausführungsschaltung zum Ausführen des decodierten Befehls zum Umwandeln eines Datenelements von einer niederwertigsten gepackten Datenelementposition des gekennzeichneten gepackten Datenquelloperanden von einer Festkommadarstellung zu einer Gleitkommadarstellung, Speichern der Gleitkommadarstellung in einer niederwertigsten gepackten 32-Bit-Datenelementposition des gekennzeichneten gepackten Datenzieloperanden und Nullstellen aller verbleibenden gepackten Datenelemente des gekennzeichneten gepackten Datenzieloperanden.

    Vorrichtung und Verfahren zur Multiplikation einer komplexen Zahl mit der konjugierten

    公开(公告)号:DE102018006008A1

    公开(公告)日:2019-04-04

    申请号:DE102018006008

    申请日:2018-07-30

    Applicant: INTEL CORP

    Abstract: Eine Ausführungsform eines Prozessors umfasst beispielsweise: einen Decoder zum Decodieren eines ersten Befehls, um einen decodierten Befehl zu erzeugen; ein erstes Quellenregister zum Speichern einer ersten Vielzahl von gepackten reellen und imaginären Datenelementen; ein zweites Quellenregister zum Speichern einer zweiten Vielzahl von gepackten reellen und imaginären Datenelementen; und einen Ausführungsschaltkreis zum Ausführen des decodierten Befehls, wobei der Ausführungsschaltkreis umfasst: einen Multiplikationsschaltkreis zum Auswählen reeller und imaginärer Datenelemente im ersten Quellenregister und im zweiten Quellenregister für die Multiplikation, einen Additionsschaltkreis zum Addieren eines ersten Teilsatzes der Vielzahl von imaginären Produkten und zum Subtrahieren eines zweiten Teilsatzes der Vielzahl von imaginären Produkten, um ein erstes temporäres Ergebnis zu erzeugen, und zum Addieren eines dritten Teilsatzes der Vielzahl von imaginären Produkten und zum Subtrahieren eines vierten Teilsatzes der Vielzahl von imaginären Produkten, um ein zweites temporäres Ergebnis zu erzeugen, einen Akkumulationsschaltkreis zum Kombinieren des ersten temporären Ergebnisses mit ersten Daten eines Zielregisters, und zum Kombinieren des zweiten temporären Ergebnisses mit zweiten Daten des Zielregisters, und zum Speichern des ersten endgültigen Ergebnisses und des zweiten endgültigen Ergebnisses im Zielregister.

    GLEITKOMMA- ZU FESTKOMMA-UMWANDLUNG

    公开(公告)号:DE102018005977A1

    公开(公告)日:2019-04-04

    申请号:DE102018005977

    申请日:2018-07-27

    Applicant: INTEL CORP

    Abstract: Ausführungsformen einer Anweisung, ihr Betrieb und Ausführungsunterstützung für die Anweisung werden beschrieben. Bei einigen Ausführungsformen umfasst ein Prozessor Decodierschaltung zum Decodieren einer Anweisung, aufweisend Felder für einen Opcode, eine Kennung eines gepackte Datenquellenoperanden und eine Kennung eines gepackte Datenzieloperanden; und Ausführungsschaltung zum Ausführen der decodierten Anweisung zum Umwandeln eines Gleitkomma-Datenelements einfacher Genauigkeit von einer niedrigstwertigen Position des gepackten Datenelements des identifizierten Quellenoperanden zu einer Festkommawiedergabe, Speichern der Festkommawiedergabe als 32-Bit-Ganzzahl und ein 32-Bit-Ganzzahlexponent an den zwei niedrigstwertigen Positionen für gepackte Datenelemente des identifizierten Zieloperanden gepackter Daten, und Nullsetzen aller verbleibenden gepackten Datenelemente des identifizierten Zieloperanden gepackter Daten.

    Einrichtung und Verfahren zur Multiplikation und Akkumulation von komplexen und echten gepackten Datenelementen

    公开(公告)号:DE102018005859A1

    公开(公告)日:2019-04-04

    申请号:DE102018005859

    申请日:2018-07-25

    Applicant: INTEL CORP

    Abstract: Eine Einrichtung und ein Verfahren zum Multiplizieren von gepackten echten und imaginären Komponenten von komplexen Zahlen. Zum Beispiel umfasst eine Ausführungsform eines Prozessors Folgendes: einen Decoder zum Decodieren eines ersten Befehls zum Erzeugen eines decodierten Befehls; ein erstes Quellregister zum Speichern einer ersten Vielzahl von gepackten echten und imaginären Datenelementen; ein zweites Quellregister zum Speichern einer zweiten Vielzahl von gepackten echten und imaginären Datenelementen; eine Ausführungsschaltung zum Ausführen des decodierten Befehls, die Ausführungsschaltung umfassend: eine Multipliziererschaltung zum Auswählen von echten und imaginären Datenelementen im ersten Quellregister und zweiten Quellregister zum Multiplizieren, wobei die Multipliziererschaltung jedes ausgewählte imaginäre Datenelement im ersten Quellregister mit einem ausgewählten echten Datenelement im zweiten Quellregister multipliziert, und zum Multiplizieren jedes ausgewählten echten Datenelements im ersten Quellregister mit einem ausgewählten imaginären Datenelement im zweiten Quellregister zum Erzeugen einer Vielzahl von imaginären Produkten, eine Addiererschaltung zum Addieren eines ersten Teilsatzes der Vielzahl von imaginären Produkten zum Erzeugen eines ersten temporären Ergebnisses und zum Addieren eines zweiten Teilsatzes der Vielzahl von imaginären Produkten zum Erzeugen eines zweiten temporären Ergebnisses; eine Negationsschaltung zum Negieren des ersten temporären Ergebnisses zum Erzeugen eines dritten temporären Ergebnisses und zum Negieren des zweiten temporären Ergebnisses zum Erzeugen eines vierten temporären Ergebnisses; eine Akkumulationsschaltung zum Kombinieren des dritten temporären Ergebnisses mit ersten Daten aus einem Zielregister zum Erzeugen eines ersten Endergebnisses und zum Kombinieren des vierten temporären Ergebnisses mit zweiten Daten aus dem Zielregister zum Erzeugen eines zweiten Endergebnisses und zum Speichern des ersten Endergebnisses und des zweiten Endergebnisses zurück in das Zielregister.

    Matériel et prise en charge de configuration pour l'allocation de ressources partagées

    公开(公告)号:FR3115616A1

    公开(公告)日:2022-04-29

    申请号:FR2109864

    申请日:2021-09-20

    Applicant: INTEL CORP

    Abstract: Titre de l'invention : Matériel et prise en charge de configuration pour l'allocation de ressources partagées Des modes de réalisation destinés à allouer des ressources partagées sont divulgués. Dans un mode de réalisation, un appareil comprend un cœur et un sélecteur de débit matériel. Le sélecteur de débit matériel est destiné, en réponse à une première indication selon laquelle la demande de largeur de bande de mémoire provenant du cœur a atteint une valeur de seuil, à déterminer une valeur de retard devant être utilisée pour limiter l'allocation de largeur de bande de mémoire au cœur. Le sélecteur de débit matériel comprend un contrôleur ayant un premier compteur destiné à compter une deuxième indication de demande de largeur de bande de mémoire provenant du premier cœur et un deuxième compteur destiné à compter des expirations de fenêtres temporelles. La première indication est basée sur une différence entre la valeur du premier compteur et la valeur du deuxième compteur. Figure: Figure 1

    VORRICHTUNG UND VERFAHREN ZUM VERARBEITEN VON FRAKTIONALEN UMKEHROPERATIONEN

    公开(公告)号:DE102018132200A1

    公开(公告)日:2019-06-27

    申请号:DE102018132200

    申请日:2018-12-14

    Applicant: INTEL CORP

    Abstract: Eine Vorrichtung und ein Verfahren zum Durchführen einer Umkehrung. Zum Beispiel umfasst eine Ausführungsform eines Prozessors: einen Decodierer, um einen Umkehrbefehl zu decodieren, um einen decodierten Umkehrbefehl zu generieren; ein Quellenregister, um mindestens ein gepacktes Eingabedatenelement zu speichern; ein Zielregister, um ein Ergebnisdatenelement zu speichern; und eine reziproke Ausführungsverschaltung, um den decodierten Umkehrbefehl auszuführen, wobei die reziproke Ausführungsverschaltung einen ersten Abschnitt des gepackten Eingabedatenelements als einen Index für eine Datenstruktur zu verwenden hat, die eine Vielzahl von Sätzen von Koeffizienten enthält, um einen ersten Satz von Koeffizienten aus der Vielzahl der Sätze zu identifizieren, wobei die reziproke Ausführungsverschaltung unter Verwendung einer Kombination der Koeffizienten und eines zweiten Abschnitts des gepackten Eingabedatenelements eine Umkehrung des gepackten Eingabedatenelements zu erzeugen hat.

Patent Agency Ranking