PARALLEL OPERATION ON B+ TREES
    3.
    发明公开
    PARALLEL OPERATION ON B+ TREES 审中-公开
    PARALLEBETRIEB B AUF +BÄUMEN

    公开(公告)号:EP2751667A4

    公开(公告)日:2015-07-15

    申请号:EP11871468

    申请日:2011-08-29

    Applicant: INTEL CORP

    CPC classification number: G06F17/30327 G06F9/5005 G06F2209/5018

    Abstract: Embodiments of techniques and systems for parallel processing of B+ trees are described. A parallel B+ tree processing module with partitioning and redistribution may include a set of threads executing a batch of B+ tree operations on a B+ tree in parallel. The batch of operations may be partitioned amongst the threads. Next, a search may be performed to determine which leaf nodes in the B+ tree are to be affected by which operations. Then, the threads may redistribute operations between each other such that multiple threads will not operate on the same leaf node. The threads may then perform B+ tree operations on the leaf nodes of the B+ tree in parallel. Subsequent modifications to nodes in the B+ may similarly be redistributed and performed in parallel as the threads work up the tree.

    Abstract translation: 描述了B +树的并行处理技术和系统的实施例。 具有分区和再分配的并行B +树处理模块可以包括一组在B +树上并行执行一批B +树操作的线程。 该批操作可以在线程之间进行分区。 接下来,可以执行搜索以确定B +树中的哪些叶节点将受哪个操作的影响。 然后,线程可以在彼此之间重新分配操作,使得多个线程将不在同一叶节点上操作。 然后,线程可以并行地在B +树的叶节点上执行B +树操作。 当线程处理树时,对B +中的节点的后续修改可以类似地重新分布并且并行执行。

    ACCELERATOR FOR SPARSE-DENSE MATRIX MULTIPLICATION

    公开(公告)号:FI3779681T3

    公开(公告)日:2024-06-28

    申请号:FI20199012

    申请日:2019-02-13

    Applicant: INTEL CORP

    Abstract: Disclosed embodiments relate to multiply-accumulate operations. In one example, a processor comprises: a cache to store data; at least one core coupled to the cache. The at least one core comprises: execution circuitry to perform multiply-accumulate operations with a first source matrix and a second source matrix to generate a result matrix responsive to an instruction, wherein the first source matrix is a sparse matrix having non-zero data elements located at certain positions, wherein the first source matrix is stored in a compressed format that identifies the positions of the non-zero data elements in the first source matrix. The execution circuitry further comprises: a plurality of multiply-accumulate circuits to perform a plurality of multiply-add operations to multiply the non-zero data elements of the first source matrix by corresponding data elements of the second source matrix identified based on the positions in the compressed format to generate a plurality of products, and to add the plurality of products to accumulated values to generate data elements of the result matrix.

    INHALTSASSOZIATIVE HARDWARE-DATENSTRUKTUR ZUR BESCHLEUNIGUNG VON MENGENOPERATIONEN

    公开(公告)号:DE112016006028T5

    公开(公告)日:2018-09-13

    申请号:DE112016006028

    申请日:2016-11-22

    Applicant: INTEL CORP

    Abstract: Ein Prozessor enthält ein Front-End, um einen Befehl zu empfangen, einen Decodierer, um den Befehl zu decodieren, eine Mengenoperations-Logikeinheit (SOLU), um den Befehl auszuführen, und eine Stilllegungseinheit. Die SOLU enthält eine Logik, um eine erste Menge von Schlüssel-Wert-Paaren in einer inhaltsassoziativen Datenstruktur zu speichern, um eine zweite Menge von Schlüssel-Wert-Paaren zu empfangen und um die Schlüssel-Wert-Paare in den beiden Mengen mit zusammenpassenden Schlüsseln zu identifizieren. Die SOLU enthält eine Logik, um die zweite Menge von Schlüssel-Wert-Paaren zu der ersten Menge hinzuzufügen, um eine Ausgangsmenge zu erzeugen, und um eine Operation auf die Werte der Schlüssel-Wert-Paare mit zusammenpassenden Schlüsseln anzuwenden, die einen einzigen Wert für den zusammenpassenden Schlüssel erzeugt. Die SOLU enthält eine Logik, um eine Ausgangsmenge zu erzeugen, die die Schlüssel-Wert-Paare von der ersten Menge mit zusammenpassenden Schlüsseln enthält, und um die Schlüssel-Wert-Paare von der ersten Menge mit eindeutigen Schlüsseln zu verwerfen.

Patent Agency Ranking