-
公开(公告)号:EP3129903A4
公开(公告)日:2017-12-20
申请号:EP15814364
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
IPC: G06F11/20
CPC classification number: G06F11/203 , G06F11/2023 , G06F11/2025 , G06F11/2028 , G06F11/2033 , G06F11/2035 , G06F11/2038 , G06F11/2041 , G06F11/2097 , G06F2201/84 , G06F2201/85
Abstract: Apparatuses, systems and methods are disclosed for tolerating fault in a communications grid. Specifically, various techniques and systems are provided for detecting a fault or failure by a node in a network of computer nodes in a communications grid, adjusting the grid to avoid grid failure, and taking action based on the failure. In an example, a system may include receiving grid status information at a backup control node, the grid status information including a project status, storing the grid status information within the backup control node, receiving a failure communication including an indication that a primary control node has failed, designating the backup control node as a new primary control node, receiving updated grid status information based on the indication that the primary control node has failed, and transmitting a set of instructions based on the updated grid status information.
-
公开(公告)号:ES2714218T3
公开(公告)日:2019-05-27
申请号:ES16205816
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Un método implementado por ordenador, que comprende: transmitir, de un nodo de control primario (902, 1002) conectado a uno o más nodos trabajadores (910, 912, 914, 916, 1010, 1012, 1014, 1016) en una rejilla de comunicaciones (900, 1000), instrucciones de trabajador relacionadas con un proyecto que se está ejecutando por el único o más nodos trabajadores; generar, por el nodo de control primario, una instantánea de la rejilla de comunicaciones, en donde la instantánea de la rejilla de comunicaciones incluye un estado de proyecto de cada uno del único o más nodos trabajadores, en donde un estado de proyecto de un nodo trabajador incluye un estado de una porción del proyecto que se está ejecutando por el nodo trabajador en la rejilla de comunicaciones, y en donde la instantánea incluye un punto de comprobación de proyecto que indica un punto durante la ejecución de una porción del proyecto; determinar, por el nodo de control primario, que un nodo trabajador fallido del único o más nodos trabajadores ha fallado, en donde el nodo trabajador fallido ha fallado en un tiempo de fallo; determinar que el nodo trabajador fallido ha fallado mientras el proyecto estaba pendiente; identificar un estado de proyecto del nodo trabajador fallido mediante el uso de la instantánea de la rejilla de comunicaciones, en donde el estado de proyecto del nodo trabajador fallido incluye un estado de una porción del proyecto que se está ejecutando por el nodo trabajador fallido en el tiempo de fallo, e identificar un punto de comprobación de proyecto del nodo trabajador fallido a partir de la instantánea que indica un punto durante la ejecución de una porción del proyecto con anterioridad al fallo del nodo trabajador fallido; y transmitir instrucciones de trabajador actualizadas, en donde el conjunto de instrucciones incluye el punto de comprobación de proyecto que indica el punto durante la ejecución de una porción del proyecto con anterioridad al fallo del nodo trabajador fallido, y en donde las instrucciones de trabajador actualizadas incluyen el estado de proyecto del nodo trabajador fallido e instrucciones actualizadas relacionadas con el proyecto que se está ejecutando por el único o más nodos trabajadores, en donde un nodo trabajador en funcionamiento completa, mediante el uso de las instrucciones de trabajador actualizadas, la ejecución de la porción del proyecto que se está ejecutando por el nodo trabajador fallido desde el punto de comprobación del proyecto.
-
公开(公告)号:CA2957749A1
公开(公告)日:2016-01-07
申请号:CA2957749
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Apparatuses, systems and methods are disclosed for tolerating fault in a communications grid. Specifically, various techniques and systems are provided for detecting a fault or failure by a node in a network of computer nodes in a communications grid, adjusting the grid to avoid grid failure, and taking action based on the failure. In an example, a system may include receiving grid status information at a backup control node, the grid status information including a project status, storing the grid status information within the backup control node, receiving a failure communication including an indication that a primary control node has failed, designating the backup control node as a new primary control node, receiving updated grid status information based on the indication that the primary control node has failed, and transmitting a set of instructions based on the updated grid status information.
-
公开(公告)号:CA2957749C
公开(公告)日:2017-08-15
申请号:CA2957749
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Apparatuses, systems and methods are disclosed for tolerating fault in a communications grid. Specifically, various techniques and systems are provided for detecting a fault or failure by a node in a network of computer nodes in a communications grid, adjusting the grid to avoid grid failure, and taking action based on the failure. In an example, a system may include receiving grid status information at a backup control node, the grid status information including a project status, storing the grid status information within the backup control node, receiving a failure communication including an indication that a primary control node has failed, designating the backup control node as a new primary control node, receiving updated grid status information based on the indication that the primary control node has failed, and transmitting a set of instructions based on the updated grid status information.
-
公开(公告)号:CA2948914C
公开(公告)日:2017-09-05
申请号:CA2948914
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Apparatuses, systems and methods are disclosed for tolerating fault in a communications grid. Specifically, various techniques and systems are provided for detecting a fault or failure by a node in a network of computer nodes in a communications grid, adjusting the grid to avoid grid failure, and taking action based on the failure. In an example, a system may include receiving grid status information at a backup control node, the grid status information including a project status, storing the grid status information within the backup control node, receiving a failure communication including an indication that a primary control node has failed, designating the backup control node as a new primary control node, receiving updated grid status information based on the indication that the primary control node has failed, and transmitting a set of instructions based on the updated grid status information.
-
公开(公告)号:CA2948914A1
公开(公告)日:2016-01-07
申请号:CA2948914
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Apparatuses, systems and methods are disclosed for tolerating fault in a communications grid. Specifically, various techniques and systems are provided for detecting a fault or failure by a node in a network of computer nodes in a communications grid, adjusting the grid to avoid grid failure, and taking action based on the failure. In an example, a system may include receiving grid status information at a backup control node, the grid status information including a project status, storing the grid status information within the backup control node, receiving a failure communication including an indication that a primary control node has failed, designating the backup control node as a new primary control node, receiving updated grid status information based on the indication that the primary control node has failed, and transmitting a set of instructions based on the updated grid status information.
-
公开(公告)号:ES2705708T3
公开(公告)日:2019-03-26
申请号:ES15814364
申请日:2015-06-23
Applicant: SAS INST INC
Inventor: KNIGHT RICHARD
Abstract: Un procedimiento implementado por ordenador, que comprende: recibir, en un nodo de control de respaldo conectado a un nodo de control principal y a un nodo de trabajo en una red de comunicaciones, información del estado de la red, incluyendo la información del estado de la red un estado del proyecto del nodo de control principal o un estado del proyecto del nodo de trabajo, en el que el estado del proyecto del nodo de control principal y el estado del proyecto del nodo de trabajo incluyen un estado de una o varias partes de un proyecto que está siendo ejecutado por los nodos principal y de trabajo en la red de comunicaciones, y en el que la información del estado de la red incluye un punto de control del proyecto que indica un punto durante la ejecución de una parte del proyecto antes de un fallo del nodo de control principal; almacenar la información del estado de la red en el nodo de control de respaldo; recibir una comunicación de fallo que incluye una indicación de que el nodo de control principal ha fallado; designar un nodo de control de respaldo como un nuevo nodo de control principal en base a la comunicación de fallo tras recibir la comunicación de fallo; recibir información actualizada del estado de la red en base a la indicación de que el nodo de control principal ha fallado, en el que la información actualizada del estado de la red incluye un estado del proyecto actualizado del nodo de control principal o un estado del proyecto actualizado del nodo de trabajo; determinar que el nodo de control principal ha fallado mientras el proyecto estaba pendiente; y transmitir un conjunto de instrucciones en base a la información actualizada del estado de la red, en el que el conjunto de instrucciones incluye el punto de control del proyecto que indica el punto durante la ejecución de una parte del proyecto anterior al fallo del nodo de control principal, y en el que el conjunto de instrucciones incluye instrucciones para que los nodos de trabajo continúen el trabajo sobre el proyecto pendiente a partir del punto de control del proyecto después del fallo del nodo de control principal.
-
-
-
-
-
-