Optimizing tail latency via workload and resource redundancy in cloud

Invention Grant

US11455197B2 Optimizing tail latency via workload and resource redundancy in cloud 有权

Please log in to see more content

Patent Title: Optimizing tail latency via workload and resource redundancy in cloud
Application No.: US16686453

Application Date: 2019-11-18
Publication No.: US11455197B2

Publication Date: 2022-09-27
Inventor: Robert Birke , Mathias Bjoerkqvist , Yiyu L. Chen , Martin L. Schmatz
Applicant: International Business Machines Corporation
Applicant Address: US NY Armonk
Assignee: International Business Machines Corporation
Current Assignee: International Business Machines Corporation
Current Assignee Address: US NY Armonk
Agency: Otterstedt & Kammer PLLC
Agent Daniel Morris
Main IPC: G06F9/50
IPC: G06F9/50

Optimizing tail latency via workload and resource redundancy in cloud

Abstract:

A plurality of requests are received for computing processing. At least some of the plurality of requests are replicated. The requests are replicated based on a fractional replication factor. Each received request and each replicated request are transmitted to a computer resource for processing. At least some embodiments provide the capability for meeting tail latency targets with improved performance and reduced cost.

Public/Granted literature

US20200081747A1 OPTIMIZING TAIL LATENCY VIA WORKLOAD AND RESOURCE REDUNDANCY IN CLOUD Public/Granted day:2020-03-12

Information query

Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F9/00	程序控制装置，例如，控制单元（用于外部设备的程序控制入G06F13/10）
G06F9/06	.应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9/46	..多道程序装置
G06F9/50	...资源分配，例如，中央处理单元[CPU]的