云平台故障修复方法、装置、主机设备、程序产品及系统

    公开(公告)号:CN118550753B

    公开(公告)日:2024-11-05

    申请号:CN202411017309.1

    申请日:2024-07-29

    Abstract: 本发明提供一种云平台故障修复方法、装置、主机设备、程序产品及系统,涉及云平台运维领域,方法包括:获取云平台的日志告警信息和运维工具的运维工具信息,并在预设知识库中获取日志告警信息对应的运维知识信息;利用运维知识信息、运维工具信息、日志告警信息和预设约束信息生成故障检测文本,并向预训练语言模型输入故障检测文本,以使预训练语言模型在预设约束信息的限制下根据运维知识信息和运维工具信息对日志告警信息进行分析、输出云平台的故障类型、修复故障所使用的选定运维工具信息和修复任务信息;调用选定运维工具信息对应的运维工具根据修复任务信息对云平台进行故障修复;可提升云平台故障检测及修复的可靠度。

    一种微服务调用架构监控方法、系统、设备及介质

    公开(公告)号:CN117909177A

    公开(公告)日:2024-04-19

    申请号:CN202410081696.9

    申请日:2024-01-19

    Abstract: 本申请公开了一种微服务调用架构监控方法、系统、设备及介质,涉及计算机技术领域,包括:应用于微服务调用架构监控系统,其部署于云主机,并包括内核埋点装置、数据处理装置、数据存储装置和架构展示装置;包括:通过内核埋点装置向内核中注入目标字节码,以获取目标数据包的参数信息;目标数据包为当微服务被远程调用时流经内核的数据包;通过数据处理装置确定参数信息的标签,并根据参数信息和标签构建满足预设格式的目标数据;通过数据存储装置从数据处理装置拉取目标数据,并进行持久化存储;通过架构展示装置读取目标数据,以生成用于表明各个微服务之间的调用关系的目标网络拓扑图。可见,本申请对应用程序无侵入性,大大简化了开发难度。

    云平台故障诊断方法、装置、计算机设备及存储介质

    公开(公告)号:CN119322695A

    公开(公告)日:2025-01-17

    申请号:CN202411336666.4

    申请日:2024-09-24

    Abstract: 本发明涉及人工智能技术领域,公开了云平台故障诊断方法、装置、计算机设备及存储介质,方法包括:实时获取云平台的错误日志数据;将错误日志数据划分为多个待诊断日志数据;将待诊断日志数据输入多个错误日志诊断模型,获得错误日志诊断结果;将待诊断日志数据和错误日志诊断结果输入多个错误日志诊断模型中,获得每个错误日志诊断模型输出的多个错误日志诊断结果的投票结果;基于多个错误日志诊断结果的投票结果,对多个错误日志诊断模型输出的错误日志诊断结果进行汇总处理,获得每个错误日志诊断结果的准确率;基于每个错误日志诊断结果的准确率,确定云平台的故障诊断结果。本发明提高了云平台故障诊断结果的准确性。

    集群应用服务的扩缩容方法、系统、产品、装置及介质

    公开(公告)号:CN118394534A

    公开(公告)日:2024-07-26

    申请号:CN202410853492.2

    申请日:2024-06-28

    Inventor: 苏海明 逄立业

    Abstract: 本发明公开了一种集群应用服务的扩缩容方法、系统、产品、装置及介质,涉及计算机技术领域。通过云计算平台中应用服务的历史数据,并根据预测峰值策略对业务指标数据预测得到峰值指标数据,基于历史数据预测得到峰值指标数据,使之数据实现前置性的预测。均是在扩缩容信号发生之前提前预先确定对应的扩缩容处理操作,提高响应业务变化的速度和扩缩容的操作效率。通过业务承载策略对资源负载、芯片架构对应的实例数和性能指标数据进行处理得到应用服务对应的单位资源承载量后,基于峰值指标数据和单位资源承载量之间的关系确定应用服务的扩缩容处理策略,结合业务指标数据和性能指标数据的历史数据精准确定扩缩容条件,提升扩缩容策略的主动性。

    一种云平台错误日志分类的方法、装置、设备及可读介质

    公开(公告)号:CN113986863A

    公开(公告)日:2022-01-28

    申请号:CN202111255548.7

    申请日:2021-10-27

    Inventor: 逄立业

    Abstract: 本发明提供了一种云平台错误日志分类的方法、装置、设备及可读介质,该方法包括:收集云平台中的错误日志,并对每个错误日志进行预处理;计算预处理后的每个错误日志中的每个词的词频统计值;基于计算得到的词频统计值训练聚类模型;将待分类的错误日志进行预处理后计算预处理后的每个错误日志中的词频统计值;将计算得到的词频统计值输入到训练后的聚类模型中以得到错误日志分类结果。通过使用本发明的方案,能够实时对错误日志进行分类,能够向运维人员提供更明确的故障特征。

    推理服务的确定方法、装置存储介质及电子设备

    公开(公告)号:CN119358674A

    公开(公告)日:2025-01-24

    申请号:CN202411396571.1

    申请日:2024-10-08

    Abstract: 本申请实施例提供了一种推理服务的确定方法、系统、存储介质及电子设备,包括:接收请求发送方发送的推理请求,其中,所述推理请求用于请求所述推理服务执行所述推理请求的请求内容;响应于所述推理请求,获取多个所述推理服务中每个推理服务的推理速度;根据多个所述推理速度确定用于响应所述推理请求的目标推理服务。解决了相关技术中,在接收到推理请求时无法确定合适的推理服务的问题。

    集群扩缩方法、装置、电子设备及计算机可读介质

    公开(公告)号:CN118714012A

    公开(公告)日:2024-09-27

    申请号:CN202410735162.3

    申请日:2024-06-06

    Abstract: 本申请提供了一种集群扩缩方法、装置、电子设备及计算机可读介质,涉及计算机技术领域,应用于云平台,云平台上部署有集群的多个节点,能够将包含多个节点的集群部署在云平台上,并对集群中各个节点的使用情况进行监控和数据采集,对集群的使用数据的分析来确定整个集群的使用情况,并确定集群的扩缩策略,自动进行节点数量的扩容或缩容操作。从而能够根据集群节点的使用情况动态调整集群的规模,实现集群的自动化扩缩容。提高集群的运行效率和资源利用率,同时降低运维成本和人工干预的需求。

    一种获取云平台CPU使用率的方法、装置及介质

    公开(公告)号:CN115309609A

    公开(公告)日:2022-11-08

    申请号:CN202211046687.3

    申请日:2022-08-30

    Inventor: 逄立业

    Abstract: 本申请公开了一种获取云平台CPU使用率的方法、装置及介质,涉及云平台技术领域。该方法包括获取云平台的节点列表以及各节点的内核;获取各节点的内核在预设时长内的使用时长;根据使用时长、预设时长确定云平台CPU使用率。相比于将所有节点的CPU使用率的平均值作为云平台CPU使用率的方法,本申请提供的方法中,对节点的CPU的使用细化到节点的CPU内核的使用,根据节点的CPU内核的使用情况确定云平台CPU使用率,使获得的云平台CPU使用率更加准确。此外,本申请还提供一种获取云平台CPU使用率的装置以及计算机可读存储介质,与上述提到的获取云平台CPU使用率的方法具有相同或相对应的技术特征,效果同上。

    边缘集群监控方法和系统
    9.
    发明公开

    公开(公告)号:CN113986662A

    公开(公告)日:2022-01-28

    申请号:CN202111231265.9

    申请日:2021-10-22

    Inventor: 逄立业

    Abstract: 本申请涉及一种边缘集群监控方法和系统;所述方法包括:中心集群动态获取所有边缘集群的状态信息;当发现负载或设备发生变化时,获取目标边缘集群的特征信息;所述目标边缘集群为发生变化的负载或设备所在的边缘集群;根据特征信息为目标边缘集群创建监控组件的配置信息;将配置信息下发到目标边缘集群;目标边缘集群接收到配置信息后,根据配置信息部署相应的监控组件,进行数据采集和监控。本申请的方案实现了对不同的边缘集群进行针对性监控组件部署,减少了网络传输,防止无用监控组件的部署,并且实现了策略制定和策略执行的分离,不仅解决了负载和设备种类繁多的边缘集群监控,而且保证了中心集群的安全性。

    云平台中的GPU接入方法、装置、电子设备及存储介质

    公开(公告)号:CN119065855A

    公开(公告)日:2024-12-03

    申请号:CN202411364824.7

    申请日:2024-09-27

    Abstract: 本申请公开了一种云平台中的GPU接入方法、装置、电子设备及存储介质,包括:根据检测指令确定目标GPU,并通过命令行接口获取所述目标GPU的基本信息和性能信息;将各所述性能信息转换为算力评估指标数据,并利用预设算力评估模型对各所述算力评估指标数据进行处理,获得所述目标GPU的算力评估结果;对所述目标GPU的基本信息和算力评估结果进行标准性校验,以确定所述目标GPU是否满足所述云平台的GPU接入标准;当所述目标GPU满足所述云平台的GPU接入标准时,将所述目标GPU注册至所述云平台。应用本申请所提供的技术方案,可以实现云平台对于GPU设备的自动化识别与自动化接入,进一步保证了GPU的应用效率。

Patent Agency Ranking