-
公开(公告)号:CN115130674B
公开(公告)日:2025-04-18
申请号:CN202210741859.2
申请日:2022-06-27
Applicant: 京东科技控股股份有限公司
Abstract: 本公开提供一种模型推理加速的方法和装置,该方法包括:获取请求信息并对所述请求信息进行分析,确定所述请求信息对应的具有依赖关系的目标模型服务,其中,所述集成模型服务系统包括至少一个模型服务;确定模型参数值,将所述模型参数值依次经由至少一个具有依赖关系的目标模型服务及其之间设置的消息队列进行处理,得到最终输出的模型计算结果;其中,每两个具有依赖关系的目标模型服务之间的消息队列用于接收前一个目标模型服务根据自身的处理能力值生成的任务数据,并根据后一个目标模型服务的处理能力值将所述任务数据发送至所述后一个目标模型服务。本公开解决了目标模型服务的延迟性高的问题,提高了整个集成模型服务系统的性能。
-
公开(公告)号:CN112905873B
公开(公告)日:2024-11-26
申请号:CN201911220013.9
申请日:2019-12-03
Applicant: 京东科技控股股份有限公司
IPC: G06F16/9535 , G06F17/16 , G06Q30/0601
Abstract: 本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:将评分矩阵中的数据分配至各个节点;其中,评分矩阵的稠密度不为1,评分矩阵中的各个元素分别表示不同用户对不同对象的评分;0元素表示对应的用户和对象之间无评分;根据分配的评分矩阵的数据,在各个节点并行地确定对应的分解数据;根据各个节点对应的分解数据,确定评分矩阵分解成的两个分解矩阵;根据两个分解矩阵,确定评分预测矩阵;其中,评分预测矩阵包括:预测的各个用户对各个对象的评分;根据评分预测矩阵,确定向用户推荐的对象。
-
公开(公告)号:CN115130674A
公开(公告)日:2022-09-30
申请号:CN202210741859.2
申请日:2022-06-27
Applicant: 京东科技控股股份有限公司
Abstract: 本公开提供一种模型推理加速的方法和装置,该方法包括:获取请求信息并对所述请求信息进行分析,确定所述请求信息对应的具有依赖关系的目标模型服务,其中,所述集成模型服务系统包括至少一个模型服务;确定模型参数值,将所述模型参数值依次经由至少一个具有依赖关系的目标模型服务及其之间设置的消息队列进行处理,得到最终输出的模型计算结果;其中,每两个具有依赖关系的目标模型服务之间的消息队列用于接收前一个目标模型服务根据自身的处理能力值生成的任务数据,并根据后一个目标模型服务的处理能力值将所述任务数据发送至所述后一个目标模型服务。本公开解决了目标模型服务的延迟性高的问题,提高了整个集成模型服务系统的性能。
-
公开(公告)号:CN114138772A
公开(公告)日:2022-03-04
申请号:CN202010925755.8
申请日:2020-09-04
Applicant: 京东科技控股股份有限公司
Abstract: 本发明实施例涉及一种衍生变量生成方法、装置、终端设备及存储介质,该方法包括:获取待生成的目标衍生变量信息;根据目标衍生变量信息,从预构建的逻辑池中匹配生成目标衍生变量所需的至少一个预设数据字段信息,以及预配置的加工规则;根据每一个预设数据字段信息,从预设存储路径中调取与预设数据字段信息对应的预设数据字段;按照预配置的加工规则,对所述预设数据字段进行加工,生成目标衍生变量。通过该种方式,防止原始报文格式改变或者数据结构变动都会导致该解析模块无法正常工作的情况发生,或者是导致加工模块不能执行工作的情况发生。大大加快了衍生变量的生成过程,提高了工作效率。
-
公开(公告)号:CN115599847A
公开(公告)日:2023-01-13
申请号:CN202211134994.7
申请日:2022-09-19
Applicant: 京东科技控股股份有限公司(CN)
IPC: G06F16/25 , G06F16/2457
Abstract: 本申请提出一种衍生变量的生成方法、装置、电子设备和存储介质,涉及数据处理技术领域。其中,衍生变量的生成方法包括:获取业务数据,对业务数据进行变量衍生处理,以生成候选衍生变量,对候选衍生变量进行筛选,并将筛选出的候选衍生变量确定为目标衍生变量。本申请通过对整个生命周期的衍生变量进行智能化管理,降低了耗时,减少了人工投入,提高了智能化程度。
-
公开(公告)号:CN114912632A
公开(公告)日:2022-08-16
申请号:CN202210567889.6
申请日:2022-05-24
Applicant: 京东科技控股股份有限公司
Abstract: 本发明公开了一种机器学习模型推理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将客户端发送的模型推理请求加入请求任务队列,由前端服务根据请求任务队列中的模型推理请求,与后端服务建立进程间通信,以将模型入参数据发送至后端服务;由后端服务启动待推理模型并通过待推理模型根据入参数据计算模型分,即推理结果,通过前端服务向客户端返回推理结果,不同的待推理模型部署在容器层的单节点中。该实施方式能够在联合建模的合作方式下,以方便、快速部署和降低运维成本为目标,实现单节点或实例下不同模型线上快速推理,实现针对不同类型的模型可以快速上线和更新、迭代,整体服务相对较为轻量级,后期的运维成本较低。
-
-
-
-
-