基于Pipeline的图片推理方法、系统、设备及介质

    公开(公告)号:CN120014415A

    公开(公告)日:2025-05-16

    申请号:CN202510157905.8

    申请日:2025-02-13

    Abstract: 本发明公开了基于Pipeline的图片推理方法、系统、设备及介质,属于人工智能的智能视觉分析领域,本发明要解决的技术问题为如何实现不同图片格式的快速动态解析,提高单张图片解析推理效率,采用的技术方案为:获取图片源并转成原始的图片二进制格式;根据获取到的原始数据源格式采用decodebin插件动态加载可用的解码器和解复用器,并优先选择硬件加速解码插件,完成待处理图像的解码;对解码后的图片进行归一化处理;根据加载到的推理模型使用对应的推理方法获取推理结果;将推理结果整合成自定义协议格式返回http服务端进行可视化展示。

    一种基于websocket-ts视频回放方法及系统

    公开(公告)号:CN119449781A

    公开(公告)日:2025-02-14

    申请号:CN202411406948.7

    申请日:2024-10-10

    Abstract: 本发明涉及流媒体视频回放技术领域,具体为一种基于websocket‑ts视频回放方法及系统,包括以下步骤:定义信令和视频数据的复用格式,设计帧头信息,实现帧封装机制,设定优先级控制机制,实施流量控制算法;有益效果为:本发明提出的基于websocket‑ts视频回放方法及系统,通过WebSocket协议传输视频数据,减少了HTTP协议中的请求/响应往返时间,从而提高了数据传输的效率;采用WebSocket支持全双工通信,允许服务器实时推送视频数据和响应用户信令,增强了视频播放的实时性。

    一种大模型与小模型结合的图像处理系统的设计方法

    公开(公告)号:CN119785187A

    公开(公告)日:2025-04-08

    申请号:CN202411722502.5

    申请日:2024-11-28

    Inventor: 苗亚囡 侯永东

    Abstract: 本发明公开一种大模型与小模型结合的图像处理系统的设计方法,涉及人工智能及大模型应用的图像处理技术领域;包括:建立基于大模型与小模型结合的图像处理系统,通过小模型处理模块将图像解码为像素矩阵,并将图像格式转换为适合模型输入的RGB格式,通过预处理模块将解码后的图像归一化和标准化,通过推理模块加载配置参数和小模型,将预处理后的图像输入小模型进行推理得到小模型的输出,通过后处理模块将小模型的输出进行相应的尺寸转化,使得检测目标坐标对应原始图片像素大小,通过输出协议模块将检测到的目标信息结果和检测置信度整合到统一的协议中提供给大模型预测模块,通过大模型预测模块根据上下文学习以及结合大模型处理能力,进行分析和解释,形成最终的解释和结果返回到http服务端进行可视化展示。

    一种知识库管理系统的文档智能解析方法

    公开(公告)号:CN119783787A

    公开(公告)日:2025-04-08

    申请号:CN202411722493.X

    申请日:2024-11-28

    Inventor: 苗亚囡 侯永东

    Abstract: 本发明公开一种知识库管理系统的文档智能解析方法,涉及人工智能大模型多模态分析领域;包括:步骤1:根据文档扩展名初步识别文档格式,根据文档格式的类型进行相应的解析:分别针对pdf、docx、doc以及txt文档格式进行文本解析,其中针对pdf文档格式,提取pdf文档格式中文本和图像;针对docx文档格式,根据docx文档格式的压缩包按照文档的自然顺序进行解析,提取文本和图片;针对doc文档格式,识别并提取doc文档格式中所有文本信息;针对txt文档格式,识别并处理字符编码,提取各种语言和符号;步骤2:利用大模型对解析完成的文本进行处理:将文本进行分割并进行向量化处理,将文本转换为大模型能够理解的数值形式,并将转换的文本存储于知识库,用于信息检索、数据分析和知识发掘,步骤3:同时对文本进行可视化输出。

    一种rtsp流在web浏览器端的播放方法及装置

    公开(公告)号:CN118250512A

    公开(公告)日:2024-06-25

    申请号:CN202410205360.9

    申请日:2024-02-26

    Abstract: 本发明涉及web浏览器领域,具体提供了一种rtsp流在web浏览器端的播放方法及装置,具有如下步骤:S1、浏览器端检测是否安装本地代理小程序;S2、启动本地代理小程序;S3、web浏览器和RtspProxy进行握手建立连接;S4、浏览器向代理小程序RtspProxy发起rtsp预览请求;S5、本地代理小程序拉取和封装rtsp视频流;S6、本地代理小程序将转封装之后的mp4文件推送给浏览器端,浏览器通过mse技术将mp4文件喂给video标签解码显示;S7、浏览器和RtspProxy的维持定时心跳;S8、播放结束。与现有技术相比,本发明能够使后端服务无需做任何修改,前端浏览器也无需安装插件,具备易用性和通用性。

    基于Pipeline的并行视频结构化推理方法及系统

    公开(公告)号:CN114494978A

    公开(公告)日:2022-05-13

    申请号:CN202210156883.X

    申请日:2022-02-21

    Abstract: 本发明公开了基于Pipeline的并行视频结构化推理方法及系统,属于人工智能视觉分析技术领域,要解决的技术问题为串行链式解析导致视频结构化推理解析效率低,无法满足pipeline解析的并行处理。包括如下步骤:将Pipeline拆分为主Pipeline和分支Pipeline;通过主Pipeline对获取的视频流进行行人和车辆的检测分析,得到行人图片和车辆图片;通过行人检测分支Pipeline对行人进行属性分析和特征提取,通过车辆检测分支Pipeline对车辆进行属性分析和特征提取;通过主Pipeline对行人分析结果和车辆分析结果进行汇总。

    一种智能视觉的算法敏捷集成框架方法及系统

    公开(公告)号:CN118172652A

    公开(公告)日:2024-06-11

    申请号:CN202410295407.5

    申请日:2024-03-15

    Abstract: 本发明提供一种智能视觉的算法敏捷集成框架方法及系统,属于智能视觉分析领域,本发明主要包含数据流接入模块、推理模块、结果输出模块,将每个模块拆分封装成库,对于不同模型的算法只需要修改对应的加载算法模型配置、对于推理过程或者跟踪逻辑有特殊要求的的可通过继承重写对应的接口完成个性化的定制。本发明能够更加高效快速的实现智能算法服务的孵化功能,且服务能够实现轻量化,具有很好的推广应用价值。

Patent Agency Ranking