-
公开(公告)号:CN119850806A
公开(公告)日:2025-04-18
申请号:CN202411963371.X
申请日:2019-06-19
Applicant: 微软技术许可有限责任公司
Inventor: T·P·埃塞斯特罗姆 , C·R·梅特伦 , J·E·邱吉尔 , J·惠勒
Abstract: 公开了用于减少视觉噪声的深度射线层。所描述的技术包括深度射线着色器,该深度射线着色器被存储在存储器中,并且可执行以接收定义与三维场景中的每个像素相关联的深度的深度图,并定义在第一像素值与第二像素值之间的颜色梯度,其中该颜色梯度中的在第一像素值与第二像素之间的每个顺序步长被指派给相对于参考点量值增加的对应深度。该深度射线着色器进一步可执行以向图形引擎提供指令,以致使图形引擎将深度射线层施加到三维场景的所选部分,该深度射线层将该所选部分中的每个像素更改为采取颜色梯度内所定义的像素值以对应于通过深度图指定的该像素的深度。
-
公开(公告)号:CN119850765A
公开(公告)日:2025-04-18
申请号:CN202411901874.4
申请日:2024-12-23
Applicant: 科大讯飞(苏州)科技有限公司
IPC: G06T11/00 , G06F3/023 , G06N20/00 , G06T7/194 , G06F40/166
Abstract: 本发明提供一种输入法皮肤生成方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域。其中方法包括:获取输入文本;输入文本包括用户输入的图像描述性文本,图像描述性文本包括输入法背景图的图像内容信息;将输入文本输入至第一文生图模型,得到第一文生图模型输出的输入法背景图;输入法背景图用于生成输入法皮肤。本发明用户可以根据自身需求输入图像描述性文本,生成符合用户个性化需求的输入法皮肤,且可以满足所有用户的个性化需求,从而提升用户体验感;且第一文生图模型用于基于输入文本的内容信息生成对应的输入法背景图,从而无需人工提前设计多种输入法皮肤,降低输入法皮肤的设计成本,并提高输入法皮肤的生成效率。
-
公开(公告)号:CN119832019A
公开(公告)日:2025-04-15
申请号:CN202411881398.4
申请日:2024-12-19
Applicant: 上海上湖信息技术有限公司 , 海南上湖信息技术有限公司 , 上海耳序信息技术有限公司
IPC: G06T7/194 , G06T7/11 , G06T7/269 , G06T5/77 , G06T5/50 , G06N3/0464 , G06N3/0455 , G06N3/044 , G06V20/40 , G06V10/25 , G06V20/62 , G06V30/146 , G06V10/82
Abstract: 本申请实施例提供一种视频流中前景目标的移除方法及装置,应用在计算机技术领域,包括:从原始视频流中检测出具有前景目标的视频帧,并为具有前景目标的视频帧生成前景目标对应的掩码;针对任意具有前景目标的视频帧进行移除修复操作,得到修复视频帧;根据各修复视频帧得到修复视频流;移除修复操作包括:根据掩码对具有前景目标的视频帧进行前景目标移除,得到待修复视频帧;计算具有前景目标的视频帧的前向光流和后向光流,通过前向光流和后向光流对待修复视频帧进行像素填充;对像素填充后的待修复视频帧,通过前向光流和后向光流进行像素对齐,得到修复视频帧。本申请确保了在动态场景或多前景目标场景下视频的准确性和视觉一致性。
-
公开(公告)号:CN119107334B
公开(公告)日:2025-04-11
申请号:CN202411596141.4
申请日:2024-11-11
Applicant: 苏州大学
IPC: G06T7/194 , G06T7/136 , G06T7/155 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/082
Abstract: 本发明涉及图像处理技术领域,公开了一种湖泊图像分割方法及计算机可读存储介质,包括将待分割湖泊图像输入训练好的改进U‑Net网络中,获取待分割湖泊图像的预测图的灰度值,利用阈值‑形态学操作对待分割湖泊图像的预测图进行处理,计算出初始水平集函数,设置为初始轮廓线,不再需要人工设定矩形框来初始化待分割湖泊图像中的初始轮廓线,提高了图像分割效率;利用Scharr算子对待分割湖泊图像的预测图进行计算,进一步提取待分割湖泊图像的边缘特征,并获取数据驱动项,对初始水平集函数进行迭代更新,获取目标水平集函数,将其作为目标轮廓线,对待分割湖泊图像进行分割,进而提高了对含有复杂背景的湖泊图像的分类精确度。
-
公开(公告)号:CN114612507B
公开(公告)日:2025-04-11
申请号:CN202210185846.1
申请日:2022-02-28
Applicant: 天津大学
Abstract: 本发明涉及光学、图像传感器成像及图像处理领域,为提出用于脉冲图像传感器的高速目标追踪方法,该方法能有效提高脉冲图像传感器对场景中的高速目标追踪的精度和稳定性。为此,本发明采取的技术方案是,基于脉冲序列式图像传感器的高速目标追踪方法,步骤如下:(1)根据脉冲数据获取脉冲间隔及脉冲频率;(2)对运动目标进行运动检测,并去除运动检测过程中出现的鬼影和空洞;(3)对目标进行锁定与追踪;(4)在找到真实的目标区域之后,对场景及目标采用双边滤波进行图像重构。本发明主要应用于图像传感器设计制造场合。
-
公开(公告)号:CN119783609A
公开(公告)日:2025-04-08
申请号:CN202411839856.8
申请日:2024-12-13
Applicant: 岚图汽车科技有限公司
IPC: G06F30/34 , G06F30/27 , G06T5/50 , G06T7/194 , G06T17/00 , G06N3/044 , G06N3/0442 , G06N3/08 , G06F119/14
Abstract: 本申请公开了一种智能驾驶算法的法规仿真测试方法、装置、设备及存储介质,涉及智能驾驶技术领域,包括:根据采集数据进行法规测试场地的高精度三维重建,得到三维重建场景,所述采集数据包括激光雷达点云和多视角相机图像;基于所述三维重建场景,得到仿真工况测试数据;根据所述仿真工况测试数据和实车工况测试数据对网络模型进行训练,得到车辆动力学网络模型;基于自动化测试程序,根据所述三维重建场景和所述车辆动力学网络模型构建闭环仿真链路,对智能驾驶算法进行法规仿真测试。本申请能够实现提高智能驾驶法规测试的效率和准确性。
-
公开(公告)号:CN119478795B
公开(公告)日:2025-04-08
申请号:CN202510055107.4
申请日:2025-01-14
Applicant: 中科博特智能科技(安徽)有限公司
Abstract: 本发明公开了一种基于异常情景的云台识别抓捕方法及系统,涉及智能设备技术领域;对视频流以第一预设周期进行抽帧处理得到初始图像集;根据初始图像集确定目标背景和目标图像,若存在目标图像,则根据目标背景对目标图像进行背景分离得到前景图像;对前景图像进行初始关键点提取得到初始关键点集,根据初始关键点集进行对象识别,若识别出对象,则对对象进行目标关键点提取得到目标关键点集;根据目标关键点集对对象进行实时追踪,直到前景区域识别不出对象。根据抽帧得到的图像进行目标背景确定和目标图像确定,避免了直接使用固定背景,为后续对象识别提高了准确性,再通过对识别的对象进行关键点识别,提高了目标识别和抓捕的准确性和有效性。
-
公开(公告)号:CN119444791B
公开(公告)日:2025-04-08
申请号:CN202510044694.7
申请日:2025-01-13
Applicant: 纳博特控制技术(苏州)有限公司
Abstract: 本发明公开一种基于图像识别的机器人抓取对象选择方法,涉及机器人视觉识别与抓取技术领域。首先依工作场景和工件特性调控深度相机拍摄获取待处理图像,接着预处理图像并提取连通域,通过像素点计数与形状拟合计算面积,根据夹爪尺寸与预存表面积确定阈值筛选。随后确定连通域轮廓深度极值点,计算深度比值,根据工件特性确定最优夹持点,构建夹持平面,计算抓取距离。最终综合连通域面积、深度比值和抓取距离加权计算夹持优先度,确定最优抓取对象。此方法能有效处理工件堆积遮挡、光照不均及干涉难题,减少计算量,提升机器人抓取精准度与效率。
-
公开(公告)号:CN119273678B
公开(公告)日:2025-04-04
申请号:CN202411784804.5
申请日:2024-12-06
Applicant: 山东杨嘉汽车制造有限公司
IPC: G06T7/00 , G06T7/90 , G06T7/60 , G06T7/64 , G06T5/90 , G06T7/11 , G06T7/136 , G06T7/194 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/084 , G06T3/4038 , G06T5/70 , G06T5/20 , G06V10/80
Abstract: 本发明涉及图像增强技术领域,具体涉及一种运输半挂车车桥的视觉高精度检测方法及检测装置。本发明首先根据待分析区域中像素点的灰度级和预设车桥灰度级的差异情况,获取待分析区域的色彩偏离度;根据待分析区域中游程的分布情况,获取待分析区域的形变缺陷度量;根据待分析区域的色彩偏离度以及形变缺陷度量,获取待分析区域的形变误检概率;根据灰度级的增强系数,对半挂车车桥灰度图像进行增强处理,获取半挂车车桥增强图像;对半挂车车桥增强图像进行缺陷检测。本发明通过充分考虑灰度级对缺陷区域的表现能力,合理设置灰度级的增强系数,有效增强形面缺陷的表现效果,提高半挂车车桥缺陷检测准确性。
-
公开(公告)号:CN114998465B
公开(公告)日:2025-04-04
申请号:CN202210587553.6
申请日:2022-05-25
Applicant: 西安纽扣软件科技有限公司
Abstract: 本发明公开了一种人脸图像处理方法、装置及计算机存储介质,对媒体流进行预处理,得到闪星背景层的原始媒体流;对闪星背景层的原始媒体流,通过视觉图像处理,得到第一输入纹理;对闪星背景层的原始媒体流,进行角点信息处理,得到第二输入纹理;对第一输入纹理和第二输入纹理进行效果叠加处理,得到面部处理后的媒体流;根据图片/视频素材获得角点位置并进行人景分离操作,将结果进行归并与边缘处理操作,保证渲染出的效果稳定与准确;人脸识别技术保证了闪光点不出现在人物面部,并通过阈值粒度保证闪光点的个数的控制。
-
-
-
-
-
-
-
-
-