基于可变块的图像空洞区域修补方法

    公开(公告)号:CN103578085A

    公开(公告)日:2014-02-12

    申请号:CN201310489414.0

    申请日:2013-10-18

    Abstract: 一种基于可变块的图像空洞区域修补方法,包括步骤:1.设定块的初始尺寸,在输入图像上寻找待修补区域的边界;2.分别计算以待修补区域边界上未修补的各个像素点为中心、大小等于初始尺寸的各个块的优先级,选取优先级最高的块作为当前待修补块;块优先级的计算结合了块的可信度、结构条件和纹理条件;3.搜索当前待修补块的最匹配块,包括:根据当前待修补块的纹理条件调整当前待修补块的尺寸,然后基于颜色梯度直方图搜索最匹配块;4.基于图割技术用最匹配块修补当前待修补块;重复执行步骤2-4,直至输入图像上的待修补区域修补完。该方法能够在纹理条件复杂或较恒定的情况下均较好地保留纹理细节,能够同时修复纹理信息和结构信息。

    基于平滑校正的图像恢复方法

    公开(公告)号:CN103559684A

    公开(公告)日:2014-02-05

    申请号:CN201310467806.7

    申请日:2013-10-08

    Abstract: 一种基于平滑校正的图像恢复方法,包括步骤:S1、输入含噪图像,计算待处理元素x和搜寻区域中的参考像素y的相似性,得到搜寻区域内所有参考像素点的权值;S2、根据计算出的搜寻区域内所有参考像素的权值,对搜寻区域内所有像素点进行加权平均,得到像素点修正后的灰度值;S3、处理完含噪图像中所有像素后,用修正后像素点的灰度值代替含噪图像中像素点的灰度值,得观测图像;S4、建立图像估计的状态方程和观测方程,采用二维块Kalman滤波和前反馈平滑方法对观测图像进行去燥处理,得除噪声图像。本方法在获得n+1位置处的真实值的估计值后,用平滑和反馈的思想对前面位置的估计值进行了更正,能够在不增加计算复杂度的前提下提高图像恢复的质量。

    一种多视角裸眼立体显示系统及其显示方法

    公开(公告)号:CN103513438A

    公开(公告)日:2014-01-15

    申请号:CN201310441028.4

    申请日:2013-09-25

    Abstract: 本发明提供一种多视角裸眼立体显示系统及其显示方法,该系统包括:激光投影仪,用以投射光线;扫描系统,接收激光投影仪投射光线并扫描成图像;平面镜阵列,反射扫描系统射出的图像,形成多视角图像;柱面透镜光栅系统,包括第一柱面透镜光栅和散射膜,散射膜位于第一柱面透镜光栅的背向平面镜阵列一侧;平面镜阵列的各平面镜射出的图像在第一柱面透镜光栅上两两重合;本发明多视角裸眼立体显示系统及其显示方法采用平面镜阵列来取代传统技术中的投影仪阵列,大大节约了成本,降低了能耗,同时,由于只使用一台投影仪,投影仪的尺寸将不受限制,能够实现高亮度投影,从而能够应用于户外等多种复杂环境中。

    Kinect深度图像获取方法与装置

    公开(公告)号:CN103440662A

    公开(公告)日:2013-12-11

    申请号:CN201310399037.1

    申请日:2013-09-04

    Abstract: 本发明公开了一种基于散焦法和图像融合的Kinect深度图像获取方法与装置,包括:对Kinect彩色图应用Mean Shift算法进行图像分割;根据Kinect彩色图像使用散焦法提取深度;将散焦法提取的深度图和Kinect传感器捕获的深度图融合;对融合生成的深度图进行三边滤波。其中,基于散焦法的单幅图像深度提取方法,通过边缘点处LOG滤波响应的正负双峰间距计算散焦模糊参数进而获得边缘点处深度值,使用matting Laplacian插值生成稠密深度图;利用自适应权值选取方法将散焦法深度图与Kinect原始深度图融合。本发明的有益效果是:能够结合散焦法提取深度与Kinect主动式提取深度各自的优点,获得比Kinect原始深度图质量更好的深度图像,该深度图像不包含空洞、平滑性更好且噪声水平更低。

    逆向喷气再生的壁流式金属网板柴油车排气微粒捕集器

    公开(公告)号:CN100395435C

    公开(公告)日:2008-06-18

    申请号:CN200510080085.X

    申请日:2005-06-29

    Abstract: 本发明公开了属于环保设备范围的一种逆向喷气再生的壁流式金属网板柴油车排气微粒捕集器。在外壳内,复合金属网板过滤层以一定角度倾斜,通过挡板连接成“WW”型结构。在进气口和复合金属网板过滤层之间设置扩张室,扩张室连接扫气阀和碳烟二次收集装置;在出气口一边的气动碟阀、反吹腔和压缩空气贮气筒与外壳接通。发动机排出的废气从捕集器入口进入,经过“WW”型复合金属网板,废气中的颗粒物被截留捕集。当颗粒物沉积达到一定数量后,排气背压上升,逆向喷气再生装置启动,将累积的颗粒物从过滤体中吹出,被二次收集,并在收集器内集中燃烧。本发明结构简单实用,成本低廉,净化效果好再生效果好,寿命长,是值得大力推广的好产品。

    语音分离方法、装置及存储介质
    47.
    发明公开

    公开(公告)号:CN119541524A

    公开(公告)日:2025-02-28

    申请号:CN202411649966.8

    申请日:2024-11-18

    Applicant: 清华大学

    Inventor: 胡晓林 陈果 李凯

    Abstract: 本公开涉及计算机技术领域,包括一种语音分离方法、装置及存储介质。通过获取待分离的混合信号;通过编码器将混合信号转换为时频特征表示;通过分离模型对时频特征表示进行特征分离,得到不同输出通道分别对应的特征序列;分离模型包括缓存单元和至少一个依次相连的分离单元;每个分离单元包括依次相连的频域建模子单元、时域建模子单元和因果注意细化子单元,各个分离单元中的时域建模子单元均与缓存单元相连;通过解码器对不同输出通道分别对应的特征序列进行解码,得到每个输出通道对应的时域语音信号;额外设置的缓存单元在全局建模期间可以存储历史信息,从而使得分离模型能够基于历史信息进行特征处理,可以提高模型整体的语音分离性能。

    视听语音分离方法、装置、电子设备和存储介质

    公开(公告)号:CN116863537A

    公开(公告)日:2023-10-10

    申请号:CN202310816352.3

    申请日:2023-07-04

    Applicant: 清华大学

    Inventor: 胡晓林 李凯

    Abstract: 本公开涉及一种视听语音分离方法、装置、电子设备和存储介质,获取包括目标对象声音和至少一个参考对象声音的视频信息,并提取视频信息中的目标对象唇部图像帧组成的图像帧序列和混合音频,分别进行编码得到目标对象对应的视频特征和音频特征。将视频特征和音频特征输入训练得到的多模态分离网络,通过多次特征融合后得到目标对象对应的声音掩码,多模态分离网络包括用于进行三次特征融合的顶部模块、中部模块和底部模块。根据声音掩码和音频特征确定记录目标对象声音的目标音频。本公开通过三个模块多次融合视觉和听觉两个层面的信息,增强了模态内上下文信息,提高了视听分离性能得到准确的音频分离结果。

    视听语音分离方法、装置、电子设备以及存储介质

    公开(公告)号:CN116129929A

    公开(公告)日:2023-05-16

    申请号:CN202211584453.4

    申请日:2022-12-09

    Applicant: 清华大学

    Abstract: 本公开涉及一种视听语音分离方法、装置、电子设备以及存储介质,通过对包括混合音频数据以及至少一个对象的影像数据的视频信息进行特征提取得到听觉特征,和每个影像数据对应的视觉特征。将目标对象对应的视觉特征与听觉特征一同输入语音分离网络,得到目标对象的目标听觉特征以确定目标音频数据。其中,语音分离网络包括处理视觉特征的视觉子网络、处理听觉特征的听觉子网络和整合视觉子网络和听觉子网络的输出特征多模态融合子网络。本公开通过视觉子网络和听觉子网络分别处理视觉特征和听觉特征,并通过多模态融合子网络对视觉特征和听觉特征进行传递和整合,以基于视觉特征和听觉特征准确的重建目标音频数据。

Patent Agency Ranking