基于广义霍夫变换的交通信号灯位置检测方法

    公开(公告)号:CN102354457B

    公开(公告)日:2013-10-16

    申请号:CN201110325073.4

    申请日:2011-10-24

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理及模式识别技术领域,本发明公开了一种基于广义霍夫变换的交通信号灯位置检测方法。本发明以图像序列为输入,使用图像灰度,对图像采用一阶微分算子计算图像梯度信息;建立交通灯形状描述函数,定义从图像点到累加器空间的映射,搜索累加器空间极值获取信号灯的坐标,为交通灯状态识别提供位置信息。本发明能应光照的显著变化,对图像采样偏色造成的影响不敏感,并能应对多种常见形状的交通灯。

    基于多摄像头融合的上座率统计方法

    公开(公告)号:CN103345653A

    公开(公告)日:2013-10-09

    申请号:CN201310238694.8

    申请日:2013-06-17

    Applicant: 复旦大学

    Inventor: 冯瑞 钱晨 鲁帅

    Abstract: 本发明属于图像处理技术领域,具体涉及一种基于多摄像头融合的上座率统计方法。本发明步骤为:根据会场坐席的分布和摄像头安装位置,将会场划分为若干个区域;人工标注每个区域的坐席状态,用来训练摄像头的权重;对于每个区域,融合正面视角摄像头和顶部视角摄像头所得的坐席状态判定结果;构建两层神经网络,以单区域判定结果为输入神经元,通过网络融合成整个会场的坐席状态,然后统计会场的上座率。本发明通过多摄像头融合,有效避免了单视角摄像头无法解决的遮挡问题,同时利用多台价格低廉的摄像头代替昂贵的高性能摄像头,节约了成本,提高了上座率统计的准确率。

    一种对彩色数字图像进行不良内容识别的方法

    公开(公告)号:CN101901346B

    公开(公告)日:2012-11-21

    申请号:CN201010166984.2

    申请日:2010-05-06

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理技术领域,具体为一种对彩色数字图像进行内容识别的方法。该发明包含图像拷贝检测算法和色情图片识别算法。其中图像拷贝检测算法用级联的方法,先用图像二阶熵的比较缩小在图片库中的范围。再用SSIM算法在缩小的范围内最终得出相似度。色情图片识别算法包括四个弱分类器:皮肤区域比例分类器,人脸个数分类器,不变矩分类器,皮肤区域分布分类器,它们输出4个置信度,组成一个四维特征向量,输入一个强分类器,得到最后结果。强分类器结果越大,内容为色情的概率越大。该系统和方法对互联网管控领域有广发的应用价值。

    基于广义霍夫变换的交通信号灯位置检测方法

    公开(公告)号:CN102354457A

    公开(公告)日:2012-02-15

    申请号:CN201110325073.4

    申请日:2011-10-24

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理及模式识别技术领域,本发明公开了一种基于广义霍夫变换的交通信号灯位置检测方法。本发明以图像序列为输入,使用图像灰度,对图像采用一阶微分算子计算图像梯度信息;建立交通灯形状描述函数,定义从图像点到累加器空间的映射,搜索累加器空间极值获取信号灯的坐标,为交通灯状态识别提供位置信息。本发明能应光照的显著变化,对图像采样偏色造成的影响不敏感,并能应对多种常见形状的交通灯。

    一种基于Zernike矩的压缩域音频指纹方法

    公开(公告)号:CN101882439B

    公开(公告)日:2012-02-08

    申请号:CN201010197996.1

    申请日:2010-06-10

    Applicant: 复旦大学

    Abstract: 本发明属于基于内容的音乐检索技术领域,具体为一种基于Zernike矩的压缩域音频指纹方法。本发明巧妙地将MP3压缩域数据的修正离散余弦变换系数(MDCT系数)的频率和时间信息,与Zernike矩的一些特性相结合,如:低阶矩代表信号的整体特性,高阶矩代表信号细节特性;Zernike矩有着旋转,缩放和平移的不变性特性,使最终构成的音频压缩域指纹能够鲁棒的抵抗时间域的众多信号处理和轻微的抵抗时间域信号处理。

    一种基于视觉转化器的人群密度估计方法及系统

    公开(公告)号:CN114519844B

    公开(公告)日:2025-05-13

    申请号:CN202210133298.8

    申请日:2022-02-09

    Applicant: 复旦大学

    Inventor: 邓欣 冯瑞

    Abstract: 本发明公开了一种基于视觉转化器的人群密度估计方法,具有这样的特征,包括:步骤1,对待测图像进行预处理获得预处理图像,然后搭建编码解码层;步骤2,搭建基于视觉转化器的神经网络模型;步骤3,把训练数据输入基于视觉转化器的神经网络模型进行模型训练,得到训练完成的基于视觉转化器机制神经网络模型;步骤4,将预处理图像输入训练完成的基于视觉转化器机制神经网络模型,分别得出各个预处理图像中的人群密度结果并进行输出,其中,基于视觉转化器的神经网络模型包括前端以卷积神经网络为基础的局部信息提取模块和后端以视觉转化器为基础的全局信息提取模块。本发明还公开基于视觉转化器的人群密度估计系统,包括预处理部和密度预测部。

    自动驾驶车辆同步定位与建图方法及装置

    公开(公告)号:CN118746291A

    公开(公告)日:2024-10-08

    申请号:CN202410778206.0

    申请日:2024-06-17

    Applicant: 复旦大学

    Abstract: 本发明提供了一种自动驾驶车辆同步定位与建图方法及装置,具有这样的特征,包括以下步骤:步骤S1,通过预处理得到预处理点云数据;步骤S2,将预处理点云数据输入自动驾驶车辆同步定位与建图模型得到当前帧定位结果;步骤S3,根据当前帧定位结果和过往地图得到更新地图,其中,自动驾驶车辆同步定位与建图模型包括:特征提取模块,用于对预处理点云数据进行特征提取得到特征点集合;特征点关联模块,用于根据当前帧和上一帧的特征点集合得到对应关系和空间位置残差;位置解算模块,用于根据对应关系和空间位置残差计算得到当前帧定位结果。总之,本方法能够实现准确的定位并降低建图的计算量。

    基于梯度增强注意力的多模态MR影像超分辨率方法

    公开(公告)号:CN116823613A

    公开(公告)日:2023-09-29

    申请号:CN202310795009.5

    申请日:2023-06-30

    Applicant: 复旦大学

    Inventor: 王润涵 冯瑞

    Abstract: 本发明提供了一种基于梯度增强注意力的多模态MR影像超分辨率方法,具有这样的特征,包括以下步骤:步骤S1,对辅助模态影像和源模态影像分别进行预处理,得到预处理辅助模态影像和预处理源模态影像;步骤S2,构建包括生成器和判别器的生成对抗网络,并将现有的多张多模态的MR影像作为训练数据,再通过训练数据对生成对抗网络进行训练,将训练好的生成器作为多模态MR影像超分辨率模型;步骤S3,将预处理辅助模态影像和预处理源模态影像输入多模态MR影像超分辨率模型,得到目标影像。总之,本方法能够根据高分辨率的辅助模态影像和低分辨率的源模态影像生成更高质量的超分辨率的目标影像。

    一种面向危重症儿童的疼痛表情数据集的构建与验证方法

    公开(公告)号:CN116570242A

    公开(公告)日:2023-08-11

    申请号:CN202310553502.6

    申请日:2023-05-17

    Abstract: 本发明提供一种面向危重症儿童的疼痛表情数据集的构建与验证方法,通过构建面向危重症儿童的疼痛表情数据集,基于Swin Transformer的儿童面部表情评估算法,对上述数据集进行验证,算法模型在PECIC数据集训练的各项测试性能进行进行评估,得到疼痛等级的评估性能结果。本申请的面向危重症儿童的疼痛表情数据集的构建与验证方法构建的PECIC数据集具有多样性、权威性、科学性和合理性,建立的PECIC数据集在危重症儿童疼痛表情分析上具有更好的可用性和准确性。

Patent Agency Ranking