一种人机交互的可扩展语音识别方法

    公开(公告)号:CN101923857A

    公开(公告)日:2010-12-22

    申请号:CN200910053200.2

    申请日:2009-06-17

    Applicant: 复旦大学

    Abstract: 本发明属音频处理技术领域,涉及一种基于人机交互的可扩展语音识别系统和方法。该系统包括音频采集设备、语音识别模块、加载样本单元、有限状态机、分类存储特征样本库和指令执行模块。其语音识别方法基于孤立词语音识别对特定人的高识别率,在对用户充分训练的前提下,通过该用户的辅助运用,使得系统能在一段人机交互过程后,将无法识别的语音段以在线学习的方式存储到样本库中;另外通过分模块存储和加载来降低识别的开销。本发明的核心算法基于语音信号,不限定说话人的语种,并支持混合语种(如汉语与英语等)的识别。具有较低的误识别率和较低的不识别率,利用对话交互、在线增量式训练改善了系统的可靠性和适应性。

    一种对彩色数字图像进行不良内容识别的方法

    公开(公告)号:CN101901346A

    公开(公告)日:2010-12-01

    申请号:CN201010166984.2

    申请日:2010-05-06

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理技术领域,具体为一种对彩色数字图像进行内容识别的方法。该发明包含图像拷贝检测算法和色情图片识别算法。其中图像拷贝检测算法用级联的方法,先用图像二阶熵的比较缩小在图片库中的范围。再用SSIM算法在缩小的范围内最终得出相似度。色情图片识别算法包括四个弱分类器:皮肤区域比例分类器,人脸个数分类器,不变矩分类器,皮肤区域分布分类器,它们输出4个置信度,组成一个四维特征向量,输入一个强分类器,得到最后结果。强分类器结果越大,内容为色情的概率越大。该系统和方法对互联网管控领域有广发的应用价值。

    对道路图像进行车牌识别的方法和系统

    公开(公告)号:CN101872416A

    公开(公告)日:2010-10-27

    申请号:CN201010166981.9

    申请日:2010-05-06

    Applicant: 复旦大学

    Abstract: 描述了一种进行车牌识别的方法和系统,该方法可以为智能交通系统提供支持,并能广泛应用在停车场,收费卡口,刑事缉拿等方面。方法主要包括定位、字符分割、字符识别三个阶段。有较高的识别率,能够应对较复杂的环境并能达到实时处理的要求。系统封装了上述方法,并提供了不同的参数,可灵活使用。便于分布,批量处理数据。

    一种对数字视频进行内容识别的方法

    公开(公告)号:CN101853377A

    公开(公告)日:2010-10-06

    申请号:CN201010176193.8

    申请日:2010-05-13

    Applicant: 复旦大学

    Abstract: 本发明属于视频处理技术领域,具体为一种对数字视频进行内容识别的方法。主要包括关键帧抽取,视频拷贝检测和视频帧内容识别三个模块。其中视频拷贝检测模块采用基于局部排序的视频拷贝检测方法,保证以一定的概率快速得到相似帧,提高检测性能。视频帧内容识别模块采用色情图像识别算法,该算法包括四个弱分类器(皮肤区域比例分类器、人脸个数分类器、不变矩分类器、皮肤区域分布分类器),四个弱分类器再综合组成一个强分类器,强分类器的结果即是最终的检测结果,从而有效地降低了误识别率和不识别率。该方法对互联网数字视频信息监管具有广泛的应用价值。

    一种基于深度学习的Ki67指数计算方法

    公开(公告)号:CN114494204B

    公开(公告)日:2024-12-06

    申请号:CN202210102370.0

    申请日:2022-01-27

    Applicant: 复旦大学

    Inventor: 纪伟 冯瑞

    Abstract: 本发明提供一种基于深度学习的Ki67指数计算方法,基于两个阶段进行,首先将病理切片图像数据进行预处理得到1.5x的低分辨率的图像,在该1.5x的低分辨率的图像上提取热点区域,并且映射到40x的高分辨率的图像上,将高分辨率的图像上的热点区域分割成若干张512像素的小图片,将这些小图片输入到细胞检测模型中,从而获取细胞检测的结果,该基于深度学习的Ki67指数计算方法避免了整张大图检测,解决了现有整张切片计算方式的计算量大的问题,提高了检测计算的效率;其中,由于构建的细胞检测模型是依据病理细胞检测数据集小,且细胞尺度一致性的特点而构建的,其具有多尺度特征融合模块和双任务学习范式,因此还提高了细胞检测的精度。

    基于姿态追踪的行人异常行为识别方法及装置

    公开(公告)号:CN118968622A

    公开(公告)日:2024-11-15

    申请号:CN202411042568.X

    申请日:2024-07-31

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于姿态追踪的行人异常行为识别方法及装置,具有这样的特征,行人异常行为识别模型包括:特征提取模块,用于对每个预处理图像,从该预处理图像中提取三个层级的特征;特征融合模块,用于将三个层级的特征进行融合,得到三个融合特征;行人姿态追踪模块,用于根据三个融合特征得到行人姿态估计数据;异常姿态分类模块,用于根据所有连续帧对应的行人姿态估计数据中各个行人的姿态估计图,得到对应的行人的行人异常行为识别结果。总之,本方法具有较好的泛化性和行人异常行为识别精确度。

    基于主动采样的高适应性点云3D目标检测方法

    公开(公告)号:CN118736242A

    公开(公告)日:2024-10-01

    申请号:CN202410720722.8

    申请日:2024-06-05

    Applicant: 复旦大学

    Inventor: 丁子恒 冯瑞

    Abstract: 本发明提供了一种基于主动采样的高适应性点云3D目标检测方法,具有这样的特征,包括以下步骤:步骤S1,对输入点云进行预处理,得到预处理点云;步骤S2,将预处理点云输入点云3D目标检测模型,得到多个包含目标3D边界框和目标类别的初始目标;步骤S3,对所有初始目标进行目标置信度滤波和非极大值抑制,得到最终目标,其中,点云3D目标检测模型包括:点云特征提取模块,用于从预处理点云中提取多个不同深度层次的点云特征;候选目标预测模块,用于根据最深层次的点云特征得到候选目标;多尺度级联优化模块,用于对候选目标进行多层级联优化,得到多个对应不同层级的优化目标。总之,本方法能够对点云实现准确的3D目标检测。

    一种基于改进注意力模块的医疗影像分割方法及装置

    公开(公告)号:CN113793345B

    公开(公告)日:2023-10-31

    申请号:CN202111042489.5

    申请日:2021-09-07

    Abstract: 本发明公开了一种图像处理方法、装置、计算机设备及存储介质。该方法包括:获取目标图像的目标张量数据;将目标张量数据输入至目标神经网络模型,目标神经网络模型包括编码器、解码器和注意力模块;编码器用于根据目标张量数据进行降采样,得到第一特征矩阵;注意力模块用于根据第一特征矩阵进行空洞卷积,得到第二特征矩阵;根据第二特征矩阵确定原始注意力图;根据原始注意力图确定空洞注意力图;根据第一特征矩阵和空洞注意力图确定第三特征矩阵;将第三特征矩阵输出值解码器;解码器用于根据第三特征矩阵进行上采样,得到图像分割结果;根据目标神经网络模型的输出进行目标图像的分割反馈。能够提高图像分割的准确性。

Patent Agency Ranking