-
公开(公告)号:CN101923857A
公开(公告)日:2010-12-22
申请号:CN200910053200.2
申请日:2009-06-17
Applicant: 复旦大学
Abstract: 本发明属音频处理技术领域,涉及一种基于人机交互的可扩展语音识别系统和方法。该系统包括音频采集设备、语音识别模块、加载样本单元、有限状态机、分类存储特征样本库和指令执行模块。其语音识别方法基于孤立词语音识别对特定人的高识别率,在对用户充分训练的前提下,通过该用户的辅助运用,使得系统能在一段人机交互过程后,将无法识别的语音段以在线学习的方式存储到样本库中;另外通过分模块存储和加载来降低识别的开销。本发明的核心算法基于语音信号,不限定说话人的语种,并支持混合语种(如汉语与英语等)的识别。具有较低的误识别率和较低的不识别率,利用对话交互、在线增量式训练改善了系统的可靠性和适应性。
-
公开(公告)号:CN101901346A
公开(公告)日:2010-12-01
申请号:CN201010166984.2
申请日:2010-05-06
Applicant: 复旦大学
IPC: G06K9/62
Abstract: 本发明属于数字图像处理技术领域,具体为一种对彩色数字图像进行内容识别的方法。该发明包含图像拷贝检测算法和色情图片识别算法。其中图像拷贝检测算法用级联的方法,先用图像二阶熵的比较缩小在图片库中的范围。再用SSIM算法在缩小的范围内最终得出相似度。色情图片识别算法包括四个弱分类器:皮肤区域比例分类器,人脸个数分类器,不变矩分类器,皮肤区域分布分类器,它们输出4个置信度,组成一个四维特征向量,输入一个强分类器,得到最后结果。强分类器结果越大,内容为色情的概率越大。该系统和方法对互联网管控领域有广发的应用价值。
-
公开(公告)号:CN101872416A
公开(公告)日:2010-10-27
申请号:CN201010166981.9
申请日:2010-05-06
Applicant: 复旦大学
Abstract: 描述了一种进行车牌识别的方法和系统,该方法可以为智能交通系统提供支持,并能广泛应用在停车场,收费卡口,刑事缉拿等方面。方法主要包括定位、字符分割、字符识别三个阶段。有较高的识别率,能够应对较复杂的环境并能达到实时处理的要求。系统封装了上述方法,并提供了不同的参数,可灵活使用。便于分布,批量处理数据。
-
公开(公告)号:CN101853377A
公开(公告)日:2010-10-06
申请号:CN201010176193.8
申请日:2010-05-13
Applicant: 复旦大学
Abstract: 本发明属于视频处理技术领域,具体为一种对数字视频进行内容识别的方法。主要包括关键帧抽取,视频拷贝检测和视频帧内容识别三个模块。其中视频拷贝检测模块采用基于局部排序的视频拷贝检测方法,保证以一定的概率快速得到相似帧,提高检测性能。视频帧内容识别模块采用色情图像识别算法,该算法包括四个弱分类器(皮肤区域比例分类器、人脸个数分类器、不变矩分类器、皮肤区域分布分类器),四个弱分类器再综合组成一个强分类器,强分类器的结果即是最终的检测结果,从而有效地降低了误识别率和不识别率。该方法对互联网数字视频信息监管具有广泛的应用价值。
-
公开(公告)号:CN114494204B
公开(公告)日:2024-12-06
申请号:CN202210102370.0
申请日:2022-01-27
Applicant: 复旦大学
Abstract: 本发明提供一种基于深度学习的Ki67指数计算方法,基于两个阶段进行,首先将病理切片图像数据进行预处理得到1.5x的低分辨率的图像,在该1.5x的低分辨率的图像上提取热点区域,并且映射到40x的高分辨率的图像上,将高分辨率的图像上的热点区域分割成若干张512像素的小图片,将这些小图片输入到细胞检测模型中,从而获取细胞检测的结果,该基于深度学习的Ki67指数计算方法避免了整张大图检测,解决了现有整张切片计算方式的计算量大的问题,提高了检测计算的效率;其中,由于构建的细胞检测模型是依据病理细胞检测数据集小,且细胞尺度一致性的特点而构建的,其具有多尺度特征融合模块和双任务学习范式,因此还提高了细胞检测的精度。
-
公开(公告)号:CN118968622A
公开(公告)日:2024-11-15
申请号:CN202411042568.X
申请日:2024-07-31
Applicant: 复旦大学
IPC: G06V40/20 , G06V20/52 , G06V10/764 , G06V10/80 , G06V10/82 , G06T7/246 , G06T7/73 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种基于姿态追踪的行人异常行为识别方法及装置,具有这样的特征,行人异常行为识别模型包括:特征提取模块,用于对每个预处理图像,从该预处理图像中提取三个层级的特征;特征融合模块,用于将三个层级的特征进行融合,得到三个融合特征;行人姿态追踪模块,用于根据三个融合特征得到行人姿态估计数据;异常姿态分类模块,用于根据所有连续帧对应的行人姿态估计数据中各个行人的姿态估计图,得到对应的行人的行人异常行为识别结果。总之,本方法具有较好的泛化性和行人异常行为识别精确度。
-
公开(公告)号:CN118736242A
公开(公告)日:2024-10-01
申请号:CN202410720722.8
申请日:2024-06-05
Applicant: 复旦大学
IPC: G06V10/46 , G06V10/764 , G06V10/26 , G06V10/82 , G06N3/084
Abstract: 本发明提供了一种基于主动采样的高适应性点云3D目标检测方法,具有这样的特征,包括以下步骤:步骤S1,对输入点云进行预处理,得到预处理点云;步骤S2,将预处理点云输入点云3D目标检测模型,得到多个包含目标3D边界框和目标类别的初始目标;步骤S3,对所有初始目标进行目标置信度滤波和非极大值抑制,得到最终目标,其中,点云3D目标检测模型包括:点云特征提取模块,用于从预处理点云中提取多个不同深度层次的点云特征;候选目标预测模块,用于根据最深层次的点云特征得到候选目标;多尺度级联优化模块,用于对候选目标进行多层级联优化,得到多个对应不同层级的优化目标。总之,本方法能够对点云实现准确的3D目标检测。
-
公开(公告)号:CN118229563A
公开(公告)日:2024-06-21
申请号:CN202410045620.0
申请日:2024-01-12
Applicant: 复旦大学附属儿科医院
IPC: G06T5/70 , G06T5/73 , G06T5/60 , G06N3/047 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明提供一种基于贝叶斯神经网络的低剂量CT图像质量增强方法,包括如下步骤:步骤S1,使用Mayo Clinic数据集作为训练集。步骤S2,基于贝叶斯卷积层构建用于增强低剂量CT图像质量的贝叶斯神经网络。步骤S3,对训练集进行数据增强后,输入到贝叶斯神经网络中,训练贝叶斯神经网络,直到网络收敛。步骤S4,使用训练完成的贝叶斯神经网络对低剂量CT图像进行计算,生成质量增强的低剂量CT图像。
-
公开(公告)号:CN113793345B
公开(公告)日:2023-10-31
申请号:CN202111042489.5
申请日:2021-09-07
Applicant: 复旦大学附属华山医院
Abstract: 本发明公开了一种图像处理方法、装置、计算机设备及存储介质。该方法包括:获取目标图像的目标张量数据;将目标张量数据输入至目标神经网络模型,目标神经网络模型包括编码器、解码器和注意力模块;编码器用于根据目标张量数据进行降采样,得到第一特征矩阵;注意力模块用于根据第一特征矩阵进行空洞卷积,得到第二特征矩阵;根据第二特征矩阵确定原始注意力图;根据原始注意力图确定空洞注意力图;根据第一特征矩阵和空洞注意力图确定第三特征矩阵;将第三特征矩阵输出值解码器;解码器用于根据第三特征矩阵进行上采样,得到图像分割结果;根据目标神经网络模型的输出进行目标图像的分割反馈。能够提高图像分割的准确性。
-
公开(公告)号:CN116245828A
公开(公告)日:2023-06-09
申请号:CN202310089630.X
申请日:2023-02-09
Applicant: 复旦大学附属儿科医院
IPC: G06T7/00 , G06F40/295 , G16H30/40 , G16H15/00 , G06N3/0455 , G06N3/048 , G06N3/096
Abstract: 本发明提供一种融合医学领域知识的胸部X线质量评价方法,将胸部X线诊断文本报告和质量控制报告文本数据,通过知识抽取和知识融合转换为三元组信息,将其作为与医学影像对应的领域知识指导信息参与模型训练,利用大规模医学影像及其诊断报告、质量控制报告文本标注数据,通过对基于对比文本‑图像对的预训练模型进行微调实现跨域迁移学习,有效克服了训练样本数据量不足的问题,并且利用将X线图像的分块局部视觉特征与多个文本特征进行对齐,以保证视觉特征包含更多的细粒度图像信息,避免全局视觉信息无法反映用于疾病诊断的局部图像质量问题。
-
-
-
-
-
-
-
-
-