-
公开(公告)号:CN115861641A
公开(公告)日:2023-03-28
申请号:CN202211346536.X
申请日:2022-10-31
Applicant: 浙江工业大学
Abstract: 一种基于细粒度注意力的医学影像报告生成方法,包含:首先,通过预训练过的yolov5目标检测模型提取原始X射线全景图片中的牙齿和症状区域;通过denseNet‑121卷积神经网络对原始X射线全景图片提取特征,并与候选疾病标签文本通过跨模态注意力融合特征,得到粗粒度全局跨模态表示。随后,基于牙齿和症状区域的几何位置分布构建几何联结图,使牙齿和对应病灶区域在空间上对齐。然后,将区域图像特征根据几何联结图所表示的所属关系通过图注意力融合特征,得到细粒度的牙齿症状表示。最后,将粗粒度全局跨模态特征与细粒度牙齿症状表示输入具有两层跨模态注意力并由一个句子状态遗忘门控制的transformer桥塔文本生成器生成文本生成最后的报告文本。
-
公开(公告)号:CN115273158A
公开(公告)日:2022-11-01
申请号:CN202210691578.0
申请日:2022-06-17
Applicant: 浙江工业大学
Abstract: 一种基于OCT体数据的手指伪造攻击检测方法,包括:检测内外部指纹的细节点数量和皮下汗腺的数量;设置细节点数量阈值num1,num2,汗腺数量阈值num3,内外指纹匹配得分阈值t,皮下汗腺位置和内指纹脊线重合率n;若内指纹细节点数量多于num1且外指纹细节点数量多于num2,则计算内外指纹匹配得分;若内指纹细节点数量少于num1,则直接判断为手指伪造攻击;若汗腺数量少于num3,则直接判断为手指伪造攻击;若汗腺数量多于num3,如果内外指纹匹配得高于t则系统直接通过检测;若汗腺数量少于num3的同时,内指纹的细节点数量少于num1,则进入下个步骤;计算皮下汗腺位置和内指纹的脊线重合率;若重合率高于设定值n,则通过检测,否则判断为手指伪造攻击。
-
公开(公告)号:CN114821411A
公开(公告)日:2022-07-29
申请号:CN202210399070.3
申请日:2022-04-15
Applicant: 浙江工业大学
IPC: G06V20/40 , G06V40/10 , G06V10/26 , G06V10/28 , G06V10/62 , G06V10/94 , G06V10/82 , G06T7/254 , G06F16/71 , G06F16/783 , G06N3/04 , G06N3/08
Abstract: 一种基于昇腾处理器的边端监控视频结构化存储方法,包括:搭建基于国产昇腾处理器的边端硬件系统;根据监控摄像头视频流实时更新背景图像;根据上一步得到的二值化矩阵Bi进行椒盐去噪,找出其像素点值为1的总点数c,设置阈值Tc,若c>Tc则表示存在运动目标,使用YOLOV3算法进行目标检测,将框选出来的行人图像分割出来,并且送入到行人外观提取网络提取外观标签;对于目标检测网络,如果提取到了行人目标则将该帧合并入H264文件,生成关于关键视频段和行人目标的标签信息;将H264放在SD卡中,当缓存的数据达到SD卡存储上限后会定期向服务器进行备份。本发明加快了监控视频突发事件处理的实时性和响应速度,减少了服务器的计算压力。
-
公开(公告)号:CN113126069B
公开(公告)日:2022-07-26
申请号:CN202110306807.8
申请日:2021-03-23
Applicant: 浙江工业大学
IPC: G01S7/539
Abstract: 一种基于ZYNQ的前视声呐信号处理硬件系统,涉及海洋声学装备技术领域,包括ZYNQ模块、Spartan‑6模块、高速AD模块、模拟前端模块、电源模块、DDR3模块、千兆网模块、PWM模块、DA模块、SD卡模块以及串口通信模块。本发明抗干扰能力较好、功耗较低、实时性良好。本发明提供了一种能对多路模拟通道同步采集、大量数据高速处理、成像速度快的基于ZYNQ的前视声呐信号处理硬件系统。
-
公开(公告)号:CN108959522B
公开(公告)日:2022-06-17
申请号:CN201810689362.4
申请日:2018-06-28
Applicant: 浙江工业大学
IPC: G06F16/583 , G06V10/74 , G06K9/62
Abstract: 一种基于半监督对抗生成网络的迁移检索方法,通过设计对抗生成网络进行跨数据域的哈希检索,其目标是将原始数据集和目标数据集映射到一个共同的汉明空间,使得在一个特定场景中图像检索通过半监督对抗生成网络的学习可迁移到另一场景的检索图像中,从而解决大数据时代下无法充分利用未标记的数据和检索模型只适合单一场景的问题。本发明有效提高图像检索的自动化和智能化水平。
-
公开(公告)号:CN109976519B
公开(公告)日:2022-05-03
申请号:CN201910192408.6
申请日:2019-03-14
Applicant: 浙江工业大学
Abstract: 本发明涉及一种基于增强现实的交互显示装置及其交互显示方法,所述装置包括:视觉感知单元、声音输入输出单元、增强现实处理单元和视频输出单元,其中增强现实处理单元包括语音识别模块、手势识别模块、目标定位模块、三维注册模块、虚拟物体叠加模块。所述方法检测并显示采集到的原始视频;跟踪目标对象;当持续跟踪到目标对象的时间大于T1时,对从声音输入输出单元采集的语音进行识别,根据识别的语音指令选择增强现实模式,叠加虚拟效果,根据是否跟踪到当前目标对象及是否有新的语音指令进行增强现实模式选择、继续叠加虚拟效果或结束增强现实交互显示。本发明充分利用了增强现实技术和人工智能技术,有效地提升了交互显示的用户体验。
-
公开(公告)号:CN108764317B
公开(公告)日:2021-11-23
申请号:CN201810485738.X
申请日:2018-05-21
Applicant: 浙江工业大学
Abstract: 一种基于多路特征加权的残差卷积神经网络图像分类方法,包括以下步骤:1)模型的输入图像为经过预处理的原始图像,经过预处理的图像裁剪为一个固定尺寸;2)对图像进行较大尺寸的卷积操作和池化操作;3)将步骤2)中输出的特征送入第一个多路特征加权残差模块;4)将步骤3)中多路特征加权残差模块的输出继续送入下一个多路特征加权残差模块,在经过多个多路特征加权残差模块后,输出的特征图像尺寸会逐渐缩小直至变为较小尺寸,最后经过一个平均池化层缩小为特征点;所得特征点直接送入分类层进行分类或经过全连接层后再进行分类。本发明应用于复杂的图像分类任务,丰富了特征表达,避免了因神经网络深度增加导致的梯度消失问题。
-
公开(公告)号:CN107977671B
公开(公告)日:2021-10-26
申请号:CN201711026169.4
申请日:2017-10-27
Applicant: 浙江工业大学
Abstract: 一种基于多任务卷积神经网络的舌象分类方法,包括对采集到的舌象进行一系列预处理的图像操作、用于舌整体特征提取的深度卷积神经网络、用于对舌面标签进行检测的感兴趣区域定位网络、用于深度学习和训练识别的多任务深度卷积神经网络,完成对舌象舌色、苔色、苔质的厚薄、腐腻、润燥属性的标签分类。本发明有效的解决了现有方法不能对舌象舌色、苔色、苔质的厚薄、腐腻、润燥等多个属性进行同时识别的多分类问题。
-
公开(公告)号:CN110334566B
公开(公告)日:2021-08-03
申请号:CN201910219860.7
申请日:2019-03-22
Applicant: 浙江工业大学
Abstract: 一种基于三维全卷积神经网络的OCT内外指纹提取方法,包括如下步骤:1)对每幅指纹OCT图像中的角质层区域位置和乳头层区域位置进行手工标注,得到与OCT图像对应的标注图片,进行ROI提取和数据增强,构成标注数据集;2)构建三维全卷积神经网络模型,设定训练参数和损失函数,使用标注好的数据集训练模型;3)通过训练好的全卷积神经网络模型预测未标注的OCT图像的角质层、乳头层;4)根据所有OCT图像的角质层和乳头层,按照相对深度以及OCT图像空间顺序,经过拼接,分别得到OCT指纹的外指纹和内指纹。本发明通过三维全卷积神经网络来学习提取OCT图像的角质层和乳头层特征,从而生成准确的内外指纹。
-
公开(公告)号:CN113052072A
公开(公告)日:2021-06-29
申请号:CN202110318506.7
申请日:2021-03-25
Applicant: 浙江工业大学
Abstract: 一种基于昇腾处理器的指节纹和指静脉身份识别装置,包括昇腾处理器图像处理子系统以及指节纹和指静脉图像采集子系统,系统以搭载昇腾310处理器的Atlas200模块为核心设计嵌入式平台,构建了昇腾处理器图像处理子系统;以650nm和850nm光波长的LED阵列和摄像头为核心搭建指节纹和指静脉图像采集子系统,光强可调;同时,在图像采集过程中通过预处理和图像评估获得最佳质量图像,并使用Triplet Loss函数神经网络进行高效的特征匹配,实现身份识别。本发明有效地解决不同环境下指节纹和指静脉图像差异明显、手指图像识别算法难以实时实现以及低功耗和小型化条件下系统开发的难题。
-
-
-
-
-
-
-
-
-