基于注意力机制和卷积神经网络的语音抑郁症识别系统

    公开(公告)号:CN109599129B

    公开(公告)日:2021-09-14

    申请号:CN201811343483.X

    申请日:2018-11-13

    Abstract: 本发明涉及一种基于注意力机制和卷积神经网络的语音抑郁症识别系统。本发明首先对语音数据进行预处理,对较长的语音数据进行分割,依据的是分割后的片段能够充分包含抑郁症相关的特征。然后对分割后每个片段提取梅尔频谱图,调整其输入到神经网络模型的频谱图尺寸大小,以便模型的训练。之后用预训练好的Alexnet深度卷积神经网络进行权值的微调,提取梅尔频谱图中更高级的语音特征。然后用注意力机制算法,对片段级语音特征进行权重调整,得到句级的语音特征。最后对句级语音特征用SVM分类模型进行抑郁症的分类。本系统考虑了和抑郁症相关的语音特征的提取,提供一种基于语音的抑郁症识别的新系统。

    一种基于细节信息保持的多视点视图深度估计方法

    公开(公告)号:CN112907641A

    公开(公告)日:2021-06-04

    申请号:CN202110151211.5

    申请日:2021-02-03

    Abstract: 本发明公开了一种基于细节信息保持的多视点视图深度估计方法。本方法首先利用U型神经网络提取出图片序列在不同尺度的特征,在同一尺度的特征中,分为两个分支:一个分支进行分割操作,得到高质量细节保持的目标分割图;一个分支进行为后续的深度估计进行特征提取。将不同尺度的特征与同尺度下的分割图Fs相乘,按照单应矩阵映射融合为3D特征体素,最后通过回归得到深度图。将该深度图与对应大小的Fs逐像素相乘,通过由粗到细不同尺度的优化,输出最终的深度图,其中只有目标的深度信息有效。本发明提出的基于细节信息保持的多视点视图深度估计方法,避免了重建中背景对目标的影响,提高了深度估计的精度。

    基于卷积神经网络的单目光场图像无监督深度估计方法

    公开(公告)号:CN110163246B

    公开(公告)日:2021-03-30

    申请号:CN201910276356.0

    申请日:2019-04-08

    Abstract: 本发明公开了一种基于卷积神经网络的单目光场图像无监督深度估计方法。本发明先利用公开的大型光场图像数据集作为训练集,通过数据增强、数据扩充使训练集样本趋于平衡。构建改进的ResNet50网络模型,使用编码器和解码器分别提取模型的高级和低级的特征,再通过密集差结构将编码器和解码器的结果融合,同时另外构建了一个超分辨率遮挡检测网络,能够使用深度学习准确的预测出各个视角之间的遮挡问题;基于光场图像深度估计任务的目标函数是多损失函数,通过预先定义好的网络模型对预处理后的图像进行训练,最后在测试集上对网络模型进行泛化评估。本发明对复杂场景的光场图像预处理效果显著,实现了更精确光场图像无监督深度估计的效果。

    一种基于卷积神经网络的古字体分类方法

    公开(公告)号:CN109800754B

    公开(公告)日:2020-11-06

    申请号:CN201811487296.9

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于卷积神经网络的古字体分类方法。本发明首先利用爬虫技术爬取古字体类别图像数据集,通过数据扩充使训练集样本趋于平衡,对已经平衡的训练集样本进行灰度化处理并将图像resize到目标图像大小,然后对样本集进行直方图均衡化处理,通过N8连通降噪算法去除图像中孤立的噪点,最后基于模糊集理论并利用香农熵函数对图像进行二值化处理,较好的保留了图像的细节特征;基于分类任务的目标函数将中心损失函数与传统的交叉熵损失函数配合使用,增大类间距离并减小类内距离,在一定程度上提高了特征的分辨能力,通过预先定义好的网络模型对预处理后的图像进行训练,利用混淆矩阵对分类结果准确率进行评估。

    基于目标检测的垃圾分拣系统及方法

    公开(公告)号:CN111626117A

    公开(公告)日:2020-09-04

    申请号:CN202010321347.1

    申请日:2020-04-22

    Abstract: 本发明公开了一种基于目标检测的垃圾分拣系统及方法。本发明包括垃圾分类目标检测模型、机械臂、工业相机、服务器以及传送带;所述的垃圾分类目标检测模型由YOLOV3神经网络模型,通过带标注的数据集进行训练,然后再通过交叉验证集不断调试训练后的YOLOV3神经网络模型,用测试集测试调试后的最终模型,达到指标后的模型保即为垃圾分类目标检测模型。所述的带标注的数据集,使用图像采集设备,在垃圾处理站实地采集真实场景的垃圾图片,并对垃圾图片中的垃圾类别进行标注,标记为[x_min,y_min,x_max,y_max]以及该垃圾的类别classes_id。所述的服务器与机械臂、工业相机相连接后分别创建线程;本发明实现垃圾分拣生产线智能化、无人化的目标。

    基于3D-SUSAN算子的三维模型感兴趣点提取方法

    公开(公告)号:CN106652048B

    公开(公告)日:2020-07-14

    申请号:CN201611260181.7

    申请日:2016-12-30

    Abstract: 本发明提出一种基于3D‑SUSAN角点算子的三维模型感兴趣点提取方法。本发明首先读取三维模型顶点,并简化模型顶点以及模型网格化,计算每个顶点的曲率。再通过高斯滤波处理每个顶点的曲率,进行去噪处理。接着确定一个中心点并取中心点周围的36个邻居点,若中心顶点与邻居顶点的曲率差小于曲率相似度阈值,则进入下一步;若每个顶点的USAN值小于几何阈值,则该中心顶点就是兴趣点。最后对本发明所提出的基于3D‑SUSAN角点算子提取的三维模型感兴趣点从错误率、缺失率、误差率进行评估。本发明不仅可以提取三维模型兴趣点而且仍保留了SUSAN的抗噪能力强、计算量小效率高、性能稳定的优点。

    一种基于样本权值分配和深度学习的人脸表情识别方法

    公开(公告)号:CN110276248A

    公开(公告)日:2019-09-24

    申请号:CN201910388826.2

    申请日:2019-05-10

    Abstract: 本发明公开了一种基于样本权值分配和深度学习的人脸表情识别方法。本发明首先通过裁剪和进行随机镜像方法,获得了预处理后的训练集,并使用VGG-11网络模型对训练集进行k折交叉验证,获得每一个训练样本的权值参数,并且在识别模型建立过程中,设计了自适应Inception-Resnet网络结构,并使用训练样本的权值参数作为训练参数设计损失函数,优化了识别模型。本发明通过提出一种基于交叉验证的数据权重分配方法,减少异常样本对网络的干扰,并且设计了一个自适应Inception-Resnet网络,使网络中的分支能够自动调整权重,减少过拟合。

    一种针对嵌入式移动端的深度学习语义分割模型压缩方法

    公开(公告)号:CN110059740A

    公开(公告)日:2019-07-26

    申请号:CN201910294185.4

    申请日:2019-04-12

    Abstract: 本发明公开了一种针对嵌入式移动端的深度学习语义分割模型压缩方法。本发明中固定训练得到的教师网络参数权值,对鉴别网络与学生网络进行不断训练与学习,在三个不同层次上进行蒸馏(成对蒸馏、像素蒸馏、整体蒸馏),以使总体优化目标(交叉熵损失、像素蒸馏损失、成对蒸馏损失、整体蒸馏损失)不断优化,最终使经过蒸馏得到的学生网络在满足IoU(Intersection over Union)下降极少的情况下参数数量大大减少以及网络前向推算时间大量减少。本发明解决了嵌入式移动端因为自身GPU能力以及供电受限的情况下无法搭载大型深度学习网络的问题,并大量减少任务计算时间,使嵌入式移动端平台搭载复杂的深度网络模型成为可能。

    一种易拓展数据传输装置
    29.
    发明授权

    公开(公告)号:CN106230947B

    公开(公告)日:2019-07-26

    申请号:CN201610627507.9

    申请日:2016-08-03

    Abstract: 本发明公开了一种可用于工业现场易拓展的数据传输装置。该数据传输装置包含有主控模块、以太网模块、GPRS模块、GPS模块、三轴加速度模块、SD卡模块、CAN模块等,是一个功能全面的数据传输装置。所采用的模块均达到工业级水准,能够承受工业现场的工作环境。具有易拓展、维护、低成本、方便统一控制等特点。

    一种基于卷积神经网络的古字体分类方法

    公开(公告)号:CN109800754A

    公开(公告)日:2019-05-24

    申请号:CN201811487296.9

    申请日:2018-12-06

    Abstract: 本发明公开了一种基于卷积神经网络的古字体分类方法。本发明首先利用爬虫技术爬取古字体类别图像数据集,通过数据扩充使训练集样本趋于平衡,对已经平衡的训练集样本进行灰度化处理并将图像resize到目标图像大小,然后对样本集进行直方图均衡化处理,通过N8连通降噪算法去除图像中孤立的噪点,最后基于模糊集理论并利用香农熵函数对图像进行二值化处理,较好的保留了图像的细节特征;基于分类任务的目标函数将中心损失函数与传统的交叉熵损失函数配合使用,增大类间距离并减小类内距离,在一定程度上提高了特征的分辨能力,通过预先定义好的网络模型对预处理后的图像进行训练,利用混淆矩阵对分类结果准确率进行评估。本发明对退化的古字体图像预处理效果显著,通过优化参数设置,利用适当的训练技巧,训练卷积神经网络模型,实现了更精确的古字体分类效果。

Patent Agency Ranking