-
公开(公告)号:CN110428427B
公开(公告)日:2023-05-12
申请号:CN201910639378.9
申请日:2019-07-16
Applicant: 东南大学
Abstract: 本发明公开了一种基于密集偏置网络和自编码器的半监督肾动脉分割方法,包括:对现有的腹部CT血管造影图像,分割出图像中的肾脏区域得到感兴趣区域图像并进行标注得到肾动脉的真实掩模,并形成监督训练数据集和无监督训练数据集;将无监督训练数据集输入三维卷积去噪自编码器中进行图像重建训练,得到训练好的去噪自编码器模型;将监督训练数据集输入去噪自编码器模型,获得每张图像的先验解剖特征并同对应图像输入构建的密集偏置网络中进行分割训练,得到分割模型;对于新的待分割腹部CT血管造影图像,输入去噪自编码器模型得到图像的先验解剖特征,输入分割模型得到分割结果。本发明能获得高准确率的输出结果,快速实现肾动脉分割。
-
公开(公告)号:CN115460462A
公开(公告)日:2022-12-09
申请号:CN202211132338.3
申请日:2022-09-17
Applicant: 东南大学
IPC: H04N21/4402 , H04N21/845 , H04N21/439 , G10L13/02 , G10L21/0208 , G06V20/40 , G06V40/16 , G06F16/483
Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法,该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合,其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割,基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别,基于语音活动检测算法对音频进行切分,再根据切分停顿点对视频进行切分,实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法,提高了构建粤语高质量视听数据集的效率,并能够方便地推广到其他语言的视听数据集制作中,最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。
-
公开(公告)号:CN115168612A
公开(公告)日:2022-10-11
申请号:CN202210848061.8
申请日:2022-07-19
Applicant: 东南大学
IPC: G06F16/36 , G06F40/279
Abstract: 本发明公开了一种基于任意维度超复数嵌入的知识图谱表示方法,该方法主要特征在于将原始的知识图谱表示中的四元数嵌入的线性层替换成了超复数嵌入的线性层。具体包括以下步骤:1、知识图谱数据预处理,将传统知识图谱根据模型需求预处理为结构化数据;2、利用深度学习框架pytorch构造初步嵌入,并构建新的线性层,即超复数嵌入线性层,在图谱上学习实体和关系的向量表示;3、用知识图谱校验集进行校验,调整到最佳网络参数;4、对知识图谱测试集进行测试,统计结果。本发明通过改进一种已有的四元数知识图谱嵌入方法QuatE,引入超复数策略,降低了内存占用,减少了参数,同时保持了优异地嵌入结果。
-
公开(公告)号:CN114881089A
公开(公告)日:2022-08-09
申请号:CN202210622308.4
申请日:2022-06-02
Applicant: 东南大学
Abstract: 本发明公开了一种基于双分支融合模型的深度学习的抑郁脑电分类方法,包括以下步骤:(1)获取若干组健康人的大脑前额叶Fp1、Fpz和Fp2电极的脑电信号,(2)获取若干组轻度抑郁患者的大脑前额叶Fp1、Fpz和Fp2电极的脑电信号,(3)获取若干组中度抑郁患者的大脑前额叶Fp1、Fpz和Fp2电极的脑电信号,(4)以步骤(1)、(2)和(3)中的健康对照、轻度抑郁患者和中度抑郁患者的输入形式,对双分支融合模型进行训练学习,(5)将待分析窗口脑电信号转换成对应的小波时频图,输入步骤(4)中训练完成的双分支融合模型,完成该脑电信号的分析。该方法效果良好,能够区分出抑郁和健康以及抑郁程度。
-
公开(公告)号:CN114581451A
公开(公告)日:2022-06-03
申请号:CN202210172706.0
申请日:2022-02-24
Applicant: 东南大学
Abstract: 本发明公开了一种基于散射图神经网络的大脑磁共振图像分割方法,首先,为了降低模型计算复杂度,采用超体素作为基本单位,针对参考图像与待分割图像,生成数量相当的超体素;同时考虑超体素的自身信息、周围邻居信息与空间位置信息,预先提取其灰度特征、张量特征与关键点空间先验特征;再次,由于大脑各超体素间隐含一定的拓扑结构信息,以超体素作为节点构建拓扑图,采用散射图神经网络学习全局拓扑信息,更新节点特征;最后,直接将待分割图像的超体素与已标注参考图像的超体素进行特征匹配,得到语义分割结果,本发明能较好地应用于大脑磁共振图像,有效地分割出大脑磁共振图像的组织结构。
-
公开(公告)号:CN110706209B
公开(公告)日:2022-04-29
申请号:CN201910874099.0
申请日:2019-09-17
Applicant: 东南大学
Abstract: 本发明提供了一种一种网格网络的大脑磁共振图像肿瘤自动定位方法,提出了一种新的三维物物体检测方法,采用一种浅层的三维卷积神经网络模型提取图像特征,采用网格方式进行分类定位。本发明包括:从基于残差网络的三维深度卷积神经网络的骨干网络中获得图像的特征,基于骨干网络获得的特征图像进行大脑肿瘤定位。本发明能较好地应用于大脑核磁共振图像,实现三维核磁共振图像中的肿瘤区域定位,定位结果准确,且计算资源代价较低。
-
公开(公告)号:CN110292377B
公开(公告)日:2022-04-01
申请号:CN201910495542.3
申请日:2019-06-10
Applicant: 东南大学
IPC: A61B5/372
Abstract: 本发明公开了一种基于瞬时频率和功率谱熵融合特征的脑电信号分析方法,包括以下步骤:(1)提取慢波睡眠期的正常脑电信号和早期帕金森病的脑电信号,分别计算其瞬时频率和功率谱熵,从而构成一个二维的时序特征;(2)将二维时序特征作为LSTM神经网络的输入并进行训练学习;(4)利用训练学习号的神经网络对待评估脑电信号进行分析。该方法效果良好,能区分帕金森病病人与正常人的脑电信号。
-
公开(公告)号:CN113539232A
公开(公告)日:2021-10-22
申请号:CN202110781210.9
申请日:2021-07-10
Applicant: 东南大学
IPC: G10L13/047 , G10L13/033 , G10L13/08 , G10L25/24 , G10L25/30 , G10L19/16 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于慕课语音数据集的语音合成方法,该方法的主要特征在于通过真实场景下的语音构建的数据集进行语音合成,并进行说话人转换和多语种语音合成;该方法运用端到端的语音合成模型生成梅尔频谱,并用基于生成对抗网络的声码器将梅尔频谱转换成最终音频。本发明在真实场景下的语音数据集上有良好的效果,降低了语音合成所需数据的要求,提高了合成音频的质量,使合成音频更贴近真实说话场景。
-
公开(公告)号:CN113434727A
公开(公告)日:2021-09-24
申请号:CN202110852417.0
申请日:2021-07-27
Applicant: 东南大学
IPC: G06F16/71 , G06F16/735 , G06F16/783 , G06F16/74 , G06F40/258 , G06F40/279 , G06F40/58
Abstract: 本发明公开了一种新闻类长视频描述数据集的构建方法,该方法的主要特征在于把新闻类长视频构建成包含视频、视频标题、音频、中英文文本的数据集;该方法基于感知哈希算法计算相邻帧对应的灰度图之间的相似度来进行长视频的自动分割,使用FFmpeg完成音频的提取,并基于Python和selenium制作了一个语音识别工具来自动识别音频中包含的有效文本信息,最后通过脚本自动将视频片段、视频标题、音频、中英文文本信息组合形成一个新闻类长视频描述数据集,为长视频描述网络的研究以及长视频描述在为视频拟定标题方面的应用提供了支持。
-
公开(公告)号:CN112508844A
公开(公告)日:2021-03-16
申请号:CN202011060583.9
申请日:2020-09-30
Applicant: 东南大学
Abstract: 本发明公开了一种基于弱监督的大脑磁共振图像分割方法,包括以下步骤:使用超体素匹配方法实现待分割图像与参考图像之间的匹配,使得待分割图像的超体素获得标签,在待分割图像匹配的超体素中,选择高置信度的超体素组成种子区域;建立一种脑组织分割网络模型BTSNet,以选择的种子区域作为监督标签,指导网络训练,获得图像每个体素的类别概率;采用了深度种子区域增长方法,以当前种子区域为基础,使用卷积网络输出的类别概率,更新种子区域;最后,迭代脑组织分割网络与深度种子区域增长两个步骤,直至种子区域覆盖整个图像,输出分割结果。本发明能够在只使用少量参考图像的超体素级别标签的条件下实现脑MRI图像的准确分割。
-
-
-
-
-
-
-
-
-