一种多点滑动的二维滑动窗DFT变换的快速算法

    公开(公告)号:CN105022924A

    公开(公告)日:2015-11-04

    申请号:CN201510447355.X

    申请日:2015-07-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种多点滑动的二维滑动窗DFT变换的快速算法,对于M×M的滑动窗口,当有L个新点滑入当前窗口时,利用当前窗口和之前L个窗口的DFT之间的关系计算当前窗口的DFT;在具体执行时,将滑入当前窗口的L个新点的二维数据转换成两次一维变换,其中的一维变换采用蝶形结构进行计算,另外的一维变换采用迭代结构进行计算。本发明算法可以大大减少滑动窗口DFT的计算量,当窗口尺寸为16×16、滑动点数L=8时,相较于二维向量基方法,加法的计算量减少61.4%,乘法的计算量减少78.4%;由于2-D SDF和MFFT都是单点滑动窗的计算,当有多个点滑入时就需要多次计算,因此这些方法的计算量就远远高于本发明提出的算法。

    一种冠状动脉CT造影图像钙化点检测方法

    公开(公告)号:CN103337096B

    公开(公告)日:2015-09-09

    申请号:CN201310307604.6

    申请日:2013-07-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种冠状动脉CT造影图像钙化点检测方法,利用已有的冠状动脉中轴线,首先提取该血管的感兴趣区域内各体素点的局部结构特征,然后利用球谐函数变换对局部结构特征量化得到特征向量,最后采用分类算法对所获得的特征向量进行分类,以确定体素点与训练数据集中的图像背景、血管腔及钙化点的局部结构特征近似程度,最终获得钙化点检测结果。本发明方法能够精确定位冠状动脉CT造影图像中位于冠状动脉血管壁上的钙化点,提高计算机辅助诊断的效率及准确率。

    一种基于保局映射与主成分分析的图像分类方法

    公开(公告)号:CN104881682A

    公开(公告)日:2015-09-02

    申请号:CN201510274498.5

    申请日:2015-05-26

    Applicant: 东南大学

    CPC classification number: G06K9/6269

    Abstract: 本发明公开了一种基于保局映射与主成分分析的图像分类方法,包括以下步骤:1、输入训练对象;2、建立一层或两层的流形学习网络,对于每一种具体的网络,学习得到每一层的滤波器;3、建立流形学习网络的输出层得到最终特征向量;4、将步骤3中最终得到的所有的特征向量输入支持向量机分类器进行训练;5、用校验图像集进行校验,调整到最佳网络参数;6、对测试图像进行测试,统计分类结果,计算识别率。本发明通过构造三种结构相似但不同网络层的网络,应用一种流形方法即保局映射获得图像更加本质的局部结构,使得在各种分类任务中,构造的网络更加具有分辨力,获得更高的图像的分类准确率。

    一种冠状动脉CT造影图像钙化点检测方法

    公开(公告)号:CN103337096A

    公开(公告)日:2013-10-02

    申请号:CN201310307604.6

    申请日:2013-07-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种冠状动脉CT造影图像钙化点检测方法,利用已有的冠状动脉中轴线,首先提取该血管的感兴趣区域内各体素点的局部结构特征,然后利用球谐函数变换对局部结构特征量化得到特征向量,最后采用分类算法对所获得的特征向量进行分类,以确定体素点与训练数据集中的图像背景、血管腔及钙化点的局部结构特征近似程度,最终获得钙化点检测结果。本发明方法能够精确定位冠状动脉CT造影图像中位于冠状动脉血管壁上的钙化点,提高计算机辅助诊断的效率及准确率。

    一种基于GDHT-III域的一维分段编码信号快速解码方法

    公开(公告)号:CN102355269B

    公开(公告)日:2013-09-25

    申请号:CN201110211841.3

    申请日:2011-07-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于GDHT-III域的一维分段编码信号快速解码方法,属于信号处理技术领域。本发明将长度为N/3的信号序列{an},{bn}和{cn},n=0,1,…,N/3–1,的GDHT-III域系数{Ak},{Bk}和{Ck},k=0,1,…,N/3–1,转换为长度为N的原始编码信号序列{xm},m=0,1,…,N–1,的GDHT-III域系数{Xi},i=0,1,…,N–1,其中{Xi}的计算分成3的倍数输出索引{X3k},3的倍数余1输出索引{X3k+1}和3的倍数余2输出索引{X3k+2}三个部分分别进行计算,从而减少了GDHT-III变换次数,降低了解码过程的计算复杂度。较之现有技术,本发明方法不仅具有较低的复杂度,解码实时性更好,而且具有更少的信号失真。

    一种低采样率下四元数域彩色图像恢复的方法

    公开(公告)号:CN103106643A

    公开(公告)日:2013-05-15

    申请号:CN201310030711.9

    申请日:2013-01-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种低采样率下四元数域彩色图像恢复的方法,属于数字图像处理技术领域。本发明首先在四元数域表达一幅彩色图像,即将彩色图像的R分量,G分量,B分量的值分别放在四元数的三个虚部里面;然后,利用均匀随机矩阵对原始整幅彩色图像进行下采样,得到采样后的部分彩色图像;然后,我们将部分彩色图像进行存储或者传输;最后,利用四元数的实数表达形式及四元数矩阵填充理论,通过采样后的部分彩色图像将原始彩色图像恢复出来。本发明方法利用四元数运算法则约束性强的特点,提高了低采样率情况下彩色图像恢复的精度,同时简化了采样时的复杂度和数据存储量。

    一种图像及数字视频编码及解码方法

    公开(公告)号:CN102036075B

    公开(公告)日:2012-11-28

    申请号:CN201010611318.5

    申请日:2010-12-29

    Applicant: 东南大学

    Abstract: 本发明公开了一种图像及数字视频编码及解码方法,属于数字图像处理技术领域。本发明的编码及解码方法在进行二维正向/反向离散正交变换时,采用二维整数正向/反向离散Tchebichef变换。本发明利用二维整数离散Tchebichef变换来替代现有技术所使用的其它整数变换方法,可以有效解决解码器失配问题,实现无损编码,而且具有较高的压缩性能以及更好的可扩展性。本发明还进一步提出了一种8×8整数离散Tchebichef变换矩阵的快速算法,该算法只需要进行移位和加法操作,降低了硬件资源消耗,有利于硬件实现。

    一种数字音频编码、解码方法及装置

    公开(公告)号:CN102103859B

    公开(公告)日:2012-04-11

    申请号:CN201110004244.3

    申请日:2011-01-11

    Applicant: 东南大学

    Abstract: 本发明公开了一种数字音频编码、解码方法,属于数字信号编码技术领域。本发明方法在对数字音频进行编解码时,将长度为2M的MCLT和IMCLT分别分解为两个长度为M的MCLT和IMCLT来进行快速计算,从而降低计算复杂度。相比现有技术,本发明方法具有计算复杂度低、实时性能好、易于实现的优点。本发明还公开了采用本发明编码、解码方法的数字音频编码、解码装置。

    一种基于扩散模型的三维人脸生成方法

    公开(公告)号:CN118941708A

    公开(公告)日:2024-11-12

    申请号:CN202410924033.9

    申请日:2024-07-11

    Abstract: 本发明公开了一种基于扩散模型的三维人脸生成方法,首先,使用了一种预训练的编码器,用于从CBCT扫描中提取隐空间向量。然后,将这些向量输入到特定的合成模块中,该模块能够预测三维人脸的形状和纹理。通过使用扩散模型,本发明实现了从CBCT数据到三维人脸参数空间的高效映射。此外,还探索了使用StyleGAN2网络进行材质生成,以提高最终三维人脸模型的细节和真实感。本方法避免了传统多阶段处理流程的复杂性,显著提高了推理速度,并通过生成的三维人脸模型,有效支持在正畸学、口腔和颌面外科以及整形外科等领域中的诊疗设计和医患沟通。此外,本发明还创建了一个细粒度的三维人脸数据集,为模型的训练和验证提供了必要的真实数据。

    一种粤语新闻视频中自动裁剪含主播的视听数据集的方法

    公开(公告)号:CN115460462B

    公开(公告)日:2024-10-01

    申请号:CN202211132338.3

    申请日:2022-09-17

    Applicant: 东南大学

    Abstract: 本发明公开了一种粤语新闻视频中自动裁剪含主播的视听数据集的方法,该方法把粤语新闻视频裁剪为视频、语音两个模态的数据集合,其中每一段数据都只包含主持人进行新闻播报的场景。该方法基于HSV图像信息检测算法进行整个新闻场景的分割,基于FaceRecognition人脸检测库和人脸特征提取工具进行包含目标主播人脸的视频识别,基于语音活动检测算法对音频进行切分,再根据切分停顿点对视频进行切分,实现自动完成粤语新闻中裁剪含主播的视听数据集的制作。通过设计的合理的流程和使用高效的算法,提高了构建粤语高质量视听数据集的效率,并能够方便地推广到其他语言的视听数据集制作中,最终能应用于如粤语场景下语音去噪、音视频驱动的人脸生成模型的训练中。

Patent Agency Ranking