-
公开(公告)号:CN109272988A
公开(公告)日:2019-01-25
申请号:CN201811155813.2
申请日:2018-09-30
Applicant: 江南大学
Abstract: 本发明提供基于多路卷积神经网络的语音识别方法,其能够提取更充分的语音信息,且处理数据量较大的音频数据时,具有更好的拟合性。其包括:S1:输入原始语音并进行处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于多路卷积神经网络模型为基础、CTC作为损失函数,构建声学模型;多路卷积神经网络的结构包括依次设置的子网络结构、连续的全连接层、CTC损失函数;S4:训练声学模型,得到训练好的声学模型;S5:将待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。
-
公开(公告)号:CN109272988B
公开(公告)日:2022-05-24
申请号:CN201811155813.2
申请日:2018-09-30
Applicant: 江南大学
Abstract: 本发明提供基于多路卷积神经网络的语音识别方法,其能够提取更充分的语音信息,且处理数据量较大的音频数据时,具有更好的拟合性。其包括:S1:输入原始语音并进行处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于多路卷积神经网络模型为基础、CTC作为损失函数,构建声学模型;多路卷积神经网络的结构包括依次设置的子网络结构、连续的全连接层、CTC损失函数;S4:训练声学模型,得到训练好的声学模型;S5:将待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。
-
公开(公告)号:CN109949824B
公开(公告)日:2021-08-03
申请号:CN201910066335.6
申请日:2019-01-24
Applicant: 江南大学
Abstract: 本发明提供一种基于N‑DenseNet和高维mfcc特征的城市声音事件分类方法,其在处理音频数据时能提供更丰富、更有效的特征信息,模型有更强的泛化能力,分类具有更高的准确率。其包括:S1:采集待处理音频数据,对原始音频信号进行预处理,输出音频帧序列;S2:对音频帧序列进行时域和频域分析,提取高维梅尔频率倒谱系数,输出特征向量序列;S3:构建声学模型,并对声学模型进行训练,得到训练好的声学模型;S4:将步骤S2中输出的特征向量序列经过处理后,输入到训练好的声学模型中进行分类识别,得到的识别结果即为声音事件的分类结果;其特征在于:声学模型是以DenseNet模型为基础,结合N阶马尔可夫模型的特点构建的网络模型,即为N阶DenseNet模型。
-
公开(公告)号:CN109272990A
公开(公告)日:2019-01-25
申请号:CN201811112506.6
申请日:2018-09-25
Applicant: 江南大学
Abstract: 本发明提供基于卷积神经网络的语音识别方法,其更加擅长提取高层特征,建模过程简单、容易训练、模型的泛化性能更佳,能够更广泛的应用到各种语音识别的场景中。其包括:S1:对输入的原始语音信号进行预处理;S2:提取出反映语音信号特征的关键特征参数,形成特征矢量序列;S3:基于DCNN网络模型为基础、以联结主义时间分类器CTC作为损失函数,构建端对端方式的声学模型;S4:训练声学模型,得到训练好的声学模型;S5:将步骤S2中得到的待识别的特征矢量序列输入到训练好的声学模型中得到识别结果;S6:以步骤S5中得到的识别结果为基础进行后续的运算,即得到能够以最大概率输出该语音信号的词串,词串即原始语音被识别后的语言文字。
-
公开(公告)号:CN108073941A
公开(公告)日:2018-05-25
申请号:CN201611035273.5
申请日:2016-11-17
Applicant: 江南大学
Abstract: 本发明公开了一种基于深度学习的图像语义生成方法,该方法包括以下步骤:第一,通过图像整体语义生成要求,构建结合卷积神经网络和长段时间记忆网络的模型结构;第二,将人工标注好的图像输入到预训练好的卷积神经网络;第三,将人工标注的图像语义描述与卷积神经网络提取到的图像特征输入到长段时间记忆网络中;第四,根据生成的图像语义描述与人工标注信息进行计算其损失函数;第五,根据损失函数,反向传播优化卷积神经网络和长段时间记忆网络各个参数。本发明应用卷积神经网络技术和长短时间记忆网络生成图像语义描述。
-
公开(公告)号:CN106940805A
公开(公告)日:2017-07-11
申请号:CN201710127457.2
申请日:2017-03-06
Applicant: 江南大学
IPC: G06K9/62 , G06F3/0346 , G06F17/30
Abstract: 本发明涉及一种基于手机传感器的群体行为分析方法,属于计算机网络应用技术领域。本发明将手机加速度及触摸屏传感器信号作为行为分析的数据源,然后通过滑动平均滤波器对原始数据进行噪声处理;对预处理后的数据在时域和频域上进行特征提取,构建一种结合互信息与线性判别分析的降维方法对提取特征进行降维处理,将降维后的对应特征向量输入行为分类模型,获得用户行为识别结果。进一步选择访问时间和访问频率作为群体行为属性,最后利用近邻传播算法对用户群体行为数据进行聚类,完成对群体行为的分析。
-
公开(公告)号:CN106843294A
公开(公告)日:2017-06-13
申请号:CN201710173043.3
申请日:2017-03-22
Applicant: 江南大学
CPC classification number: G05D3/20 , H02P6/16 , H02P2203/03
Abstract: 本方法所涉及装置包括无刷电机,电机转子角度传感器,处理器,电机驱动,三轴磁力计,三轴陀螺仪,三轴加速度计,电机底座连轴柄。该方法包括:三轴磁力计三轴加速度计在轴柄下方远离电机强磁场影响范围,三轴陀螺仪固定放置在电机转子上面,电机转子角度传感器采集电机转子位置,各个传感器数据传输至处理器,通过本发明的方法实现云台航向轴的控制,消除了航向轴漂移,以及电机磁场的影响,更完美体现了陀螺仪增稳的效果,弥补了传统三轴增稳云台的航向轴长时间存在严重漂移的问题。
-
公开(公告)号:CN104905556A
公开(公告)日:2015-09-16
申请号:CN201410097468.7
申请日:2014-03-14
Applicant: 江南大学
Abstract: 本发明提供一种多功能新型讲台,包括:讲台顶层、顶层与升降台间的旋转装置,固定在讲台底层的升降装置,讲台底层内的折叠椅装置。其特点是所述的讲台顶层由顶面、圆柱壁面组成。所述的顶层与升降台间的旋转装置由旋转体、转盘、螺柱、固定铁块组成。所述的固定在讲台底层的升降装置由电动推杆、推杆、套筒、塑料管、木板、讲台升降层组成。所述的讲台底层内的折叠椅装置由座椅靠背、座椅面、座椅腿、滑槽、支架组成。整个新型多功能组合桌椅使用过程中不需借助任何工具,徒手操作便可完成,且使用安全可靠。
-
公开(公告)号:CN104631537A
公开(公告)日:2015-05-20
申请号:CN201310562625.2
申请日:2013-11-12
Applicant: 江南大学
Abstract: 本发明涉及水下收草装置,采用一种连续循环传动系统进行抓取水草的一种装置,两行平行的链轮与两条链条设置,采用了双排八个链轮、单排四个链轮,在两个链条运行的轨迹上设置曲线导轨,两个链条之间连接抓取水草的机构,综上组合组成一种连续循环传动系统进行抓取水草的一种装置。
-
公开(公告)号:CN203789418U
公开(公告)日:2014-08-27
申请号:CN201420119451.2
申请日:2014-03-14
Applicant: 江南大学
Abstract: 本实用新型提供一种多功能新型讲台,包括:讲台顶层、顶层与升降台间的旋转装置,固定在讲台底层的升降装置,讲台底层内的折叠椅装置。其特点是所述的讲台顶层由顶面、圆柱壁面组成。所述的顶层与升降台间的旋转装置由旋转体、转盘、螺柱、固定铁块组成。所述的固定在讲台底层的升降装置由电动推杆、推杆、套筒、塑料管、木板、讲台升降层组成。所述的讲台底层内的折叠椅装置由座椅靠背、座椅面、座椅腿、滑槽、支架组成。整个新型多功能组合桌椅使用过程中不需借助任何工具,徒手操作便可完成,且使用安全可靠。
-
-
-
-
-
-
-
-
-