-
公开(公告)号:CN109410917A
公开(公告)日:2019-03-01
申请号:CN201811123791.1
申请日:2018-09-26
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种基于改进型胶囊网络的语音数据分类方法,首先在训练阶段,构造胶囊网络的编码器,对初始语音音素数据进行编码得到初级胶囊;构造胶囊网络的动态路由结构,将初级胶囊中的信息传递给高级胶囊;以每个高级胶囊的长度的softmax激活值表征初始语音音素数据属于对应类别的概率;然后构造胶囊网络的解码器,将真实音素符号对应的高级胶囊进行解码重构;基于总损失函数对胶囊网络的参数进行优化;在测试阶段,将初始语音音素数据输入胶囊网络的编码器中,判断待测试数据的所属类别。本发明实现对语音音素的时序信号所对应的音速符号的精准识别,解决按照理论知识直接提取的特征准确度低、语音数据分类效果差以及过拟合的技术问题。
-
公开(公告)号:CN109256142B
公开(公告)日:2022-12-02
申请号:CN201811131244.8
申请日:2018-09-27
Applicant: 河海大学常州校区
IPC: G10L19/04
Abstract: 本发明公开了一种语音转换基于可扩展内核类网格法处理零散数据建模方法,语音数据根据时间间隔经过前期的预处理分帧,语音转换通过取源语音某一音色的多维数据与目标语音的对应一维数据进行映射拟合,源语音的多维数据和一维目标语音数据作为训练数据,经过高斯回归模型进行训练,高斯过程采取可扩展性内核,建立类似网格结构,从中设置合适数量代表点通过局部三次插值和反距离权重插值法来作结构性内核逼近,从而大大加快高斯回归模型快速拟合;本发明通过设置合适数量代表点作精确内核逼近得到近似内核,这样既降低高斯过程计算量,大幅减小数据训练时间,又不会降低回归预测精度,做到同时兼顾。
-
公开(公告)号:CN109766843A
公开(公告)日:2019-05-17
申请号:CN201910030647.1
申请日:2019-01-14
Applicant: 河海大学常州校区
Abstract: 本发明公开一种基于改进的受限玻尔兹曼机的肌电信号特征提取方法,将获取的肌电信号预处理,得到训练数据和测试数据;构建改进的受限玻尔兹曼机网络对训练数据进行训练;定义能量函数,根据能量函数得联合概率分布,再由贝叶斯公式得可视层与隐藏层的条件概率分布,再对可视层数据进行采样得隐藏层数据,然后对隐藏数据进行概率最大池化,对特征数据进行压缩;再对池化后的数据反池化重构隐藏层数据,再根据吉布斯采样由隐藏层数据重构可视层数据,并迭代多次,再堆叠多个受限玻尔兹曼机构成深度玻尔兹曼机网络;使用前面训练好的权重和偏置对测试数据进行分类验证。本发明解决了现有肌电信号提取中的时域特征变化大、频域特征提取不充分的问题。
-
公开(公告)号:CN109308471A
公开(公告)日:2019-02-05
申请号:CN201811148444.4
申请日:2018-09-29
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种肌电信号特征提取方法,首先对肌电信号作傅里叶变换取傅里叶系数,选取预设频段的傅里叶系数并归一化;构建堆叠自动编码器,设置每一层网络参数进行训练更新参数;构建堆叠的受限玻尔兹曼机,设置每一层网络参数进行训练更新参数;在预训练自动编码器和受限玻尔兹曼机完成后,将两部分预训练的参数前后连接起来,即自动编码器的输出为受限玻尔兹曼机的输入,形成一个贯通的网络,实现肌电信号特征提取,解决现有肌电信号提取方法时面临的时域特征变化大、频域特征提取不充分的问题。
-
公开(公告)号:CN109308471B
公开(公告)日:2022-07-15
申请号:CN201811148444.4
申请日:2018-09-29
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种肌电信号特征提取方法,首先对肌电信号作傅里叶变换取傅里叶系数,选取预设频段的傅里叶系数并归一化;构建堆叠自动编码器,设置每一层网络参数进行训练更新参数;构建堆叠的受限玻尔兹曼机,设置每一层网络参数进行训练更新参数;在预训练自动编码器和受限玻尔兹曼机完成后,将两部分预训练的参数前后连接起来,即自动编码器的输出为受限玻尔兹曼机的输入,形成一个贯通的网络,实现肌电信号特征提取,解决现有肌电信号提取方法时面临的时域特征变化大、频域特征提取不充分的问题。
-
公开(公告)号:CN109410917B
公开(公告)日:2021-11-16
申请号:CN201811123791.1
申请日:2018-09-26
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种基于改进型胶囊网络的语音数据分类方法,首先在训练阶段,构造胶囊网络的编码器,对初始语音音素数据进行编码得到初级胶囊;构造胶囊网络的动态路由结构,将初级胶囊中的信息传递给高级胶囊;以每个高级胶囊的长度的softmax激活值表征初始语音音素数据属于对应类别的概率;然后构造胶囊网络的解码器,将真实音素符号对应的高级胶囊进行解码重构;基于总损失函数对胶囊网络的参数进行优化;在测试阶段,将初始语音音素数据输入胶囊网络的编码器中,判断待测试数据的所属类别。本发明实现对语音音素的时序信号所对应的音速符号的精准识别,解决按照理论知识直接提取的特征准确度低、语音数据分类效果差以及过拟合的技术问题。
-
公开(公告)号:CN109256142A
公开(公告)日:2019-01-22
申请号:CN201811131244.8
申请日:2018-09-27
Applicant: 河海大学常州校区
IPC: G10L19/04
Abstract: 本发明公开了一种语音转换基于可扩展内核类网格法处理零散数据建模方法,语音数据根据时间间隔经过前期的预处理分帧,语音转换通过取源语音某一音色的多维数据与目标语音的对应一维数据进行映射拟合,源语音的多维数据和一维目标语音数据作为训练数据,经过高斯回归模型进行训练,高斯过程采取可扩展性内核,建立类似网格结构,从中设置合适数量代表点通过局部三次插值和反距离权重插值法来作结构性内核逼近,从而大大加快高斯回归模型快速拟合;本发明通过设置合适数量代表点作精确内核逼近得到近似内核,这样既降低高斯过程计算量,大幅减小数据训练时间,又不会降低回归预测精度,做到同时兼顾。
-
-
-
-
-
-