基于改进型胶囊网络的语音数据分类方法

    公开(公告)号:CN109410917A

    公开(公告)日:2019-03-01

    申请号:CN201811123791.1

    申请日:2018-09-26

    Abstract: 本发明公开了一种基于改进型胶囊网络的语音数据分类方法,首先在训练阶段,构造胶囊网络的编码器,对初始语音音素数据进行编码得到初级胶囊;构造胶囊网络的动态路由结构,将初级胶囊中的信息传递给高级胶囊;以每个高级胶囊的长度的softmax激活值表征初始语音音素数据属于对应类别的概率;然后构造胶囊网络的解码器,将真实音素符号对应的高级胶囊进行解码重构;基于总损失函数对胶囊网络的参数进行优化;在测试阶段,将初始语音音素数据输入胶囊网络的编码器中,判断待测试数据的所属类别。本发明实现对语音音素的时序信号所对应的音速符号的精准识别,解决按照理论知识直接提取的特征准确度低、语音数据分类效果差以及过拟合的技术问题。

    一种基于变分高斯回归过程的语音数据处理方法

    公开(公告)号:CN108206024A

    公开(公告)日:2018-06-26

    申请号:CN201711474721.6

    申请日:2017-12-29

    Abstract: 本发明公开了一种基于变分高斯回归过程的语音数据处理方法,基于变分高斯回归过程模型进行语音数据处理,所述变分高斯回归过程模型在VFE近似基础上,对对数似然函数进行变换,使得求出的最终下限变大,求出活动点集的自由变分高斯分布,自由变分高斯分布为映射近似中所需要的选取点的后验分布,按映射近似的方法来对语音数据进行处理。本发明提高计算的效率,对于最后求出的下限最大值中的部分项作出近似,在尽量减小相似性的损失的同时,使得计算效率能够大大提升。

    语音数据基于分簇聚类的分块高斯回归模型子集建模方法

    公开(公告)号:CN107808673A

    公开(公告)日:2018-03-16

    申请号:CN201711114782.1

    申请日:2017-11-13

    Inventor: 缪晓宇 徐宁 王平

    Abstract: 本发明公开了一种语音数据基于分簇聚类的分块高斯回归模型子集建模方法,语音数据按时间间隔分帧,对每一帧数据进行特征提取,每一帧提取出来的高维数据降到三维后,进行分块高斯回归模型建模;所述分块高斯回归模型为基于子集法的高斯回归过程模型,在训练数据集中,按照贪婪算法选取出若干代表原训练数据集的点构成子集,将携带冗余信息的数据点剔除掉,本发明根据具体的测试点来调整所选取的子集,并且通过分簇聚类后,选取的子集来自各个不同的簇,能够代表整个数据集,这样选取的子集既能保证是最接近测试点的一部分局部最优点,同时兼顾全局。

    基于稀疏编码和理想二进制掩膜相结合的语音增强方法

    公开(公告)号:CN104240717B

    公开(公告)日:2017-04-26

    申请号:CN201410476932.3

    申请日:2014-09-17

    Abstract: 本发明公开了一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法,其是针对于传统的理想二进制掩膜算法存在噪声残留和语音成分丢失的缺陷进行改进的算法。本发明首先利用短时傅里叶变换将时域语音信号转换到频域信号,在频域中,采用理想二进制掩膜方法对语音信号进行初步降噪处理;然后采用稀疏编码理论对初步降噪后的语音信号做进一步降噪处理,同时从被认为是干扰信号中提取有效的语音成分,从而达到语音增强的效果。与相关技术相比,本发明具有去噪性能好,语音的可理解性高等优点。

    一种基于移动智能终端的蓝牙门锁控制装置及其管理方法

    公开(公告)号:CN104794798A

    公开(公告)日:2015-07-22

    申请号:CN201510238188.8

    申请日:2015-05-11

    Abstract: 本发明公开了一种基于移动智能终端的蓝牙门锁控制装置及其管理方法,其中装置包括微控制器模块、RTC实时时钟模块、数据记录模块、蓝牙模块、移动智能终端应用软件模块以及门锁控制电路。本发明所达到的有益效果:本装置采用蓝牙密码(密码配对成功才能建立连接)、指令识别及密码认证(指令正确并且密码正确才能操作门锁)和身份识别(通过身份验证后指令才有效)这三级验证方式,只有通过验证之后才能操作门锁,提高了安全性。在管理上,本装置采用的方法也极为简单,通过管理员的操作完成对整个门锁系统的控制,极大地简化了用户的操作。

    一种下肢自适应悬吊支架
    17.
    发明公开

    公开(公告)号:CN104739617A

    公开(公告)日:2015-07-01

    申请号:CN201510177961.4

    申请日:2015-04-16

    Abstract: 本发明公开了一种下肢自适应悬吊支架,包括:带动训练者下肢运动的支架,连接于支架并控制支架运动的控制装置,连接于支架和控制装置的驱动件;支架包括:底座,置于底座上并用于抬起训练者下肢的支架托臂,连接于支架托臂的悬吊组件,连接两个支架托臂之间与连接上述支架托臂与悬吊组件之间的旋转件。本发明提供一种下肢自适应悬吊支架;本悬吊支架通过检测吊带上的拉力,分析人在最舒适时绳上拉力应有的方向和大小,并计算出适合的拉力;支架中部包含人机交互模块,通过人机交互模块自动分析得出适合每个人各自的数据,装置可以适时调整,及时做出相应的反应;若训练者调节超出调整范围,本支架会发出声音提醒使用者,并再进行细微的调节;从而为患者提供便捷的康复训练,促进康复进程。

    一种基于混合高斯随机过程的分簇语音转换方法及系统

    公开(公告)号:CN104464744A

    公开(公告)日:2015-03-25

    申请号:CN201410662811.8

    申请日:2014-11-19

    Abstract: 本发明涉及一种基于混合高斯随机过程的分簇语音转换方法及系统,本分簇语音转换方法包括:步骤S100,训练阶段,即将源、目标语音数据分别进行特征参数提取后进行训练;以及步骤S200,转换阶段,即将再次提取的源的特征参数与训练结果进行转换,并合成得到重构的语音数据;本分簇语音转换方案适用于大数据量环境下,即数据之间具有很强的关联性和重叠性;就中文语音而言,表面变化丰富的语音下,其本质构成的语音元数据是有限的;因此,通过建立具有混合结构的语音转换方法,可以对语音数据进行分簇建模,从而充分利用大数据,提高系统性能。

    基于对位和声关系的LSTM多轨音乐生成方法

    公开(公告)号:CN112017621B

    公开(公告)日:2024-05-28

    申请号:CN202010772227.3

    申请日:2020-08-04

    Abstract: 本发明公开了基于对位和声关系的LSTM多轨音乐生成方法,包括如下步骤:S1,构建音频MIDI数据集,S2,提取MIDI文件中的主旋律与和声旋律,并且构建对位关系矩阵。S3,利用主旋律训练生成旋律的长短期神经网络,并用对位关系矩阵训练生成和声的长短期神经网络。通过两条网络分别生成多条旋律,合成为多轨音乐。本发明在音频MIDI数据集的基础上,实现了带有和声的复杂音乐旋律的生成,打破了传统基于和弦编曲的固定套路,为乐曲创作提供了一种新的方法。

Patent Agency Ranking