-
公开(公告)号:CN110085255A
公开(公告)日:2019-08-02
申请号:CN201910238348.7
申请日:2019-03-27
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种语音转换基于深度内核学习高斯过程回归建模方法,截取源语音音色特征的多维数据和目标语音特征多维数据其中一维数据的前三分之二作为训练数据,截取源语音音色特征多维数据的后三分之一数据作测试数据,经过高斯回归模型进行训练,首先将训练数据输入BP神经网络得到初始权重参数,高斯过程超参数不变时对权重参数求偏导,权重参数不变时对超参数求偏导,然后更新超参数以及用方向传播更新权重参数,再循环迭代出最佳结果。本发明提高了原有语音转换中高斯回归模型的精确度,为联合神经网络与高斯过程中的优势开发出更具表现力的深度内核和可扩展性的深层结构,将所有参数都经过统一监管一起训练,作为非参数化高斯过程框架的一部分,对高斯过程的扩展性和深度有进一步的突破。
-
公开(公告)号:CN105679333B
公开(公告)日:2019-04-12
申请号:CN201610123469.3
申请日:2016-03-03
Applicant: 河海大学常州校区
Abstract: 本发明涉及一种声带‑喉室‑声道联动的物理模型及精神压力检测方法,本物理模型包括:用于描述声带运动模式的机械方程组,用于描述沿声门深度方向及喉室、假声带和声道方向所对应压降分布的空气动力学方程组;本发明的建立声带‑喉室‑声道联动的物理模型,并且通过该物理模型设计生理参数估计算法,以便于研究在压力状态下发声的生理变异机制,提取出说话人压力状态下发声时的声带声道以及喉室等生理特征参数,建立从真实语音信号到生理特征的关系;根据估计出的生理参数,获得各发声器官及其中气流流态在压力变异因素影响下的变化特征,最终用以精神压力的检测,提高检测识别的精度与可靠性。
-
公开(公告)号:CN109256142A
公开(公告)日:2019-01-22
申请号:CN201811131244.8
申请日:2018-09-27
Applicant: 河海大学常州校区
IPC: G10L19/04
Abstract: 本发明公开了一种语音转换基于可扩展内核类网格法处理零散数据建模方法,语音数据根据时间间隔经过前期的预处理分帧,语音转换通过取源语音某一音色的多维数据与目标语音的对应一维数据进行映射拟合,源语音的多维数据和一维目标语音数据作为训练数据,经过高斯回归模型进行训练,高斯过程采取可扩展性内核,建立类似网格结构,从中设置合适数量代表点通过局部三次插值和反距离权重插值法来作结构性内核逼近,从而大大加快高斯回归模型快速拟合;本发明通过设置合适数量代表点作精确内核逼近得到近似内核,这样既降低高斯过程计算量,大幅减小数据训练时间,又不会降低回归预测精度,做到同时兼顾。
-
公开(公告)号:CN107231424A
公开(公告)日:2017-10-03
申请号:CN201710433520.5
申请日:2017-06-09
Applicant: 河海大学常州校区
Abstract: 本发明涉及一种用于增强动物与人主动互动的交互系统及工作方法,本交互系统包括:人体佩戴装置,佩戴于人体,且用于发送动物交互指令;以及动物佩戴装置,用于接收动物交互指令,以刺激动物作出相应行为反应;本发明的交互系统及工作方法以编码触觉或编码声音等方式提示动物主动发起交流,能够让动物准确的通过感知人体做出相应反应;动物佩戴装置含有图像采集单元、语音采集单元,借助本装置的智能信息处理能力,实现深入分析人的运动、语音和面部表情等,促进动物与人的深度交流,从而增强互动效果。
-
公开(公告)号:CN103886859B
公开(公告)日:2016-08-17
申请号:CN201410050758.6
申请日:2014-02-14
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种基于一对多码书映射的语音转换方法,对源语音码书与目标语音码书的一对多映射关系的建立,从平行数据库中随机提取一部分语音,对齐并提取声道参数后快速建立源与目标语音码书;估算用于训练的数据中源与目标特征参数对应于其各自码书的权重,通过统计与分析二者的关系来建立源与目标语音的权重映射关系,进而掌握个性特征的映射规则,实现高质量、快速的语音转换,能够解决实际环境中语音转换系统的实时性、转换后相似度的问题,最终在对语音转换实时性追求的过程中减小转换效果的代价,从而提高转换结果与目标语音的相似度,具有良好的应用前景。
-
公开(公告)号:CN105740846A
公开(公告)日:2016-07-06
申请号:CN201610117934.2
申请日:2016-03-02
Applicant: 河海大学常州校区
IPC: G06K9/00
CPC classification number: G06K9/00604 , G06K9/00255 , G06T3/40 , G06T15/005 , G06T2207/10004 , G06T2207/30041
Abstract: 本发明公开了一种基于深度相机的水平视角估计及校准方法,采用Kinect深度相机捕捉人脸部2D图像和估计头部姿势;在2D图像中定位最佳瞳孔中心点,得到最佳瞳孔中心点的2D坐标;利用Kinect深度相机的固有参数,将步骤二得到的最佳瞳孔中心点的2D坐标转换到Kinect深度相机的3D坐标系中,得到最佳瞳孔中心点的3D坐标;利用3D眼球模型,估计水平视线角度;设计实验系统,校准得到的视线角度。本发明方法操作简便、实时性好、成本低廉、对测试者头部无约束且精度高。
-
公开(公告)号:CN103142214B
公开(公告)日:2015-12-23
申请号:CN201310054531.4
申请日:2013-02-21
Applicant: 河海大学常州校区
IPC: A61B5/00 , A61B5/0402 , A61B5/0205
Abstract: 本发明公开了一种间接测量动物能量代谢率的装置与方法,装置包括心电采集部分、地理定位部分和主控部分;心电采集部分包括:心电采集电极,用于采集动物的心电信号;心电信号放大器;低通滤波器;带阻滤波器;AD转换器;地理定位部分包括定位模块;主控部分包括:数据记录模块;USB接口模块;蓝牙模块;人机交互模块;控制器模块。本发明提供的间接测量动物能量代谢率的装置与方法,能够测量心率,并同时记录运动轨迹和速度的装置,最后通过无线方式把数据传给计算机供科研人员分析,为研究动物个体或群体的飞行或迁移中能量代谢率、能量代谢率与运动轨迹、运动速度的关系等提供了一种工具。
-
公开(公告)号:CN102968988B
公开(公告)日:2015-09-16
申请号:CN201210488131.X
申请日:2012-11-27
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种训练数据匮乏下的鲁棒性语音转换方法,利用经验模式分解算法分析平行参数序列,挖掘源与目标个性特征相关的表征信息,并结合高斯过程模型设计并训练转换函数,压缩冗余信息,提高数据匮乏条件下的系统鲁棒性。本发明提供的训练数据匮乏下的鲁棒性语音转换方法,将高斯过程建模和经验模式分解的参数特征化方法应用在语音转换模型中,可以描述和刻画局部数据中体现的共性特征,提高转换算法在训练数据匮乏条件下的泛化性;同时,该方法进一步强化特征模式之间的区分度,提高转换算法在训练数据匮乏情况下的精确度。
-
公开(公告)号:CN103109755A
公开(公告)日:2013-05-22
申请号:CN201310055336.3
申请日:2013-02-21
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种自然环境中动物的视觉调控和运动追踪的装置及方法,该装置遮挡动物(被监测对象)的眼睛调节动物视觉的可见程度,使动物产生不同程度的视觉障碍,能够自动开启或撤销视觉障碍,记录动物在视觉障碍下的运动轨迹以及记录在动物无视觉障碍下运动的轨迹,分析行为响应。本发明为在自然环境中动物自由活动状态下研究视觉环境感知与行为调控,提供一种实验工具与方法。
-
公开(公告)号:CN103035236A
公开(公告)日:2013-04-10
申请号:CN201210490464.6
申请日:2012-11-27
Applicant: 河海大学常州校区
Abstract: 本发明公开了一种基于信号时序特征建模的高质量语音转换方法,针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果。本发明提供的基于信号时序特征的高质量语音转换方法,充分利用了语音信号参数间的强烈相关性,通过模拟参数随时间变化的物理过程,构造了一种新型的混合式卡尔曼滤波器,并将其用于语音转换的参数映射过程,设计了一套特殊的、将卡尔曼滤波器参数与语音信号物理属性相关联的转换算法,实现说话人个性特征的变换。
-
-
-
-
-
-
-
-
-