一种基于随机点立体图的立体视觉测试方法

    公开(公告)号:CN113425243B

    公开(公告)日:2022-08-23

    申请号:CN202110285621.9

    申请日:2021-03-17

    Abstract: 本发明公开了一种基于随机点立体图的立体视觉测试方法,包括以下步骤:S1、根据现有数据,确定立体图像的立体视锐度区间和立体视锐度最小步长;S2、确定立体视锐度区间和最小步长,计算随机点立体图应具有的视差,再将视差人眼感知到的深度)转换成图像平移的距离,最后生成具有此视差的随机点立体图;S3、采用时分3D显示技术和自适应阶梯方法,设计立体视觉测试方案;S4、基于S3设计的立体视觉测试方案进行测试,根据测试者对相应立体视锐度等级立体图像的反馈来度量测试者的立体视觉。本发明能够快速,准确地测量人体的立体视觉,同时扩大了立体视觉的可测量范围、以及准确性,可用于检测测试者在一段时间的立体视觉变化。

    基于工业机器视觉的AOI字符缺陷检测方法和装置

    公开(公告)号:CN111474184B

    公开(公告)日:2022-08-16

    申请号:CN202010306399.1

    申请日:2020-04-17

    Abstract: 本发明公开一种可基于工业机器视觉实现的AOI字符缺陷检测方法,包括:获取待检测图像;对待检测图像进行预处理,得到位置已校正的、含字符的感兴趣区域图像;对待检测图像的感兴趣区域图像进行分离,得到字符区域图像;将待检测图像的字符区域图像与预先创建的基准图像模板进行模板匹配,得到模板匹配结果;根据模板匹配结果判断待检测图像是否存在字符缺陷;输出字符缺陷判断结果。本发明利用模板匹配可实现在低像素灰度图情况下ROI区域缺陷的检测,提高了检测效率和准确率,降低检测人工成本。

    一种基于网络剪枝的CNN人脸表情识别显著性分析方法

    公开(公告)号:CN111507224A

    公开(公告)日:2020-08-07

    申请号:CN202010273344.5

    申请日:2020-04-09

    Abstract: 本发明公开了一种基于网络剪枝的CNN人脸表情识别显著性分析方法,包括:S1将人脸数据按表情归类并分别训练识别网络;S2利用剪枝算法分别处理每个训练好的识别网络,得到选定卷积层各滤波器的重要性分数;S3根据选定卷积层剪枝之后计算出的各滤波器的重要性分数,计算该层的特征图权重。本发明在特定表情训练网络的基础上,利用剪枝算法找到对表情识别贡献大的特征并赋上对应权重,解决基于注意力机制的表情识别中重要特征的显著性分析问题,提高识别准确率、完成表情识别的相关操作。

    基于工业机器视觉的AOI字符缺陷检测方法和装置

    公开(公告)号:CN111474184A

    公开(公告)日:2020-07-31

    申请号:CN202010306399.1

    申请日:2020-04-17

    Abstract: 本发明公开一种可基于工业机器视觉实现的AOI字符缺陷检测方法,包括:获取待检测图像;对待检测图像进行预处理,得到位置已校正的、含字符的感兴趣区域图像;对待检测图像的感兴趣区域图像进行分离,得到字符区域图像;将待检测图像的字符区域图像与预先创建的基准图像模板进行模板匹配,得到模板匹配结果;根据模板匹配结果判断待检测图像是否存在字符缺陷;输出字符缺陷判断结果。本发明利用模板匹配可实现在低像素灰度图情况下ROI区域缺陷的检测,提高了检测效率和准确率,降低检测人工成本。

    声带-喉室-声道联动的物理模型及精神压力检测方法

    公开(公告)号:CN105679333A

    公开(公告)日:2016-06-15

    申请号:CN201610123469.3

    申请日:2016-03-03

    CPC classification number: G10L25/51 A61B5/165 A61B5/4884 G10L25/63

    Abstract: 本发明涉及一种声带-喉室-声道联动的物理模型及精神压力检测方法,本物理模型包括:用于描述声带运动模式的机械方程组,用于描述沿声门深度方向及喉室、假声带和声道方向所对应压降分布的空气动力学方程组;本发明的建立声带-喉室-声道联动的物理模型,并且通过该物理模型设计生理参数估计算法,以便于研究在压力状态下发声的生理变异机制,提取出说话人压力状态下发声时的声带声道以及喉室等生理特征参数,建立从真实语音信号到生理特征的关系;根据估计出的生理参数,获得各发声器官及其中气流流态在压力变异因素影响下的变化特征,最终用以精神压力的检测,提高检测识别的精度与可靠性。

    基于两步排列熵的语音活动检测方法

    公开(公告)号:CN105185386A

    公开(公告)日:2015-12-23

    申请号:CN201510629748.2

    申请日:2015-09-28

    Abstract: 本发明公开了一种基于两步排列熵的语音活动检测方法,其特征是,具体包括如下步骤:(1)对语音信号进行分帧处理,得到各帧语音信号;(2)计算各帧语音信号的短时能量;(3)各帧语音信号进行第一步排列熵计算;(4)通过短时能量和排列熵,作第一步判断,检测噪声和语音信号;(5)对检测出的语音信号进行第二步排列熵计算;(6)判断语音信号的清浊音。本发明所达到的有益效果:充分利用了语音信号帧数之间的准周期性,利用排列熵作为语音信号复杂度的度量标准,实现语音活动检测的目的。

    基于信号时序特征建模的高质量语音转换方法

    公开(公告)号:CN103035236B

    公开(公告)日:2014-12-17

    申请号:CN201210490464.6

    申请日:2012-11-27

    Abstract: 本发明公开了一种基于信号时序特征建模的高质量语音转换方法,针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果。本发明提供的基于信号时序特征的高质量语音转换方法,充分利用了语音信号参数间的强烈相关性,通过模拟参数随时间变化的物理过程,构造了一种新型的混合式卡尔曼滤波器,并将其用于语音转换的参数映射过程,设计了一套特殊的、将卡尔曼滤波器参数与语音信号物理属性相关联的转换算法,实现说话人个性特征的变换。

    基于双向格子结构的长短时记忆网络的中文语义信息提取方法和装置

    公开(公告)号:CN111444726B

    公开(公告)日:2024-02-09

    申请号:CN202010228609.X

    申请日:2020-03-27

    Abstract: 本发明公开一种语义信息提取方法和装置,属于自然语言处理技术领域,方法包括:获取待识别的语料数据;对获取到的语料数据进行预处理,预处理包括将语料数据转换为词向量和/或字向量;将向量转换后的语料信息输入至预先训练的语义信息提取模型,得到命名实体识别结果;所述语义信息提取模型包括双向长短时记忆网络和CRF层网络,其训练样本为已标注字符标签和实体标签的语料数据的向量形式;双向长短时记忆网络的输出为待识别语句中各词中字符映射到标签的概率矩阵,CRF层网络根据双向长短时记忆网络的输出,确定待识别语句的标签序列并输出。本发明通过将格子结构的长短时记忆网络改进为双向,使其能够更好的获知文章中一个句子前后文的信息,从而更准确地判断这个句子的语义。

    基于共享控制门结构的中文文本校正方法

    公开(公告)号:CN111079416B

    公开(公告)日:2024-02-02

    申请号:CN201911220212.X

    申请日:2019-12-03

    Abstract: 本发明公开了一种基于共享控制门结构的中文文本校正方法,通过改进优化循环神经网络,进行更快速准确的序列到序列转换,进而实现中文文本校正。该方法包括数据预处理,引入先验知识,共享控制门结构,采用注意力机制,维比特搜索,文本校正五个部分。本发明提供的基于共享控制门结构的中文文本校正方法,充分利用了循环神经网络对序列的记忆功能,在此基础上采用共享控制门改进,从而极大减少向量计算,准确率相应得到提升,实现高效的中文文本校正。

Patent Agency Ranking