同时优化深度表征学习与说话人类别估计的说话人聚类方法

    公开(公告)号:CN111161744B

    公开(公告)日:2023-04-28

    申请号:CN201911239006.3

    申请日:2019-12-06

    Abstract: 本发明公开了一种同时优化深度表征学习与说话人类别估计的说话人聚类方法,步骤如下:对聚类语音样本进行预处理,提取I‑vector特征,训练卷积自编码网络并提取深度表征特征;根据深度表征特征构造初始类,得到类别数和初始类标签;在卷积自编码网络的编码器输出层增加一个全连接层和一个Softmax层构成联合优化框架,Softmax层用于估计说话人类别;将卷积自编码网络的重构误差与Softmax层的说话人类别估计交叉熵误差之和作为目标函数,迭代更新联合优化框架参数直到满足收敛条件,得到各说话人的语音样本。本发明能同时得到优化的深度表征特征与说话人聚类结果,获得比传统方法更优的说话人聚类效果。

    一种改善玻璃材料在5G毫米波频段斜入射特性的结构

    公开(公告)号:CN111129780A

    公开(公告)日:2020-05-08

    申请号:CN201911384962.0

    申请日:2019-12-28

    Abstract: 本发明公开了一种改善玻璃材料在5G毫米波频段斜入射特性的结构.所述结构包括透明材料薄膜层和玻璃层;所述透明材料薄膜层包括第一电路层、透明介质层和第二电路层,第一电路层和第二电路层分别印刷在透明介质层的上表面和下表面,玻璃层位于第二电路层下方。本发明通过在玻璃上粘贴表面带有电路的透明薄膜,可以增强玻璃在5G通讯毫米波通信频段的斜入射透射性能,并且还能阻挡传输频带外的入射电磁波,实现空间滤波功能。本发明有以下几个优点:透光性好,薄膜和电路均做了透明化处理,减少对玻璃透光性能的影响;使用简单,将设计好的薄膜粘贴在玻璃上,操作方便;损耗小,一般使用低损耗的材料制成薄膜,减少在介质中的损耗。

    一种基于可见光室内定位的CDMA编码方法

    公开(公告)号:CN106130602B

    公开(公告)日:2019-10-18

    申请号:CN201610698466.2

    申请日:2016-08-20

    Abstract: 本发明公开了一种基于可见光室内定位的CDMA编码方法。本发明在室内可见光定位系统中由于存在多个LED,各LED之间由于会产生码间干扰而严重影响定位的精确度。直接序列码分多址调制通过利用扩频码的正交性,实现在时域和频域均重叠的信号分离,进而实现了码分复用,解决了VLC定位系统中由于存在多个参考点而导致码间干扰的问题。比起传统的可见光通信定位技术不仅大大提高了定位的精度,而且系统简单且不需要同步发射,大大提高了系统的性能。具有广阔的应用前景。

    一种基于CDMA调制的RSS三角定位迭代方法及系统

    公开(公告)号:CN106209235A

    公开(公告)日:2016-12-07

    申请号:CN201610698106.2

    申请日:2016-08-20

    Abstract: 本发明公开了一种基于CDMA调制的RSS三角定位迭代方法及系统。由于传统的可见光通信定位系统中存在多个定位参考点光源,而不同参考点光源所发出的ID信息在时域与频域上均是重叠的,且会由于多径效应等影响导致码间干扰,进而大大限制了VLC定位系统的精度。为此,本发明提出一种基于CDMA调制的RSS三角定位迭代方法,通过利用扩频码的正交性,可恢复出各LED光源的信息以及对应光信号的衰减,根据ID信息和其衰减大小,利用RSS三角定位迭代方法实现接收三维位置坐标的确定。所提出的定位算法具有良好的定位精度,系统简单且可以实现异步定位,具有广阔的应用前景。

    用于可见光通信的PAM与MPPM双重调制方法及系统

    公开(公告)号:CN106130638A

    公开(公告)日:2016-11-16

    申请号:CN201610697975.3

    申请日:2016-08-20

    CPC classification number: H04B10/116 H03K7/02 H03K7/04

    Abstract: 本发明公开了用于可见光通信的PAM与MPPM双重调制方法及系统。系统包括发射子系统、传输子系统和接收子系统,所述发射子系统包括第一可编程门阵列、PAM调制模块、MPPM调制模块、LED驱动电路和LED灯具;所述传输子系统用于把LED灯具发出的可见光信号传输给光电检测器件;所述接收子系统包括第一光电检测器件、第二光电检测器件、MPPM解调模块、PAM解调模块、数据合并器和第二可编程门阵列。本发明在不增加LED带宽情况下,成倍提高通信的质量与数据传输效率。

    一种基于CDMA调制的RSS/AOA三维定位方法

    公开(公告)号:CN106125046A

    公开(公告)日:2016-11-16

    申请号:CN201610697974.9

    申请日:2016-08-20

    CPC classification number: G01S5/16 G01C21/206

    Abstract: 本发明公开一种基于CDMA调制的RSS/AOA三维定位方法。本发明基于CDMA调制技术,使用RSS/AOA三维定位方法,通过利用CDMA调制技术对LED灯具发射的带有LED灯具ID信息的光信号进行编码,由于CDMA扩频编码具有正交性,能在接收端分辨出LED所发出的ID信息以及信号功率大小。通过ID信息来确定接收端的位置区域;通过接收到的光信号的信号功率大小粗略估算接收端的位置;通过测量接收端与LED灯具之间的方位角与仰角,对接收端的位置进行一个比较精确的计算。本发明的三维定位方法中,CDMA调制技术很好地解决了由于多径效应和多个参考点相互干扰所导致的定位精度下降的问题。在相同基础设施条件下,能够在满足照明需求的同时,也能提供精度相对较高的定位服务,具有广阔的应用前景。

    一种基于孪生神经网络的短语音说话人匹配方法

    公开(公告)号:CN112951242B

    公开(公告)日:2022-10-25

    申请号:CN202110140928.X

    申请日:2021-02-02

    Abstract: 本发明公开了一种基于孪生神经网络的短语音说话人匹配方法,步骤如下:构造训练样本对;从各样本提取对数梅尔能量谱特征;搭建孪生神经网络,包括依次连接的空洞循环卷积子网络、说话人表征层和Sigmoid输出模块;将从各训练样本对提取的对数梅尔能量谱特征输入空洞循环卷积子网络以得到样本对的两个说话人表征矢量;拼接样本对的两个说话人表征矢量并输入Sigmoid输出模块,训练孪生神经网络;采用经训练的孪生神经网络判断输入的两段短语音是否属于同一个说话人,得到说话人匹配结果。本方法引入空洞循环卷积子网络使孪生神经网络获得更大的感受野,并利用语音样本前后帧之间的说话人信息,获得更好的说话人匹配结果。

    基于通道注意力深度可分卷积网络的小样本话者辨认方法

    公开(公告)号:CN113823292A

    公开(公告)日:2021-12-21

    申请号:CN202110954659.0

    申请日:2021-08-19

    Abstract: 本发明公开了一种基于通道注意力深度可分卷积网络的小样本话者辨认方法,步骤如下:从训练语音提取对数梅尔谱特征,训练得到通道注意力深度可分卷积网络;将注册(小样本)语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算所有注册语音的深度特征均值矢量并作为对应话者的中心矢量;将测试语音的对数梅尔谱特征输入已训练网络,得到它们的深度特征,计算测试语音深度特征与注册语音各话者中心矢量之间的距离,距离最小的中心矢量所对应的话者即为测试语音所属话者。本发明方法既减小了网络规模又降低了网络训练难度,有效缓解小样本话者辨认的过拟合问题,获得更满意话者辨认结果。

    一种改善玻璃材料在5G毫米波频段斜入射特性的结构

    公开(公告)号:CN111129780B

    公开(公告)日:2021-11-23

    申请号:CN201911384962.0

    申请日:2019-12-28

    Abstract: 本发明公开了一种改善玻璃材料在5G毫米波频段斜入射特性的结构.所述结构包括透明材料薄膜层和玻璃层;所述透明材料薄膜层包括第一电路层、透明介质层和第二电路层,第一电路层和第二电路层分别印刷在透明介质层的上表面和下表面,玻璃层位于第二电路层下方。本发明通过在玻璃上粘贴表面带有电路的透明薄膜,可以增强玻璃在5G通讯毫米波通信频段的斜入射透射性能,并且还能阻挡传输频带外的入射电磁波,实现空间滤波功能。本发明有以下几个优点:透光性好,薄膜和电路均做了透明化处理,减少对玻璃透光性能的影响;使用简单,将设计好的薄膜粘贴在玻璃上,操作方便;损耗小,一般使用低损耗的材料制成薄膜,减少在介质中的损耗。

    一种基于孪生神经网络的短语音说话人匹配方法

    公开(公告)号:CN112951242A

    公开(公告)日:2021-06-11

    申请号:CN202110140928.X

    申请日:2021-02-02

    Abstract: 本发明公开了一种基于孪生神经网络的短语音说话人匹配方法,步骤如下:构造训练样本对;从各样本提取对数梅尔能量谱特征;搭建孪生神经网络,包括依次连接的空洞循环卷积子网络、说话人表征层和Sigmoid输出模块;将从各训练样本对提取的对数梅尔能量谱特征输入空洞循环卷积子网络以得到样本对的两个说话人表征矢量;拼接样本对的两个说话人表征矢量并输入Sigmoid输出模块,训练孪生神经网络;采用经训练的孪生神经网络判断输入的两段短语音是否属于同一个说话人,得到说话人匹配结果。本方法引入空洞循环卷积子网络使孪生神经网络获得更大的感受野,并利用语音样本前后帧之间的说话人信息,获得更好的说话人匹配结果。

Patent Agency Ranking