Patent search ap:("湖北经济学院") AND inv:"李思涵" Page 1

1.

发明授权
一种声音识别及定位的方法和装置有权

公开(公告)号：CN118884350B

公开(公告)日：2024-12-03

申请号：CN202411345733.9

申请日：2024-09-26

Applicant: 湖北经济学院 , 达昌技术发展有限公司

Inventor： 彭瑞卿 , 邓乾 , 刘文平 , 罗康力 , 谢毅炜 , 李思涵 , 姜昀哲 , 杨凌晨 , 黄泽亮 , 黄雪珊

IPC: G01S5/30 , G01S5/26 , G10L19/06 , G06N3/048

Abstract: 本发明涉及声音定位技术领域，提供了一种声音识别及定位的方法和装置。本发明提取至少三个音频数据的FBank特征和LPC特征，据此生成音频数据的多模型拼接特征，并对其中与声源类别和声源距离相关的模式进行建模，得到联合特征表示，进而分别实现对音频数据所属的声源类别和声源距离的预测；最后根据至少三个音频数据的声源类别和声源距离，构建至少三个三维音频球体，将构建的多个三维音频球体的交点确定为用户设备的位置；本发明定位准确度较高，解决了现有技术的声源定位方案存在的定位精度低和计算成本高的问题。

2.

发明公开
一种声音识别及定位的方法和装置有权

公开(公告)号：CN118884350A

公开(公告)日：2024-11-01

申请号：CN202411345733.9

申请日：2024-09-26

Applicant: 湖北经济学院 , 达昌技术发展有限公司

Inventor： 彭瑞卿 , 邓乾 , 刘文平 , 罗康力 , 谢毅炜 , 李思涵 , 姜昀哲 , 杨凌晨 , 黄泽亮 , 黄雪珊

IPC: G01S5/30 , G01S5/26 , G10L19/06 , G06N3/048

Abstract: 本发明涉及声音定位技术领域，提供了一种声音识别及定位的方法和装置。本发明提取至少三个音频数据的FBank特征和LPC特征，据此生成音频数据的多模型拼接特征，并对其中与声源类别和声源距离相关的模式进行建模，得到联合特征表示，进而分别实现对音频数据所属的声源类别和声源距离的预测；最后根据至少三个音频数据的声源类别和声源距离，构建至少三个三维音频球体，将构建的多个三维音频球体的交点确定为用户设备的位置；本发明定位准确度较高，解决了现有技术的声源定位方案存在的定位精度低和计算成本高的问题。

3.

发明授权
一种LED灯的识别方法、装置、电子设备及存储介质有权转让

公开(公告)号：CN117475359B

公开(公告)日：2024-08-06

申请号：CN202311816144.X

申请日：2023-12-27

Applicant: 湖北经济学院 , 达昌技术发展有限公司

Inventor： 贾玉福 , 刘文平 , 刘振江 , 金培强 , 熊佩雯 , 李思涵 , 谢潇

IPC: G06V20/40 , G06V10/28 , G06V10/764 , G06T7/70

Abstract: 本发明提供一种LED灯的识别方法、装置、电子设备及存储介质，属于室内定位导航技术领域，所述方法包括：在LED照明环境下，通过CMOS相机获取背景帧和样条帧；通过比较背景帧和样条帧，确定样条帧中暗样条纹的目标条数；基于预设对应关系和目标条数，确定目标条数对应的目标开关频率，目标开关频率用于标识LED灯。通过确定目标条数对应的目标开关频率以及确定具有该目标开关频率的目标LED灯，能够确定CMOS相机的当前位置位于目标LED灯附近，能够高效地利用LED灯进行室内定位，再辅助其他定位技术能够实现移动终端的精确定位。

4.

发明授权
一种基于多模态图像融合技术的车辆定位和识别方法有权

公开(公告)号：CN117975383B

公开(公告)日：2024-06-21

申请号：CN202410387616.2

申请日：2024-04-01

Applicant: 湖北经济学院

Inventor： 邓乾 , 刘文平 , 李思涵 , 杨凌晨 , 刘行军

IPC: G06V20/54 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094

Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法，包括：获取目标车辆在当前环境下红外图像和对应的可见光图像；判断当前环境是否为暗光环境，若为暗光环境，则将红外图像和可见光图像输入至融合生成模型，获得融合生成模型输出的增强可见光图像，否则，将可见光图像作为增强可见光图像；将红外图像和增强可见光图像输入至车辆检测模型，获得车辆检测模型输出的目标车辆的位置和型号；车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请，实现了对目标车辆的被动定位和车型识别，保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

5.

发明授权
基于深度学习的LED光源识别方法、装置、设备及介质有权

公开(公告)号：CN117611929B

公开(公告)日：2024-04-23

申请号：CN202410088953.1

申请日：2024-01-23

Applicant: 湖北经济学院

Inventor： 李思涵 , 刘文平 , 贾玉福 , 邓乾 , 刘振江 , 李明磊 , 李亚敏

IPC: G06V10/764 , G06V10/74 , G06V10/82 , G06V10/25

Abstract: 本发明提供一种基于深度学习的LED光源识别方法、装置、设备及介质，属于室内定位导航技术领域，所述方法包括：在LED照明环境下，通过CMOS相机获取样条帧，样条帧为具有暗样条纹的图像；输入样条帧至目标检测模型，获取目标检测模型输出的暗样条纹检测结果；对多个矩形框进行预处理以及基于各个预处理后矩形框对应的预测分类，确定样条帧的图像特征编码序列；将图像特征编码序列与各个LED光源对应的光源特征编码序列进行比对，确定与样条帧最匹配的光源特征编码序列。光源特征编码序列能够用于标识LED光源，因而能够确定CMOS相机的当前位置位于最匹配的光源特征编码序列所标识LED光源的附近，高效地进行室内定位。

6.

发明授权
一种面向相机光通信的条纹图像处理方法、装置及设备有权

公开(公告)号：CN118298194B

公开(公告)日：2024-08-02

申请号：CN202410725911.4

申请日：2024-06-06

Applicant: 湖北经济学院 , 达昌技术发展有限公司

Inventor： 邓乾 , 刘文平 , 李思涵 , 付国强 , 黄泽亮

IPC: G06V10/54 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/09 , G06N3/094

Abstract: 本申请属于可见光通信领域，具体公开了一种面向相机光通信的条纹图像处理方法、装置及设备，该方法包括：获取条纹图像数据集，条纹图像数据集包括条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签；基于条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签，训练生成对抗网络，获取图像重建模型和条纹提取模型；图像重建模型作为生成对抗网络的生成器，条纹提取模型作为生成对抗网络的判别器。通过本申请，利用GAN将两种矛盾性质的任务进行生成对抗，能够有效地均衡图像重建准确度和条纹提取准确度，获得适用于可见光通信场景的图像重建模型和条纹提取模型。

7.

发明授权
一种基于非调制声音信号的定位方法及装置有权

公开(公告)号：CN118016102B

公开(公告)日：2024-07-16

申请号：CN202410410974.0

申请日：2024-04-08

Applicant: 湖北经济学院

Inventor： 邓乾 , 刘文平 , 杨洋 , 申志飞 , 李思涵 , 杨凌晨

IPC: G10L25/51 , G06N3/0442 , G06N3/08 , G10L25/30 , G10L25/24 , G10L21/0272 , G01S5/22

Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置，属于语音识别技术领域，其中方法包括：通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离，获得至少两组分离音频；使用librosa库将分离音频转换为MFCC特征向量；将MFCC特征向量输入至预训练好的BiLSTM模型，获取分离音频的音频类别；将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型，获取输入MFCC特征向量对应的分离音频的音频距离；基于各个分离音频的音频类别和音频距离，确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

8.

发明公开
一种面向相机光通信的条纹图像处理方法、装置及设备有权

公开(公告)号：CN118298194A

公开(公告)日：2024-07-05

申请号：CN202410725911.4

申请日：2024-06-06

Applicant: 湖北经济学院 , 达昌技术发展有限公司

Inventor： 邓乾 , 刘文平 , 李思涵 , 付国强 , 黄泽亮

IPC: G06V10/54 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0475 , G06N3/09 , G06N3/094

Abstract: 本申请属于可见光通信领域，具体公开了一种面向相机光通信的条纹图像处理方法、装置及设备，该方法包括：获取条纹图像数据集，条纹图像数据集包括条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签；基于条纹图像样本和条纹图像样本对应的条纹序列标签以及无条纹图像标签，训练生成对抗网络，获取图像重建模型和条纹提取模型；图像重建模型作为生成对抗网络的生成器，条纹提取模型作为生成对抗网络的判别器。通过本申请，利用GAN将两种矛盾性质的任务进行生成对抗，能够有效地均衡图像重建准确度和条纹提取准确度，获得适用于可见光通信场景的图像重建模型和条纹提取模型。

9.

发明公开
一种基于非调制声音信号的定位方法及装置有权

公开(公告)号：CN118016102A

公开(公告)日：2024-05-10

申请号：CN202410410974.0

申请日：2024-04-08

Applicant: 湖北经济学院

Inventor： 邓乾 , 刘文平 , 杨洋 , 申志飞 , 李思涵 , 杨凌晨

IPC: G10L25/51 , G06N3/0442 , G06N3/08 , G10L25/30 , G10L25/24 , G10L21/0272 , G01S5/22

Abstract: 本申请实施例提供一种基于非调制声音信号的定位方法及装置，属于语音识别技术领域，其中方法包括：通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离，获得至少两组分离音频；使用librosa库将分离音频转换为MFCC特征向量；将MFCC特征向量输入至预训练好的BiLSTM模型，获取分离音频的音频类别；将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型，获取输入MFCC特征向量对应的分离音频的音频距离；基于各个分离音频的音频类别和音频距离，确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

10.

发明公开
一种基于多模态图像融合技术的车辆定位和识别方法有权

公开(公告)号：CN117975383A

公开(公告)日：2024-05-03

申请号：CN202410387616.2

申请日：2024-04-01

Applicant: 湖北经济学院

Inventor： 邓乾 , 刘文平 , 李思涵 , 杨凌晨 , 刘行军

IPC: G06V20/54 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094

Abstract: 本申请公开了一种基于多模态图像融合技术的车辆定位和识别方法，包括：获取目标车辆在当前环境下红外图像和对应的可见光图像；判断当前环境是否为暗光环境，若为暗光环境，则将红外图像和可见光图像输入至融合生成模型，获得融合生成模型输出的增强可见光图像，否则，将可见光图像作为增强可见光图像；将红外图像和增强可见光图像输入至车辆检测模型，获得车辆检测模型输出的目标车辆的位置和型号；车辆检测模型是基于第二样本红外图像和第二样本可见光图像及其对应车辆的位置标签和型号标签训练得到的。通过本申请，实现了对目标车辆的被动定位和车型识别，保证了不同光照情况下都可以获取较为准确的车辆定位和识别结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification