Patent search ipc:"G10L25/27" Page 10

91.

发明公开
用于语音设备语音测试的轨道运行控制方法及控制系统审中-实审

公开(公告)号：CN118969017A

公开(公告)日：2024-11-15

申请号：CN202410944637.X

申请日：2024-07-15

Applicant: 四川虹美智能科技有限公司

Inventor： 袁龙刚 , 米涛

IPC: G10L25/51 , G10L25/03 , G10L25/27

Abstract: 本发明公开了一种用于语音设备语音测试的轨道运行控制方法及控制系统，涉及本发明涉及语音设备语音测试技术领域，所述轨道运行控制方法包括以下步骤：在运送语音设备的轨道设置WiFi模组；建立测试电脑端和WiFi模组之间的通讯连接；通过测试电脑端获取目标坐标，并向WiFi模组发送所述目标坐标，实现自动控制轨道运行并将语音设备运送至目标坐标的位置；配合本发明所述轨道运行控制系统，本发明不但将语音设备运送和准确定位于目标位置，并且能够及时获取到语音设备的位置，从而及时获得语音设备的距离参数，提高了语音设备语音测试的准确性，提升了语音测试试验的可靠性。

92.

发明授权
基频提取模型的训练方法及装置、基频提取方法及装置有权

公开(公告)号：CN114067784B

公开(公告)日：2024-11-15

申请号：CN202111407245.2

申请日：2021-11-24

Applicant: 云知声智能科技股份有限公司

Inventor： 关海欣 , 梁家恩

IPC: G10L15/02 , G10L15/06 , G10L15/18 , G10L15/20 , G10L21/0208 , G10L25/27

Abstract: 本发明涉及一种基频提取模型的训练方法及装置、基频提取方法及装置，包括：基于预设的干净语音数据库，提取所述干净语音数据库中干净语音的基频信息作为训练目标数据；对所述干净语音进行加噪处理，得到加噪语音；提取所述加噪语音的特征；将所述加噪语音的特征作为待训练模型的输入数据，将所述训练目标数据作为所述待训练模型的输出数据，对所述待训练模型进行训练，得到基频提取模型。本发明实现了对待训练模型的输入数据的降维处理，并利用已知的输出数据进行训练，使得基频提取模型的训练效率有较大的提升。

93.

发明授权
一种基于模糊多高斯聚类的声学环境噪声的识别方法有权

公开(公告)号：CN114613386B

公开(公告)日：2024-11-12

申请号：CN202210207683.2

申请日：2022-03-04

Applicant: 浙江华数广电网络股份有限公司 , 浙江工业大学

Inventor： 陆成刚 , 张卫 , 魏小彬 , 杨利中 , 唐嘉骊 , 陈亮

IPC: G10L21/0272 , G10L25/27 , G06F18/23

Abstract: 本发明为一种基于模糊多高斯聚类的声学环境噪声的识别方法，首先利用模糊均值聚类训练采集的数据样本，并将其输出作为模糊多高斯算法的聚类的输入作进一步训练，生成基于模糊多高斯机制的噪声特征模型，从而建立了噪声识别框架；数据训练完成后，对于每个数据基于生成的多高斯的隶属度数值的大小，将其归类为对应的高斯分布的类型；将对该类型所属强弱的所有数据的隶属度进行算术平均，得到所属该类型的权重，从而由模糊多高斯模型生成混合高斯分布；最后，对于待识别的输入数据，根据混合高斯分布计算它的各个类别的后验概率，将其归类为概率值最大的对应的类型。

94.

发明授权
一种应用于PAM系统的海豚回声定位信号检测方法有权

公开(公告)号：CN115150009B

公开(公告)日：2024-11-08

申请号：CN202210727192.0

申请日：2022-06-24

Applicant: 自然资源部第三海洋研究所

Inventor： 薛睿超 , 牛富强 , 杨燕明

IPC: H04B17/10 , G10L25/27 , G10L25/48

Abstract: 本发明涉及一种应用于PAM系统的海豚回声定位信号检测方法，属于声学信号领域，所述方法的步骤包括采集声音数据，对采集到的声音数据进行带通滤波，设置动态信号检测门限值TH，将信号幅度高于信号检测门限值的数据分组，每组数据组成一个完整的信号，并确定每个疑似信号的起止位置。所述方法在保证正确率的前提下，不需要进行FFT变换和频域分析，从而大大提高了计算速度并有效降低系统算力消耗，进而延长PAM系统的工作时间；算法结合了海豚回声定位信号的时域特征和生物活动特性，从而大幅提高了检测正确率和工作效率。

95.

发明公开
一种融合不确定性的对抗强泛化语音情感识别方法审中-实审

公开(公告)号：CN118887977A

公开(公告)日：2024-11-01

申请号：CN202411169806.3

申请日：2024-08-25

Applicant: 河南工业大学

Inventor： 陶华伟 , 李思娴 , 傅洪亮 , 李鹏 , 张庆辉 , 朱春华 , 王学梅

IPC: G10L25/63 , G10L25/24 , G10L25/30 , G10L25/27 , G06N3/045 , G06N3/094

Abstract: 本发明公开了一种融合不确定性的对抗强泛化语音情感识别方法，包括以下步骤:(1)获取包含多种情感的语音数据库,按个体划分为源域和目标域数据,提取源域及目标域的对数梅尔谱图特征;(2)对源域数据进行时移、速度增强等扩充，提取扩充数据的对数梅尔谱图特征;(3)搭建特征提取器、分类器和判别器网络，原始语音样本进行对抗训练;(4)设计不确定性样本筛选机制，利用经对抗训练后的识别网络模型计算样本的预测熵和标准差,通过不确定性筛选条件对预测向量进行筛选，并对满足筛选条件的向量打伪标签;(5)将筛选后的增强样本加入训练集；重复步骤(3)‑(5)，直至预设轮次结束。在IEMOCAP上的仿真结果表明，该方法有效提高了模型的识别性能。

96.

发明公开
一种歌曲抢唱识别方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN118887970A

公开(公告)日：2024-11-01

申请号：CN202410991358.9

申请日：2024-07-23

Applicant: 武汉微派网络科技有限公司

Inventor： 李程 , 郭毓 , 张玉明 , 丁宗燃

IPC: G10L25/18 , G10L25/24 , G10L25/27 , G10L25/81

Abstract: 本发明涉及一种歌曲抢唱识别方法、装置、电子设备和存储介质，属于音频识别技术领域，该方法包括当前用户根据题卡库中随机生成的初始题卡进行歌曲抢唱，从而可以获取当前用户在歌曲抢唱过程中的当前音频数据；进而根据当前音频数据，得到第一音频特征向量和第一旋律特征向量；然后根据第一音频特征向量确定题卡库中的至少一个目标题卡；当初始题卡处于至少一个目标题卡中时，将第一旋律特征向量与初始题卡的第二旋律特征向量进行对比，得到歌曲抢唱识别结果；从而对用户在歌曲抢唱过程中的当前音频数据与初始题卡的音频片段进行识别，从而不是对初始题卡所在的整首歌曲进行识别，从而提高歌曲抢唱识别的准确度，进而达到歌曲抢唱的预期效果。

97.

发明公开
一种基于音频特征提取的歌唱打分方法及系统审中-实审

公开(公告)号：CN118866007A

公开(公告)日：2024-10-29

申请号：CN202410896032.8

申请日：2024-07-05

Applicant: 北京雷石天地电子技术有限公司

Inventor： 张超锋 , 钱磊

IPC: G10L25/51 , G10L25/27

Abstract: 本发明公开音频处理技术领域中一种基于音频特征提取的歌唱打分方法及系统，其中，该方法包括：通过基音周期检测算法或频谱分析方法提取演唱者音频信号的音高；通过预设音强阈值提取演唱者音频信号的音强；通过节拍跟踪算法提取演唱者音频信号的节奏；根据演唱者音频信号的音高、音强、节奏以及预设的打分规则，计算演唱者的总得分；其中，所述预设的打分规则根据不同的应用场景设定不同。通过该方法，可准确的提取音高、音强和节奏，进而准确的进行打分，并且根据不同的应用场景，打分不同，灵活性强。

98.

发明公开
基于注意力机制和3D残差网络的双模态情感识别方法审中-实审

公开(公告)号：CN118864935A

公开(公告)日：2024-10-29

申请号：CN202410863297.8

申请日：2024-06-29

Applicant: 天翼云科技有限公司

Inventor： 杨晓朵 , 魏慧斌 , 刘舒君 , 池进文 , 郑雪婷

IPC: G06V10/764 , G06V10/40 , G06V10/62 , G06V10/80 , G06V10/82 , G06V20/40 , G06V40/16 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08 , G10L25/63 , G10L25/24 , G10L25/30 , G10L25/27

Abstract: 本发明公开了基于注意力机制和3D残差网络的双模态情感识别方法，本发明提出了基于注意力机制和3D卷积的双模态情感分析模型，以突破二维卷积神经网络时序方向特征提取不足的限制；同时采用决策融合的方式整合视觉、音频双模态特征信息的进行情感分析，并在此基础上加入注意力神经网络，以提高模型对关键视觉及音频关键信息的敏感性。

99.

发明授权
一种基于声纹信息的设备运行状态识别方法及系统有权

公开(公告)号：CN118609601B

公开(公告)日：2024-10-29

申请号：CN202411080267.6

申请日：2024-08-08

Applicant: 四川开物信息技术有限公司 , 四川省开物云矿科技有限公司

Inventor： 李天问 , 周文明 , 雷东川

IPC: G10L25/51 , G10L25/27

Abstract: 本申请公开了一种基于声纹信息的设备运行状态识别方法及系统，涉及声音处理技术领域，其中方法包括：采集目标设备的声音信号，提取声音信号的声纹信息；对声纹信息进行初步分类，确定声纹信息对应的设备类别；对声纹信息进行再次分类，在设备类别的基础上确定声纹信息来源的设备位置；提取声纹信息的数据特征；将数据特征输入基于随机森林建立的识别模型，确定目标设备的运行状态。本申请对目标设备进行分类后确定了目标设备的类别和位置，然后采用随机森林进行运行状态识别，不但确定了目标设备各个具体位置的运行状态，而且提高了识别结果的准确性和识别效率。

100.

发明授权
一种基于改进蝴蝶优化算法的语音信号盲分离方法有权

公开(公告)号：CN115035906B

公开(公告)日：2024-10-29

申请号：CN202210560542.9

申请日：2022-05-23

Applicant: 大连大学

Inventor： 丁元明 , 夏清雨 , 张然 , 彭勃 , 张惠婷

IPC: G10L21/0272 , G10L25/27

Abstract: 本发明公开了一种基于改进蝴蝶优化算法的语音信号盲分离方法，具体包括：从语音信号中获取源信号，经过非奇异混合矩阵处理得到观测信号；对步所述观测信号进行中心化和白化处理；设定最大迭代次数T，维度空间D，[0,1]之间的随机数r，得到初始种群x，其中每个个体xi的位置对应着一个信号分离矩阵，每个个体xi的适应度值对应其峭度值；根据语音信号盲分离问题的适应度函数获取种群个体对应的信号峭度；更新当前群体最高峭度值和个体最高峭度值；更新种群个体对应的峭度值；在迭代后期，执行种群重启策略；根据Y(t)＝WX(t)输出语音分离信号，实现对混合信号的盲分离；本发明得到的分离信号与源信号相似性较高，提升了接收端的语音信号质量。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification