-
公开(公告)号:CN119785830A
公开(公告)日:2025-04-08
申请号:CN202510042626.7
申请日:2025-01-10
Applicant: 深圳市永诚创科技有限公司
IPC: G10L25/51 , F04D27/00 , H04L67/12 , H04L67/125 , H04L67/141
Abstract: 本发明公开了基于工况监测的风扇异常识别方法、装置、设备及介质。方法包括:根据预置的风扇转速控制策略获取与实时检测的系统检测信息对应的目标风扇转速;根据目标风扇转速发出对应驱动控制指令至风扇主控电路,以使风扇主控电路根据驱动控制指令驱动风扇工作;根据匹配识别策略对目标风扇转速与音频监测器进行工况监测得到的监测音频是否不相匹配进行识别,得到风扇是否异常的识别结果;若识别结果为风扇异常,发出对应的停止指令至风扇主控电路,以使风扇主控电路驱动风扇停止工作。通过上述方法,对风扇工作的工况进行监测得到监测音频,并根据匹配识别策略对目标风扇转速与监测音频是否匹配进行识别,从而准确判断风扇是否异常。
-
公开(公告)号:CN119785829A
公开(公告)日:2025-04-08
申请号:CN202411994478.0
申请日:2024-12-31
Applicant: 中国人民解放军陆军工程大学
Abstract: 本发明公开一种基于前端时频注意力的伪造语音归因方法及系统,方法包括:将语音样本的时频特征输入训练好的伪造语音归因模型,输出语音样本的时频特征属于各类语音伪造方法的概率,作为伪造语音归因的识别结果。伪造语音归因模型包括:前端时频注意力模块,用于采用前端时频注意力对语音样本的时频特征进行加权;特征提取模块,用于从经时频注意力加权的前端时频特征中提取语音样本的深度特征;特征分类模块,用于对语音样本的深度特征进行类别判断。本发明在进行伪造语音归因时,能够同时对经编解码转换的语音和未经编解码转换的语音进行伪造方法归因,并且有利于提升对经编解码转换的语音和未经编解码转换的语音的伪造方法归因性能。
-
公开(公告)号:CN119785782A
公开(公告)日:2025-04-08
申请号:CN202411902356.4
申请日:2024-12-20
Applicant: 蔚来汽车科技(安徽)有限公司
Abstract: 本申请公开了一种语音拒识方法、车载语音交互系统及车辆,语音拒识方法包括:获取多模态感知信息;根据所述多模态感知信息确定车内的当前对话场景;根据所述车内的当前对话场景确定目标拒识阈值,并将拒识模型的拒识阈值调整为所述目标拒识阈值;基于拒识阈值调整后的所述拒识模型进行拒识判断,得到识别结果,通过多模态感知信息来综合确定车内的对话场景,能够根据对话场景调整拒识模型的拒识阈值,使得拒识模型能够动态适应对话场景来执行拒识判断,进而能够有效地提高拒识模型的识别准确度,减少在复杂的对话环境中,语音交互系统出现误唤醒和识别错误的情况。
-
公开(公告)号:CN119779463A
公开(公告)日:2025-04-08
申请号:CN202311295398.1
申请日:2023-10-08
Applicant: 中国石油化工股份有限公司 , 中石化石油物探技术研究院有限公司
Abstract: 本申请公开了一种全节点采集环境噪音的平稳性分析方法、装置及存储介质,涉及信号处理技术领域,其技术方案要点是:该方法包括获取全节点采集的环境噪音,并从中提取出待测序列;对所述待测序列进行傅里叶变换以及相位替换,得到若干个替代序列;对所述待测序列与若干个替代序列进行分析处理,分别得到用于表示待测序列时频特征的二维标量以及用于表示若干个替代序列时频特征的二维标量集合;将表示待测序列时频特征的二维标量与表示替代序列时频特征的二维标量集合进行比较,判断待测序列的平稳性。通过该平稳性分析方法,能够对信号进行平稳性检验,与其他方法相比,该方法的平稳性检验结果更为直观有效,并且适用范围更广。
-
公开(公告)号:CN118865758B
公开(公告)日:2025-04-08
申请号:CN202411113493.X
申请日:2024-08-14
Applicant: 中国南方航空股份有限公司 , 上海麦图信息科技有限公司
Inventor: 姚开宇 , 伍翔 , 王燕 , 钟雨泉 , 刘铁 , 魏铭艺 , 吴佳伟 , 张筱玥 , 蒋玲 , 张亚光 , 练鹏文 , 黄庆金 , 陈华英 , 刘忠保 , 余细军 , 熊明 , 李鑫
IPC: G08G5/72 , G10L21/01 , G10L21/055 , G10L25/51 , G10L25/45 , G10L25/06 , G10L19/022
Abstract: 本发明公开了一种舱音事件时间对齐的方法、装置、介质、程序产品及设备,所述方法包括:获取待对齐的舱音数据和飞行数据;对飞行数据中的所有飞行事件进行标记,并生成第一事件时间序列;对舱音数据进行切片和特征提取,获得若干个音频特征序列;将每个音频特征序列分别输入舱音事件识别模型中,得到对应的识别结果,并将所有识别结果进行整合,得到第二事件时间序列;基于第二事件时间序列的时间范围,对第一事件时间序列进行截取,获得第一事件时间子序列;对第一事件时间子序列和第二事件时间序列进行动态时间规整,得到所有舱音事件对应的时间。本发明能够快速地将舱音数据和飞行数据进行对齐,并且准确地获取舱音中关键事件的发生时间。
-
公开(公告)号:CN116032996B
公开(公告)日:2025-04-08
申请号:CN202211660125.8
申请日:2022-12-23
Applicant: 国网信息通信产业集团有限公司
IPC: H04L67/141 , H04L67/143 , H04L67/125 , G10L25/51 , H04Q9/00
Abstract: 本发明提供一种基于变电设备的声纹数据标准化采集方法及系统,涉及变电设备技术领域,声纹采集装置与服务器建立MQTT连接;服务器基于MQTT协议向声纹采集装置发送采集控制指令;声纹采集装置接收采集控制指令,并采集变电设备的声纹数据,并对声纹数据进行处理之后发送给服务器;服务器基于声纹采集装置传输的声纹数据进行解析,提取原始音频数据;服务器基于MQTT协议发送停止指令,声纹采集装置停止采集声纹数据,断开通信连接,终止传输声纹数据。本发明有效解决不同场景、不同变电设备、不同运行状态数据采集解析等方面的技术难题。对电网主设备不停电检测技术的发展及相关体系的建立具有重大意义,有效提升了变电运维效率。
-
公开(公告)号:CN115132224B
公开(公告)日:2025-04-08
申请号:CN202110319218.3
申请日:2021-03-25
Applicant: 北京小米移动软件有限公司
Inventor: 王晓赞
IPC: G10L25/51 , G10L25/03 , H04M1/72454
Abstract: 本申请是关于一种异常声音处理方法、装置、终端及存储介质,该方法包括:确定终端是否处于晃动状态;确定终端处于晃动状态时,获取当前声音信息;根据预设异常声音特征,对当前声音信息进行识别,确定终端中相机马达是否出现异常声音,其中,预设异常声音特征表征相机马达出现异常声音的声音特征;在确定相机马达出现异常声音后,启动相机马达。该方法中,当确定终端晃动状态时,根据预设异常声音特征对当前声音信息进行识别。若确定相机马达出现异常声音,则启动相机马达,使得相机马达处于相对稳定的对焦状态,从而避免相机马达持续出现较大异响,以此来减小或消除异常声音。
-
公开(公告)号:CN119763610A
公开(公告)日:2025-04-04
申请号:CN202510017995.0
申请日:2025-01-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种口语评测方法、装置、电子设备、存储介质和程序产品,涉及人工智能技术领域。其中方法包括:确定待评测语音以及待评测语音对应的题目信息;将待评测语音和题目信息输入至口语评测模型中的特征提取层,得到特征提取层输出的特征向量序列;特征向量序列是由多个第一特征向量拼接得到的;将特征向量序列输入至口语评测模型中的多模态融合层,得到多模态融合层输出的多个第二特征向量;将多个第二特征向量输入至口语评测模型中的评分层,得到评分层输出的待评测语音的评测结果;其中,所述多模态融合层用于使任一第二特征向量融合有多个第一特征向量的特征。本发明可以避免待评测语音的语音信息丢失,实现高准确性的口语评测。
-
公开(公告)号:CN119763537A
公开(公告)日:2025-04-04
申请号:CN202411700151.8
申请日:2024-11-25
Applicant: 中电信人工智能科技(北京)有限公司
Abstract: 本发明实施例提供了一种合成语音的检测方法、装置、电子设备及存储介质,涉及语音识别技术领域,所述方法包括:响应于针对所接收的语音信号的检测指令,对语音信号进行预处理,获得语音信号对应的目标语音信号;获取针对目标语音信号的融合模型;将目标语音信号输入融合模型进行特征提取,获得至少两种不同类型的语音特征,并根据语音特征对语音信号进行识别,输出针对语音信号的合成概率,合成概率用于表征语音信号为合成语音的概率;若合成概率大于或等于预设阈值,则确认语音信号为合成语音,输出针对合成语音的异常提示信号,从而基于融合模型可以准确地识别出语音信号的类型,保证用户数据的安全。
-
公开(公告)号:CN118609599B
公开(公告)日:2025-04-04
申请号:CN202410826484.9
申请日:2024-06-25
Applicant: 新励成教育科技股份有限公司
Abstract: 本申请提出了一种口才训练的反馈方法、系统、装置及存储介质,该方法包括:获取训练者在当前口才训练时的多模态数据;对多模态数据进行语音与非语言行为分析,得到训练者的语音强度变化数据、语调模式数据以及非语言行为与语音的同步性数据;对语音强度变化数据、语调模式数据以及非语言行为与语音的同步性数据进行口才质量分析,得到训练者在当前口才训练过程中的多维口才质量指标;基于多维口才质量指标,为训练者生成并输出针对性的口才改进建议。本申请能够及时且有效地针对训练者的口才训练表现进行个性化反馈,实现了针对训练者的具体表现进行训练指导,从而可以有效提升训练者的口才训练效率和口才技能。
-
-
-
-
-
-
-
-
-