基于麦克风阵列的音频采集方法和装置

    公开(公告)号:CN106098075A

    公开(公告)日:2016-11-09

    申请号:CN201610643347.7

    申请日:2016-08-08

    CPC classification number: G10L21/0216 G10L2021/02166

    Abstract: 本发明公开了一种基于麦克风阵列的音频采集方法和装置。该方法包括:通过第一麦克风阵列在全方向上搜索音频,第二麦克风阵列在第一波束指向上采集第一目标音频;判断第一麦克风阵列搜索到的触发音频是否满足预定切换触发条件;若满足将其作为第二目标音频,并将其声源定位信息发送给第二麦克风阵列;判断发出第二目标音频的第二声源所在的第二位置与发出第一目标音频的第一声源所在的第一位置是否相同;若第二位置与第一位置不同,则控制第二麦克风阵列进行波束指向切换,以在第二波束指向上采集第二目标音频。本发明解决了相关技术中由于单个麦克风阵列的音频采集方向固定所导致的无法采集其他方向上的音频的技术问题。

    节目互动方法、装置、终端、服务器及系统

    公开(公告)号:CN104125265A

    公开(公告)日:2014-10-29

    申请号:CN201310157880.9

    申请日:2013-04-28

    Abstract: 本发明公开一种节目互动方法、装置、终端、服务器及系统,属于计算机技术领域。方法包括:根据终端发送的信号获取第一音频指纹;根据第一音频指纹检测音频信号是否为对应于直播节目的音频信号;若音频信号是对应于直播节目的音频信号,则向终端反馈对应于直播节目的互动信息。节目互动服务装置包括:获取模块、第一检测模块和反馈模块。节目互动参与装置包括:发送模块、接收模块和参与模块。服务器包括节目互动服务装置,终端包括节目互动参与装置,节目互动系统包括服务器和终端。本发明解决通过发送短信参与互动活动造成延长参与互动活动的操作时间,降低互动活动的参与效率及便利性的问题,达到提高互动活动的参与效率及参与活跃度的效果。

    自动语音识别方法和系统

    公开(公告)号:CN103971675A

    公开(公告)日:2014-08-06

    申请号:CN201310033201.7

    申请日:2013-01-29

    CPC classification number: G10L15/197

    Abstract: 本申请公开了一种自动语音识别方法和系统,包括:对生语料进行语料分类计算,得到一个以上不同类别的分类语料;针对所述每个分类语料进行训练得到一个以上对应的分类语言模型;依据分类的生僻程度为所述各个分类语言模型进行加权插值处理,其中各分类的生僻程度与该分类对应的加权值成正相关关系,将加权插值处理后的分类语言模型合并,得到插值语言模型;依据声学模型和所述插值语言模型构建解码资源;依据所述解码资源,对输入的语音进行解码,输出概率值最高的字符串作为所述输入语音的识别结果。利用本发明,可以提高对生僻词语的语音的识别准确率。

    一种变声系统、方法及人机交互系统及方法

    公开(公告)号:CN103632672B

    公开(公告)日:2017-03-22

    申请号:CN201210309311.7

    申请日:2012-08-28

    Abstract: 本发明涉及一种变声系统、方法及人机交互系统及方法。本发明实施例的变声系统,包括音频输入模块,用于接收第一音频信息;基频变声模块,用于对接收的第一音频信息进行变速变调处理和/或变速不变调处理以获取第二音频信息;音频输出模块,用于输出第二音频信息。本发明实施例的变声系统对输入的音频进行变调处理,提高了变声系统的处理能力,改变了现有变声系统过于单调的问题;本发明实施例的人机交互系统及方法通过将视觉、听觉、触觉三种感官有机的结合在一起,形成一种新的交互方式,进一步提高交互性。

    自动语音识别方法和系统

    公开(公告)号:CN103971686B

    公开(公告)日:2015-06-10

    申请号:CN201310037464.5

    申请日:2013-01-30

    CPC classification number: G10L15/193 G10L15/083

    Abstract: 本发明公开了一种语音识别方法和系统,包括:对词进行分类,将总体语言模板中的生僻词替换为其所属的分类标记,并分别构建主解码资源网络和各分类的子解码资源网络。在解码时,先在主解码资源网络中对输入语音进行解码,当遇到分类标记时则跳出主解码资源网络,进入该分类标记对应的子解码资源网络中继续解码;在子解码资源网络中解码结束后再跳回到主解码资源网络,并在主解码资源网络中对生僻词后续的语音继续解码。通过这种子解码资源网络的处理,可以明显提高生僻词语在主解码资源网络中的过低的概率值,因此可以降低生僻词语的语音发生数据偏移的几率,提高了对于生僻词语的语音的识别准确率。

Patent Agency Ranking