SOUND LEVELING IN MULTI-CHANNEL SOUND CAPTURE SYSTEM

    公开(公告)号:WO2018129086A1

    公开(公告)日:2018-07-12

    申请号:PCT/US2018/012247

    申请日:2018-01-03

    Inventor: LI, Chunjian

    Abstract: Embodiments of sound leveling in multi-channel sound capture system are disclosed. According to a method, a processor converts at least two input sound channels captured via a microphone array into at least two intermediate sound channels. The intermediate sound channels are respectively associated with predetermined directions from the microphone array. The closer to the direction a sound source is, the more the sound source is enhanced in the intermediate sound channel associated with the direction. The processor levels the intermediate sound channels separately. Further, the processor converts the intermediate sound channels subjected to leveling to a predetermined output channel format. Because sound leveling of the intermediate sound channels can be achieved independently of each other, at least some of the deficiencies of the conventional gain regulation can be overcome or mitigated.

    LISTEN AND USE VOICE RECOGNITION TO FIND TRENDS IN WORDS SAID TO DETERMINE CUSTOMER FEEDBACK
    32.
    发明申请
    LISTEN AND USE VOICE RECOGNITION TO FIND TRENDS IN WORDS SAID TO DETERMINE CUSTOMER FEEDBACK 审中-公开
    聆听并使用语音识别来查找词语趋势,以确定客户反馈

    公开(公告)号:WO2017184920A1

    公开(公告)日:2017-10-26

    申请号:PCT/US2017/028732

    申请日:2017-04-21

    Abstract: In some embodiments, apparatuses, systems, and methods are provided herein for performing sound analysis in a shopping facility. A system for performing sound analysis comprises: an array of sound sensors distributed throughout a shopping facility and configured to receive at least sounds resulting from people in the shopping facility, an audio database including information associated with one or more audio indicia, and a control circuit communicatively coupled to the array of sound sensors and configured to receive, from a plurality of sensors of the array of sound sensors, audio data, wherein the audio data includes audio from throughout the shopping facility, determine, based at least in part on the audio data and the information associated with the one or more audio indicia included in the audio database, an action be taken, and transmit, to a terminal, an indication of the action to be taken.

    Abstract translation: 在一些实施例中,本文提供了用于在购物设施中执行声音分析的装置,系统和方法。 一种用于执行声音分析的系统,包括:分布在整个购物设施中的声音传感器阵列,其被配置为至少接收来自购物设施中的人的声音,包括与一个或多个音频标记相关联的信息的音频数据库以及控制电路 通信地耦合到声音传感器阵列并被配置为从声音传感器阵列的多个传感器接收音频数据,其中音频数据包括来自整个购物设施的音频,至少部分地基于音频 数据和与包括在音频数据库中的一个或多个音频标记相关联的信息,采取动作并向终端发送要采取的动作的指示。

    音響処理装置および音響処理方法
    33.
    发明申请
    音響処理装置および音響処理方法 审中-公开
    声学处理装置和声音处理方法

    公开(公告)号:WO2013094103A1

    公开(公告)日:2013-06-27

    申请号:PCT/JP2012/006816

    申请日:2012-10-24

    CPC classification number: H04R3/005 H04R1/326 H04R1/406 H04R2201/40

    Abstract:  より簡単に、任意の指向性パターンを精度良く実現して必要とする音を高品質で取得することができる音響処理装置。この装置(400)は、第1の収音信号に対し第2の収音信号を遅延させて合成した第1の指向性収音信号を生成し、第2の収音信号に対し第1の収音信号を遅延させて合成した第2の指向性収音信号を生成する指向性合成処理部(410)と、第1の指向性収音信号と第2の指向性収音信号とを加算して得られる信号のレベルを示す無指向性レベル信号と、第1の指向性収音信号のレベルを示す第1のレベル信号と第2の指向性収音信号のレベルを示す第2のレベル信号とを加算して得られる指向性レベル信号とを生成する比較信号算出部(440)と、無指向性レベル信号と指向性レベル信号とのレベル差異を取得するレベル比較部(451)と、レベル差異が小さくなるように遅延の量を調整する遅延操作部(452)とを有する。

    Abstract translation: 能够以更高的精度更容易地实现任意的指向性图案,能够获得高品质的必要的声音的音响处理装置。 基于所述第一收集信号的装置(400),以生成通过延迟第二收集的信号合成的第一方向的声音拾取信号,第一与第二收集信号 用于生成通过延迟收集到的声音信号(410)中合成的第二方向的声音拾取信号,将第一定向拾音信号和所述第二方向的声音拾取信号的方向性合成处理单元 全向水平信号和表示所述信号的电平与第二电平指示所述第二定向声音收集信号的指示由所得到的信号的电平的电平的第一定向声音收集第一电平信号 电平比较部分(451),用于获取无方向性电平信号和方向性电平信号之间的电平差;比较信号计算部分(440),用于产生方向性电平信号, 以及延迟操作部分(452),用于调整延迟量以减小电平差。

    A METHOD FOR ENCODING MULTIPLE MICROPHONE SIGNALS INTO A SOURCE-SEPARABLE AUDIO SIGNAL FOR NETWORK TRANSMISSION AND AN APPARATUS FOR DIRECTED SOURCE SEPARATION
    34.
    发明申请
    A METHOD FOR ENCODING MULTIPLE MICROPHONE SIGNALS INTO A SOURCE-SEPARABLE AUDIO SIGNAL FOR NETWORK TRANSMISSION AND AN APPARATUS FOR DIRECTED SOURCE SEPARATION 审中-公开
    一种用于将多个麦克风信号编码到用于网络传输的源可分离音频信号的方法以及用于指导的信号源分离的装置

    公开(公告)号:WO2012145709A3

    公开(公告)日:2013-03-14

    申请号:PCT/US2012034570

    申请日:2012-04-20

    Abstract: A method is provided for encoding multiple microphone signals into a composite source-separable audio (SSA) signal, conducive for transmission over a voice network. The embodiments enable the processing of source separation of the target voice signal from its ambient sound to be performed at any point in the voice communication network, including the internet cloud. A multiplicity of processing is possible over the SSA signal, based on the intended voice application. The level of processing is adapted with the availability of the processing power at the chosen processing node in the network in one embodiment. An apparatus for separating out the target source voice from its ambient sound is also provided. The apparatus includes a directed source separation (DSS) unit, which processes the two virtual microphone signals in the SSA representation, to generate a new SSA signal including the enhanced target voice and the enhanced ambient noise.

    Abstract translation: 提供了一种用于将多个麦克风信号编码为有助于通过语音网络传输的复合源可分离音频(SSA)信号的方法。 这些实施例使得能够在包括因特网云的语音通信网络中的任何点处处理目标语音信号与其环境声音的源分离。 基于预期的语音应用,可以通过SSA信号进行多种处理。 在一个实施例中,处理水平适应网络中所选择的处理节点处的处理能力的可用性。 还提供了用于将目标源语音与其环境声音分离的设备。 该装置包括处理SSA表示中的两个虚拟麦克风信号的定向源分离(DSS)单元,以产生包括增强的目标语音和增强的环境噪声的新的SSA信号。

    モバイルプラットフォームでの可変ビーム形成
    36.
    发明专利
    モバイルプラットフォームでの可変ビーム形成 有权
    具有移动平台的可变光束

    公开(公告)号:JP2015167408A

    公开(公告)日:2015-09-24

    申请号:JP2015122711

    申请日:2015-06-18

    Abstract: 【課題】本願発明は、モバイルプラットフォームでの可変ビーム形成を提供する。 【解決手段】モバイルプラットフォームは、マイクロフォンアレイを含み、音源からの可聴音情報を増幅または抑圧するためにビーム形成を行うことができる。音源は、モバイルプラットフォームを音源の方向に向けるなどのユーザ入力、または、タッチスクリーンディスプレイインターフェースによって示される。さらにモバイルプラットフォームは、モバイルプラットフォームの動きを検出することができる方位センサを含む。モバイルプラットフォームが音源に対して動くと、音源の方向にビーム形成が連続して行われるように、方位センサからのデータに基づきビーム形成が調整される。音源からの可聴音情報は、電話またはテレビ電話の会話に含めることもでき、またはその会話から抑圧することもできる。方位センサからのデータに基づいて、カメラからの画像または映像が同様に制御されてもよい。 【選択図】図3

    Abstract translation: 要解决的问题:提供可变波束成形与移动平台。解决方案:移动平台包括麦克风阵列,并且能够实现波束成形以放大或抑制来自声源的可听声音信息。 通过用户输入来指示声源,例如将移动平台指向声源的方向或通过触摸屏显示界面。 移动平台还包括能够检测移动平台的移动的定向传感器。 当移动平台相对于声源移动时,基于来自定向传感器的数据来调整波束形成,使得波束形成在声源的方向上连续地实现。 来自声源的可听见的声音信息可以被包括或抑制在电话或视频电话对话中。 可以基于来自定向传感器的数据同样控制来自相机的图像或视频。

Patent Agency Ranking