说话者验证
    2.
    发明授权

    公开(公告)号:CN102646416B

    公开(公告)日:2014-10-29

    申请号:CN201210055759.0

    申请日:2007-02-13

    Applicant: 微软公司

    Inventor: Z·张 M·刘

    CPC classification number: G10L17/20 G10L17/08

    Abstract: 说话者验证通过确定测试发言和存储的训练发言的相似性得分来执行。计算相似性得分涉及确定一组函数之和,其中每个函数包括混合成分的先验概率与适应均值和背景均值间差值之积。适应均值是基于背景均值和测试发言形成的。由该说话者提供的用于验证的语音内容可以是独立于文本(即,他们想说的任何内容)或者依赖于文本(即,用于训练的特定短语)。

    多模态性别识别
    3.
    发明授权

    公开(公告)号:CN102262440B

    公开(公告)日:2014-07-23

    申请号:CN201110170752.9

    申请日:2011-06-13

    Applicant: 微软公司

    CPC classification number: G06F3/038 G06F3/017 G06F2203/0381 G06K9/00369

    Abstract: 本发明公开了多模态性别识别的方法和系统。使用两个或多个模态来执行性别识别。例如,接收深度图像数据以及除深度图像数据以外的一个或多个类型的数据。该数据与人有关。不同类型的数据被融合在一起,以便自动地确定该人的性别。计算系统随后可基于对性别的确定来与该人进行交互。

    多传感器声源定位
    4.
    发明授权

    公开(公告)号:CN101595739B

    公开(公告)日:2012-11-14

    申请号:CN200880003251.8

    申请日:2008-01-26

    Applicant: 微软公司

    CPC classification number: H04R1/406 H04R3/005 H04S2400/11

    Abstract: 呈现了多传感器声源定位(SSL)技术,其提供用于具有超过一对音频传感器的传声器阵列的真正最大似然(ML)处理。一般而言,这通过选择导致从声源到阵列的每一音频传感器的某一传播时间的声源位置来实现,该声源位置最大化同时产生从阵列中的所有传感器输入的音频传感器输出信号的似然。该似然包括为阵列中的每一传感器估算对源信号的未知音频传感器响应的唯一项。

    说话者验证
    5.
    发明公开

    公开(公告)号:CN102646416A

    公开(公告)日:2012-08-22

    申请号:CN201210055759.0

    申请日:2007-02-13

    Applicant: 微软公司

    Inventor: Z·张 M·刘

    CPC classification number: G10L17/20 G10L17/08

    Abstract: 说话者验证通过确定测试发言和存储的训练发言的相似性得分来执行。计算相似性得分涉及确定一组函数之和,其中每个函数包括混合成分的先验概率与适应均值和背景均值间差值之积。适应均值是基于背景均值和测试发言形成的。由该说话者提供的用于验证的语音内容可以是独立于文本(即,他们想说的任何内容)或者依赖于文本(即,用于训练的特定短语)。

    多模态性别识别
    7.
    发明公开

    公开(公告)号:CN102262440A

    公开(公告)日:2011-11-30

    申请号:CN201110170752.9

    申请日:2011-06-13

    Applicant: 微软公司

    CPC classification number: G06F3/038 G06F3/017 G06F2203/0381 G06K9/00369

    Abstract: 本发明公开了多模态性别识别的方法和系统。使用两个或多个模态来执行性别识别。例如,接收深度图像数据以及除深度图像数据以外的一个或多个类型的数据。该数据与人有关。不同类型的数据被融合在一起,以便自动地确定该人的性别。计算系统随后可基于对性别的确定来与该人进行交互。

    说话者验证
    8.
    发明公开

    公开(公告)号:CN101385074A

    公开(公告)日:2009-03-11

    申请号:CN200780005880.X

    申请日:2007-02-13

    Applicant: 微软公司

    Inventor: Z·张 M·刘

    CPC classification number: G10L17/20 G10L17/08

    Abstract: 说话者验证通过确定测试发言和存储的训练发言的相似性得分来执行。计算相似性得分涉及确定一组函数之和,其中每个函数包括混合成分的先验概率与适应均值和背景均值间差值之积。适应均值是基于背景均值和测试发言形成的。由该说话者提供的用于验证的语音内容可以是独立于文本(即,他们想说的任何内容)或者依赖于文本(即,用于训练的特定短语)。

    通信驱动的搜索
    9.
    发明公开

    公开(公告)号:CN105074699A

    公开(公告)日:2015-11-18

    申请号:CN201480009858.2

    申请日:2014-02-17

    Applicant: 微软公司

    Inventor: X·D·黄 Z·陈 Z·张

    Abstract: 一种通信驱动的搜索系统通过将搜索功能与实时通信集成来向用户提供实时的个性化搜索帮助。在提交查询并从通信驱动的搜索系统接收到搜索结果之际,用户可选择搜索结果中所包括的通信链接来激活与关联于该通信链接的实体的通信。该通信驱动的搜索系统然后可基于在用户与该实体之间交换的信息来细化向用户显示的搜索结果。细化可以实时地或基本上实时地进行。

    受控三维通信端点
    10.
    发明公开

    公开(公告)号:CN104782122A

    公开(公告)日:2015-07-15

    申请号:CN201380053160.6

    申请日:2013-10-09

    Applicant: 微软公司

    Abstract: 一种用于仿真在线会面或会议中的各参与者之间的亲临通信并在附加参与者加入时提供虚拟环境的容易伸缩的受控三维(3D)通信端点系统和方法。这向参与者给出了其他参与者与观看者处于同一房间且绕同一桌而坐的假象。受控通信端点包括绕参与者360度来捕捉参与者的视频的多个相机群。受控通信端点还包括包含被放置成绕参与者至少180度且显示包含其他参与者的几何代理的虚拟环境的显示设备的显示设备配置。将参与者置于虚拟圆桌处并在附加参与者被添加时增加虚拟桌的直径容易地实现了可伸缩性。

Patent Agency Ranking