来源于单语和可用双语语料库的搭配翻译

    公开(公告)号:CN101194253A

    公开(公告)日:2008-06-04

    申请号:CN200680020698.7

    申请日:2006-06-14

    Applicant: 微软公司

    Abstract: 提供了用于提取搭配翻译的方法和系统。该方法包括使用单语源和目标语言语料库以及可用的双语语料库来构造一个搭配翻译模型。搭配翻译模型采用关于围绕搭配的上下文词语的期望最大化算法。该搭配翻译模型稍后可用于提取一个搭配翻译字典。基于上下文冗余和/或双向翻译约束的可任选过滤器可用于确保该字典中仅包含高度可靠的搭配翻译。所构造的搭配翻译模型和所提取的搭配翻译字典可稍后用于进一步的自然语言处理,诸如句子翻译。

    将图像分类为广告图像或非广告图像

    公开(公告)号:CN102138151B

    公开(公告)日:2013-05-29

    申请号:CN200880019701.2

    申请日:2008-06-13

    Applicant: 微软公司

    CPC classification number: G06Q30/02 G06Q30/0277

    Abstract: 广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像,并随后使用该二元分类器来将网页的图像分类成广告图像或非广告图像。在训练阶段期间,该分类系统生成包括表示图像的特征向量和指示图像是广告图像还是非广告图像的标签的训练数据。该分类系统使用训练数据来训练二元分类器以分类图像。在分类阶段期间,该分类系统输入具有图像的网页并为该图像生成特征向量。该分类系统随后将已训练的二元分类器应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。

    来源于单语和可用双语语料库的搭配翻译

    公开(公告)号:CN101194253B

    公开(公告)日:2012-08-29

    申请号:CN200680020698.7

    申请日:2006-06-14

    Applicant: 微软公司

    Abstract: 提供了用于提取搭配翻译的方法和系统。该方法包括使用单语源和目标语言语料库以及可用的双语语料库来构造一个搭配翻译模型。搭配翻译模型采用关于围绕搭配的上下文词语的期望最大化算法。该搭配翻译模型稍后可用于提取一个搭配翻译字典。基于上下文冗余和/或双向翻译约束的可任选过滤器可用于确保该字典中仅包含高度可靠的搭配翻译。所构造的搭配翻译模型和所提取的搭配翻译字典可稍后用于进一步的自然语言处理,诸如句子翻译。

    将图像分类为广告图像或非广告图像

    公开(公告)号:CN102138151A

    公开(公告)日:2011-07-27

    申请号:CN200880019701.2

    申请日:2008-06-13

    Applicant: 微软公司

    CPC classification number: G06Q30/02 G06Q30/0277

    Abstract: 广告图像分类系统训练二元分类器来将图像分类成广告图像或非广告图像,并随后使用该二元分类器来将网页的图像分类成广告图像或非广告图像。在训练阶段期间,该分类系统生成包括表示图像的特征向量和指示图像是广告图像还是非广告图像的标签的训练数据。该分类系统使用训练数据来训练二元分类器以分类图像。在分类阶段期间,该分类系统输入具有图像的网页并为该图像生成特征向量。该分类系统随后将已训练的二元分类器应用于该特征向量以生成指示图像是广告图像还是非广告图像的分数。

    大规模图像注释的统计方法

    公开(公告)号:CN102112987A

    公开(公告)日:2011-06-29

    申请号:CN200980131159.4

    申请日:2009-05-30

    Applicant: 微软公司

    Inventor: M·李 X·芮

    CPC classification number: G06K9/00684 G06K2209/27

    Abstract: 描述了大规模图像注释的统计方法。一般而言,注释技术包括编译来自多个图像的视觉特征和文本信息、散列图像视觉特征、并基于其散列值对图像聚类。一个示例系统从所聚类的图像中构建统计语言模型,并且通过应用统计语言模型中的一个来注释图像。

    使用分类技术来从图像中提取主色

    公开(公告)号:CN101517616A

    公开(公告)日:2009-08-26

    申请号:CN200780035249.4

    申请日:2007-09-21

    Applicant: 微软公司

    CPC classification number: G06K9/4652 G06T7/90 G06T2207/10024 G06T2207/20081

    Abstract: 提供了一种用于生成检测图像的主色的检测器的方法和系统。主色系统训练检测器将颜色分类为图像的主色。主色系统使用训练图像的集合来训练该检测器。为了训练检测器,主色系统首先标识训练图像的候选主色。主色系统然后提取候选主色的特征。主色系统还输入每一个候选主色的优势度的指示。主色系统然后将候选主色的所提取的特征和优势度的指示用作训练数据来训练检测器检测图像的主色。

    头部姿势估算方法和系统

    公开(公告)号:CN1573660A

    公开(公告)日:2005-02-02

    申请号:CN200410047464.4

    申请日:2004-05-31

    Applicant: 微软公司

    Abstract: 提供有效估算用户脸部和头部姿势的改进,使得计算机或类似的设备可跟踪用户对显示设备的关注。随后用户所转向的显示器或图形用户界面的区域会被自动选择,而不需要用户提供更多的输入。应用正面脸部检测器来检测用户的正面脸部,且随后由部位检测器检测关键面部点,诸如左/右眼中心、左/右嘴角、鼻尖等。系统然后由图像跟踪器跟踪用户的头部,并按照关键面部点和/或姿势估计器的置信度输出,通过粗略到精细的过程来确定用户头部姿势的偏转、倾斜和滚动的角度和其它姿势信息。

Patent Agency Ranking