Patent search ap:("北京小米移动软件有限公司") AND inv:"杨松" Page 6

51.

发明公开
一种判定正脸图像的方法和装置有权

公开(公告)号：CN106022272A

公开(公告)日：2016-10-12

申请号：CN201610346383.7

申请日：2016-05-23

Applicant: 北京小米移动软件有限公司

Inventor： 杨松 , 张旭华 , 万韶华

IPC: G06K9/00 , G06K9/62

Abstract: 本公开是关于一种判定正脸图像的方法和装置，属于电子技术领域。所述方法包括：获取待判别的面部图像；基于预先存储的左侧脸/正脸分类模型，对所述面部图像进行左侧脸/正脸的判别，得到所述面部图像的第一判别结果，基于预先存储的右侧脸/正脸分类模型，对所述面部图像进行右侧脸/正脸的判别，得到所述面部图像的第二判别结果；如果所述第一判别结果与所述第二判别结果均为正脸图像，则判定所述面部图像为正脸图像，如果所述第一判别结果为左侧脸或所述第二判别结果为右侧脸图像，则判定所述面部图像为非正脸图像。采用本公开，可以提高处理面部图像的效率。

52.

发明授权
卡片信息识别方法及装置有权

公开(公告)号：CN106250894B

公开(公告)日：2021-10-26

申请号：CN201610597368.X

申请日：2016-07-26

Applicant: 北京小米移动软件有限公司

Inventor： 杨松 , 陈志军 , 王百超

IPC: G06K9/32

Abstract: 本公开是关于一种卡片信息识别方法及装置，属于图像处理技术领域，该方法包括从第一图像中确定指定区域，该第一图像为对待识别的卡片进行拍摄得到，确定第一图像中包括的至少一个四边形轮廓，基于四边形轮廓和卡片的宽度和长度，对四边形轮廓在第一图像中所包围的四边形图像进行校正，且校正后的四边形图像的四条边分别与第一图像的对应方向上的边平行，基于该指定区域，从校正后的至少一个四边形图像中选择目标图像，将目标图像确定为卡片图像，并基于该卡片图像和该卡片信息在该卡片中的指定位置，对该卡片中的信息进行识别，如此，将第一图像中的卡片校正为正规的矩形图像后再进行识别，提高了识别的准确性。

53.

发明授权
图像拍摄方法、装置及计算机可读存储介质有权

公开(公告)号：CN110266914B

公开(公告)日：2021-08-24

申请号：CN201910668088.7

申请日：2019-07-23

Applicant: 北京小米移动软件有限公司

Inventor： 杨松

IPC: H04N5/217 , H04N5/262

Abstract: 本公开是关于一种图像拍摄方法、装置及计算机可读存储介质，属于图像处理技术领域。所述方法包括：在通过摄像头捕捉图像的过程中，获取视频帧；根据所述视频帧，提取目标直方特征；将所述目标直方特征输入到图像画质识别模型中，输出对所述视频帧的画质识别结果，所述图像画质识别模型用于基于直方特征，确定图像的画质是否模糊；响应于所述画质识别结果为模糊，提示用户清洁所述摄像头。本公开在每次拍摄图像时，先基于图像画质识别模型对视频帧的画质进行识别，响应于识别出视频帧的画质模糊，提示用户对摄像头进行清洁，从而基于清洁后的摄像头进行拍摄，采用该种方法提高了所拍摄图像的画质。

54.

发明授权
图片问答方法及装置有权

公开(公告)号：CN108021897B

公开(公告)日：2021-06-15

申请号：CN201711308733.1

申请日：2017-12-11

Applicant: 北京小米移动软件有限公司

Inventor： 杨松

IPC: G06K9/00 , G06K9/62

Abstract: 本公开是关于一种图片问答方法及装置，包括接收图片和与所述图片相关的问题；通过CNN提取所述图片的图像特征向量；通过第一RNN提取所述问题的编码特征向量；将所述图像特征向量和所述编码特征向量进行拼接，得到联合特征向量；通过解码神经网络对所述联合特征向量进行解码，生成所述问题的答案；其中，所述CNN、第一RNN和解码神经网络是在三者作为整体网络的情况下，以端到端的方式训练得到的神经网络。根据本公开实施例的图片问答方法及装置能够生成与图片相关的问题的答案，且各步骤采用的CNN、第一RNN和解码神经网络是在三者作为一个整体的情况下，进行端到端的训练下得到的，消除了累计误差，提高了问答的准确率。

55.

发明授权
图像重建方法及装置有权

公开(公告)号：CN107220934B

公开(公告)日：2021-03-30

申请号：CN201710339903.6

申请日：2017-05-15

Applicant: 北京小米移动软件有限公司

Inventor： 杨松

IPC: G06T3/40

Abstract: 本公开是关于图像重建方法及装置。该方法包括：获取图像中Y通道图像和UV通道图像；通过预设全卷积网，对Y通道图像进行高分辨率重建，得到放大h倍的新Y通道图像；其中，新Y通道图像的像素个数是Y通道图像的像素个数的h2倍；根据所述新Y通道图像和所述UV通道图像，生成放大所述h倍的新图像。该技术方案通过预设全卷积网，将Y通道图像的像素增加h2倍，这样，特征增多，Y通道图像的分辨率就会提高，因此，相较于图像，提高了新图像的分辨率。

56.

发明授权
识别文字区域的方法、装置及计算机可读存储介质有权

公开(公告)号：CN108717542B

公开(公告)日：2020-09-15

申请号：CN201810367675.8

申请日：2018-04-23

Applicant: 北京小米移动软件有限公司

Inventor： 杨松

IPC: G06K9/20

Abstract: 本公开是关于一种识别文字区域的方法、装置及计算机可读存储介质。采用该方法，首先，将待识别图像的特征信息输入到文字区域识别模型中，得到该待识别图像中每个第一图像区域的第一概率和第二概率，接着，根据每个第一图像区域的第一概率，筛选出包含有文字的图像区域，然后，在筛选出的包含有文字的图像区域的基础上，进一步分析该图像区域的第二概率，判断是否将该图像区域与其相邻的图像区域相合并，最后，根据合并后的图像区域，确定待识别图像中的文字区域。因此，通过确定待识别图像中每个第一图像区域的第一概率和第二概率，可以直接计算出文字区域，提供了一种准确度高并且识别速度快的文字区域识别方法。

57.

发明授权
视频类型确定方法及装置有权

公开(公告)号：CN107609513B

公开(公告)日：2020-06-02

申请号：CN201710818220.9

申请日：2017-09-12

Applicant: 北京小米移动软件有限公司

Inventor： 杨松

IPC: G06K9/00

Abstract: 本公开是关于视频类型确定方法，该方法包括：将原视频划分为M段第一子视频；通过第一预设卷积神经网络提取每段第一子视频的图像特征；计算每段第一子视频的光流，通过第二预设卷积神经网络提取光流的特征作为相应段的第一子视频的时序特征；针对任一段第一子视频，整合图像特征和时序特征得到综合特征，通过M段所述第一子视频分别对应的综合特征构成项数为M的特征序列；在原视频中确定N段第二子视频；通过第三预设卷积神经网络对特征序列进行多层的一维卷积运算，运算结果包含N个元素，N个元素与N段第二子视频一一对应；根据概率确定相应第二子视频的类型。根据本公开的实施例确定视频的类型，消耗人力较少，且处理速度更快。

58.

发明授权
基于图像的物体检测方法、装置及服务器有权

公开(公告)号：CN106446944B

公开(公告)日：2020-03-17

申请号：CN201610835865.9

申请日：2016-09-20

Applicant: 北京小米移动软件有限公司

Inventor： 万韶华 , 张旭华 , 杨松

IPC: G06K9/62 , G06K9/68

Abstract: 本公开是关于基于图像的物体检测方法、装置及服务器，该方法包括：对图像中的物体进行检测，得到所述图像中包含的各类物体的频次向量；基于字典学习的方法对所述频次向量进行编码，将得到的编码值作为物体检测的结果。应用本公开实施例，与相关技术中直接将物体在图像中出现的频率作为检测结果所不同的是，通过字典学习的方法，获取图像中各个物体的频次向量，并利用编码对以频次向量所表示的检测结果进行修正，从而降低误检率和漏检率，提高检测准确率和完整性。

59.

发明授权
基于图像的头部姿态检测方法、装置以及终端有权

公开(公告)号：CN106384098B

公开(公告)日：2019-11-26

申请号：CN201610849615.0

申请日：2016-09-23

Applicant: 北京小米移动软件有限公司

Inventor： 杨松 , 王百超 , 张旭华

IPC: G06K9/00 , G06N3/02

Abstract: 本公开是关于一种基于图像的头部姿态检测方法、装置以及终端，其中，该方法包括：获取图像中的各人脸候选区域，其中，人脸候选区域为特征向量；对图像进行运算处理，确定与图像对应的特征图；将各人脸候选区域分别一一映射至特征图上，确定各人脸候选区域在特征图中的各对应候选区域；将各对应候选区域的特征向量输入至多任务神经网络中进行识别，获取各对应候选区域的识别结果，其中，识别结果包括头部姿态参数。通过一次识别就可以得到头部姿态参数，同时可以得到人脸的位置，进而提高了头部姿态检测的速度，提高了头部姿态检测的检测效率；同时，通过多任务神经网络的识别，可以消除现有检测方法中任务之间的累积误差，进而提高检测的准确性。

60.

发明授权
图片中目标物的定位方法及装置有权

公开(公告)号：CN106355573B

公开(公告)日：2019-10-25

申请号：CN201610721083.2

申请日：2016-08-24

Applicant: 北京小米移动软件有限公司

Inventor： 陈志军 , 万韶华 , 杨松

IPC: G06T7/00 , G06T3/40

Abstract: 本公开是关于一种图片中目标物的定位方法及装置。方法包括：根据已训练的第一全卷积神经网络的第一预设缩放比例对原始图片进行缩放处理，得到第一图片；将第一图片输入到第一全卷积神经网络中，通过第一全卷积神经网络进行卷积处理，输出第一热度图；基于第一热度图上的每一个坐标点对应的概率值，确定目标物在原始图片中的候选区域；将候选区域对应的图像内容输入到已训练的第二全卷积神经网络中，通过第二全卷积神经网络进行卷积处理后，输出第二热度图；基于第二热度图上的每一个坐标点对应的值，确定目标物在原始图片中的位置区域。本公开技术方案可以大大降低处理图像的数据量，提高目标物的识别效率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification