-
公开(公告)号:CN107239758A
公开(公告)日:2017-10-10
申请号:CN201710373996.4
申请日:2017-05-24
Applicant: 北京小米移动软件有限公司
Inventor: 杨松
CPC classification number: G06K9/00228 , G06N3/02
Abstract: 本公开是关于一种人脸关键点定位的方法及装置,用于提高人脸关键点定位准确度。所述方法包括:采用第一卷积神经网络确定三维图像的第一投影矩阵T和第一人脸形状分量系数集α,所述三维图像为待识别二维人脸图像拟合的三维可形变人脸图像;根据所述第一T和所述第一α,确定所述待识别二维人脸图像的第一人脸关键点P。
-
公开(公告)号:CN107231505A
公开(公告)日:2017-10-03
申请号:CN201710584990.1
申请日:2017-07-18
Applicant: 北京小米移动软件有限公司
Inventor: 杨松
Abstract: 本公开是关于一种图像处理方法及装置,该方法包括:根据所述待处理图像中各像素的亮度值确定待处理图像对应的亮度图像,其中,所述亮度图像中各像素的亮度值为所述待处理图像中相应像素的亮度值;确定所述亮度图像中各像素的亮度值的均值和标准差;根据所述均值和标准差,以及所述亮度图像中各像素的亮度值,确定所述待处理图像中相应像素对应的亮度调整参数;根据所述待处理图像中相应像素的对应的亮度调整参数对所述待处理图像中所述相应像素的亮度进行调整。该技术方案可以避免亮度调整参数的设置,达到了全自动图像美化的效果,也能对不同亮度区域进行不同的亮度自适应处理,使得美图效果更好。
-
公开(公告)号:CN107169493A
公开(公告)日:2017-09-15
申请号:CN201710399440.2
申请日:2017-05-31
Applicant: 北京小米移动软件有限公司
Inventor: 杨松
CPC classification number: G06K9/3216 , G06N3/02
Abstract: 本公开是关于一种信息识别方法及装置。该方法包括:获取待识别图片中身份证图像上多个定位点的位置;根据所述多个定位点的位置和预设比例,校正所述待识别图片,获取校正图片,所述校正图片中身份证图像的长和宽满足所述预设比例;识别所述校正图片中的用户身份信息。该技术方案中,在识别身份证上的用户信息时,可以首先校正待识别图片上的身份证图像,克服由于拍照角度导致的身份证图像的透视变换现象,进而避免了由于透视变换导致的信息识别不准确的情况,提高了身份证信息识别的精确度,进而提高了用户体验。
-
公开(公告)号:CN106778755A
公开(公告)日:2017-05-31
申请号:CN201611085885.5
申请日:2016-11-30
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于一种卡片信息识别方法及装置,属于图像处理技术领域,该方法包括:从第一图像中确定第一指定区域,该第一图像为对第二图像进行灰度化处理后的图像,该第二图像为对待识别的卡片进行拍摄得到,该卡片中的卡片信息位于该卡片中的指定位置,基于该第一指定区域,确定第二指定区域,该第二指定区域与该第一指定区域之间的距离为预设距离,基于该第二指定区域,对该第一图像进行旋转校正,基于旋转校正后的第一图像和该卡片信息在该卡片中的指定位置,对该卡片中的卡片信息进行识别,如此,通过旋转校正使得该第一图像中的卡片摆正后再进行识别,提高了识别的准确性。
-
公开(公告)号:CN106776890A
公开(公告)日:2017-05-31
申请号:CN201611078225.4
申请日:2016-11-29
Applicant: 北京小米移动软件有限公司
IPC: G06F17/30
CPC classification number: G11B27/102 , G06F17/30672 , G06F17/3082 , G06F17/30828 , G06F17/3084 , G06F17/30846 , G06K9/00744 , G11B27/322 , G11B27/34 , H04N9/87
Abstract: 本公开揭示了一种视频播放进度的调整方法,属于视频处理领域。所述视频播放进度的调整方法包括:获取用户输入的关键字,并在目标视频中确定与关键字对应的至少一个匹配关键帧,再显示至少一个匹配关键帧,当检测到对至少一个匹配关键帧中的关键帧的选择操作时,则将目标视频的播放进度调整至目标播放进度。通过根据用户输入的关键字,确定与关键字对应的匹配关键帧,从而根据对不同的匹配关键帧的选择对目标视频的播放进度进行调整,无需用户浏览目标视频后才能确定特定的视频片段对应的播放进度,减少了调整目标视频的播放进度的时间,提高了调整播放进度的效率。
-
公开(公告)号:CN106504223A
公开(公告)日:2017-03-15
申请号:CN201610819544.X
申请日:2016-09-12
Applicant: 北京小米移动软件有限公司
CPC classification number: G06T7/0002 , G06T3/60 , G06T2200/21 , G06T2207/20084
Abstract: 本公开揭示了一种图片的参考角度判定方法及装置,属于图片处理领域。图片的参考角度判定方法包括:将图像旋转预定角度,判定旋转后的图像是否与未旋转的图像重合;当旋转后的图像未与未旋转的图像重合时,确定出旋转后的图像的基准置信度;当旋转后的图像与未旋转的图像重合时,比较各个旋转后的图像的基准置信度,将最高基准置信度确定为图像的参考置信度;根据参考置信度确定出图像的参考角度。因此解决了图片的EXIF信息中的参考角度信息缺失后,网页和输出设备无法按照正确角度显示该图片的问题;达到了在图片的EXIF信息中的参考角度信息缺失的情况下,推算出图像的参考角度的效果。
-
公开(公告)号:CN106503697A
公开(公告)日:2017-03-15
申请号:CN201611103936.2
申请日:2016-12-05
Applicant: 北京小米移动软件有限公司
Inventor: 杨松
IPC: G06K9/00
CPC classification number: G06K9/00221 , G06K9/00268
Abstract: 本公开是关于目标识别方法及装置、人脸识别方法及装置。该方法包括:获取目标图像;获取所述目标图像中每个像素点的梯度方向,其中所述梯度方向被划分为多个梯度方向区间;根据所述目标图像中每个像素点的梯度方向,获取每个梯度方向区间的梯度方向积分图;提取所述目标图像中的HOG特征,以进行目标识别;其中,在提取HOG特征时,利用所述每个梯度方向区间的梯度方向积分图进行直方图统计。该技术方案通过采用积分图的方式,只需要对每个像素点的梯度方向计算一次,避免了在目标图像的识别过程中迭代提取HOG特征时重复计算像素的梯度方向的问题,有效的加快了算法的运行速度。
-
公开(公告)号:CN106446969A
公开(公告)日:2017-02-22
申请号:CN201611091710.5
申请日:2016-12-01
Applicant: 北京小米移动软件有限公司
IPC: G06K9/62
CPC classification number: G06K9/6218 , G06K9/6215 , G06K9/6232
Abstract: 本公开是关于一种用户识别的方法及装置,涉及互联网应用领域,该方法包括获取预设时间段内多个用户的历史输入信息,并从所述历史输入信息中获取输入特征,然后根据所述输入特征对所述多个用户进行聚类,并确定属于同一类的用户为同一用户。
-
公开(公告)号:CN106446944A
公开(公告)日:2017-02-22
申请号:CN201610835865.9
申请日:2016-09-20
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于基于图像的物体检测方法、装置及服务器,该方法包括:对图像中的物体进行检测,得到所述图像中包含的各类物体的频次向量;基于字典学习的方法对所述频次向量进行编码,将得到的编码值作为物体检测的结果。应用本公开实施例,与相关技术中直接将物体在图像中出现的频率作为检测结果所不同的是,通过字典学习的方法,获取图像中各个物体的频次向量,并利用编码对以频次向量所表示的检测结果进行修正,从而降低误检率和漏检率,提高检测准确率和完整性。
-
公开(公告)号:CN106407971A
公开(公告)日:2017-02-15
申请号:CN201610827063.3
申请日:2016-09-14
Applicant: 北京小米移动软件有限公司
CPC classification number: G06K9/2054 , G06K9/6269 , G06K2209/01 , G06N3/04
Abstract: 本公开是关于一种文字识别方法及装置。方法包括:确定待识别文字图像的卷积神经网络CNN特征,得到预设维数的特征向量序列;使用循环神经网络RNN对所述预设维数的特征向量序列进行解码,得到所述待识别文字图像中的文字。本公开的实施例提供的技术方案可以采用CNN和RNN相结合的方法完成对待识别文字图像整体的识别,避免了相关技术中需要将文字逐字分割,再逐个文字进行识别所导致的累积误差的问题,可以提高文字识别率。
-
-
-
-
-
-
-
-
-