-
公开(公告)号:CN101211356A
公开(公告)日:2008-07-02
申请号:CN200610171520.4
申请日:2006-12-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于显著区域的图像查询方法,包括以下步骤:(1)将图像进行网格划分;(2)对网格进行模糊聚类,将图像分割成若干关注区域;(3)基于关注区域计算显著度;(4)将所有格点按照显著度进行排序得到显著区域;(5)进行图像查询。本发明的优点在于:简化计算,更符合视觉感知,提高检索效率和精度。
-
公开(公告)号:CN1991864A
公开(公告)日:2007-07-04
申请号:CN200510135214.0
申请日:2005-12-27
Applicant: 中国科学院计算技术研究所
CPC classification number: G06K9/00711
Abstract: 本发明公开了一种球门检测和基于球门检测的足球视频精彩事件检测方法。球门检测的方法步骤包括:(1)提取一帧彩色足球视频图像;(2)对视频帧图像采用草帽变换提取边缘图像;(3)在边缘图像的基础上搜索竖直方向邻域符合一定阈值的线段;(4)在上一步骤得到的线段中,采用哈夫变换选取两根最长的线段作为候选球门柱;(5)采用第二启发式规则确定上一步骤中的候选球门柱是否是球门。基于球门检测的足球视频精彩事件检测方法步骤包括:1)球门检测;2)在检测到球门的基础上,结合第一启发式规则检测足球视频中的精彩事件。本发明具有准确、快速、误检率低的优点。
-
公开(公告)号:CN1317664C
公开(公告)日:2007-05-23
申请号:CN200410000823.0
申请日:2004-01-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种建立乱笔顺库的方法及联机手写汉字识别技术的评测系统。本发明方法,包括标准样本库的采集和乱笔顺库的生成,其特征在于,所述乱笔顺库是按照笔画的连通关系,对采集的联机手写汉字笔迹数据进行等价划分,分割出至少一个以上的部件后,再打乱每个部件内笔画的顺序生成的。本发明的评测系统,包括:存储设备,用于存储标准样本库和乱笔顺库;采集模块,用于采集标准样本库;转换模块,用于将联机汉字笔迹数据转化成一幅二值图像;分割模块,用于按照笔画的连通关系从二值图像中分割出至少一个以上的部件;生成模块,包括一用于打乱每个部件内笔画的顺序的单元,以及一用于打乱部件之间排列顺序的单元。
-
公开(公告)号:CN1691065A
公开(公告)日:2005-11-02
申请号:CN200410037501.3
申请日:2004-04-23
Applicant: 中国科学院计算技术研究所
IPC: G06T7/20
Abstract: 本发明涉及一种视频运动对象分割方法,该方法包括先对图像进行时序分割,将包含运动对象的初始区域和背景分离,随后的空间分割以及区域的分类、合并都仅在初始区域上进行,从而大大减少了计算开销,提高分割速度;根据区域的空间、时序和邻域相似度在MRF模型中加入空间约束、时序约束和邻域约束,并通过求解MRF的最大后验概率对区域分类,最终准确地分割出运动对象,克服了运动估计易受不规则运动和光照影响的缺点。
-
公开(公告)号:CN1641674A
公开(公告)日:2005-07-20
申请号:CN200410000067.1
申请日:2004-01-08
Applicant: 中国科学院计算技术研究所
IPC: G06F19/00
Abstract: 本发明公开了一种计算机语音合成自然度的评测方法及其系统,在该方法中听音人每次对同一文本文件对应的两个计算机语音合成系统合成的语音文件进行两两对比,并给出自然度优劣的对比结果;最后根据所有的对比结果,统计出每个计算机语音合成系统的评测结果。在本发明中,由计算机完成语音文件的排序,该计算机包括配对列表生成模块、初始播放列表生成模块、最终播放列表生成模块和校验模块。本发明的评测方法对听音人要求较低且降低了评测过程中的“记忆”效应。该评测方法具有操作简单、评测结果真实可靠等特点,对于科学、客观、公正地评价语音合成技术,促进语音技术和产业的发展具有重要意义。
-
公开(公告)号:CN1510923A
公开(公告)日:2004-07-07
申请号:CN02157889.3
申请日:2002-12-20
Applicant: 中国科学院计算技术研究所
Abstract: 一种引入视觉模型的MPEG视频码流码率转换方法,包括步骤:对输入的码流进行部分解码;DCT系数截断,去除高于截止频率的系数;码率控制,重新确定各宏块的量化因子;再编码。本发明在转换中巧妙地利用了Fovea视觉模型,有效地提高转换效率,产生主观质量相对更好低码率码流,并进一步减少了计算量。
-
公开(公告)号:CN1510907A
公开(公告)日:2004-07-07
申请号:CN02156973.8
申请日:2002-12-24
Applicant: 中国科学院计算技术研究所
IPC: H04N5/222
Abstract: 一种在体育比赛视频中检测精彩片断的方法,包括步骤:确定视频中相邻帧的摄像机运动;用所述摄像机运动来校正镜头边界的检测;确定所述镜头是否为重放镜头,如果是重放,则判定为精彩片断;根据所述摄像机运动来计算重放镜头与之前视频中正常镜头的相似度,其中相似度最大的镜头判定为精彩片断。本发明能对精彩片断进行有效的自动提取,且不依赖于特定比赛的领域知识。针对体育视频中存在的大量运动,本发明使用摄像机运动分析的结果来校验所检测的镜头边界,从而提高了镜头分割的准确性。
-
公开(公告)号:CN1507279A
公开(公告)日:2004-06-23
申请号:CN02156027.7
申请日:2002-12-11
Applicant: 中国科学院计算技术研究所
Abstract: 一种采用数字水印技术的视频采集方法,包括步骤:对视频数据进行采集;对采集的视频数据进行实时编码;在对视频数据实时编码的同时在视频数据中嵌入数字水印。本发明具有广泛的应用前景,在银行、交通等视频监控系统中,对所采集的视频数据要求有高度的安全性和可靠性,本发明能够满足这样的要求。
-
公开(公告)号:CN1504921A
公开(公告)日:2004-06-16
申请号:CN02154399.2
申请日:2002-12-04
Applicant: 中国科学院计算技术研究所
Abstract: 一种压缩域体育视频定位标题文字的方法,包括以下步骤:用8×8DCT块的高频系数能量检测出初步的文字区域;通过快速算法直接由8×8图像块的DCT系数得到其4个2×8子块的反映水平方向频率变化的高频DCT系数;由子块的高频系数的水平和垂直投影图将初检的文字区域分割成每块只含一行且水平方向相对独立的文字块;利用体育视频中文字的时间冗余特性过滤掉误检的文字块。本发明通过少量的运算在压缩域实现了文字的精确定位,具有很快的定位速度和较高的准确性,不仅可以用于体育视频,还可用于其他类视频如新闻视频中文字的定位。
-
公开(公告)号:CN1494313A
公开(公告)日:2004-05-05
申请号:CN02150312.5
申请日:2002-10-30
Applicant: 中国科学院计算技术研究所
Abstract: 一种基于纠错码的数字视频水印方法,包括步骤:嵌入步骤,嵌入的信息包含水印纠错信息;提取步骤,采用水印纠错算法对受损的水印信息加以恢复。本发明嵌入的信息包含水印纠错信息,能对受损的水印信息加以恢复;嵌入域包括视频数据的亮度和色度数据,充分利用可用空间;可采用不同方式嵌入水印信息和纠错信息,增强健壮性;可选择嵌入原始视频数据或压缩视频数据,适用性强;可增加新的水印嵌入算法,具有可升级性。
-
-
-
-
-
-
-
-
-