-
公开(公告)号:CN1641631A
公开(公告)日:2005-07-20
申请号:CN200410000628.8
申请日:2004-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/20
Abstract: 本发明公开了一种机器翻译自动评测方法及其系统。该方法在至少一篇参考译文中查找机器翻译系统的输出译文的匹配子片断,然后根据这些匹配子片断及其长度计算熵,以及计算长度惩罚系数和匹配比例惩罚系数,最后获得一个评分作为评价指标。本发明的机器翻译自动评测系统包括子片断搜索模块、长度计算模块、长度惩罚模块、匹配比例惩罚模块和评测得分计算模块。本发明的机器翻译自动评测方法及其系统可以准确评价译文质量,并且能够生成一个具有绝对意义的评价指标,而且在进行自动评测时不限制匹配子片断的长度。
-
公开(公告)号:CN103577398A
公开(公告)日:2014-02-12
申请号:CN201310487641.X
申请日:2013-10-17
Applicant: 中国科学院计算技术研究所
IPC: G06F17/28
Abstract: 本发明涉及一种基于谓词论元结构的层次机器翻译方法及系统,包括训练和翻译过程,将句子中所有的谓词论元结构有机的组织成图状结构,再将此结构作为改进层次短语机器翻译的顶层语义骨架结构,从而直接将谓词论元结构建模到层次短语机器翻译中,将语义独立的片段单独翻译并依据它们之间的结构组合成最终译文,由此得到的译文具有更好的语义相关性、语义结构和长距离调序特征,并因此降低了机器翻译生成毫无意义译文的概率。
-
公开(公告)号:CN101159834B
公开(公告)日:2012-01-11
申请号:CN200710176354.1
申请日:2007-10-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种重复性视频音频节目片段的检测方法和系统。该方法包括下列步骤:将待检测的视频音频节目片段中的音频流进行分割得到音频流片段,并从每一音频流片段中提取音频特征;在视频音频节目流中检测与音频流片段匹配的具有重复性的视频音频节目片段的音频序列,得到重复性视频音频节目片段;对初步得到重复性视频音频节目片段,利用细粒度的音频匹配来精确地定位重复性视频音频节目片段的起始和结束时间点;对精确地定位的重复性视频音频节目片段,使用基于序列的方法对匹配对进行合并,得到完整的重复性视频音频节目片段。其能够更准确、高效地检测出视频音频节目中的特定视频音频节目片段。
-
公开(公告)号:CN101221760B
公开(公告)日:2010-12-22
申请号:CN200810057161.9
申请日:2008-01-30
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30758 , G06F17/30743 , G10L25/48
Abstract: 本发明提供一种音频匹配方法,用于从待测音频流片段中检测出与标准音频库中音频样例相匹配的音频片段,包括:在待测音频流片段的能量包络单元图上,选择每个能量包络单元的起始点作为匹配操作的点;将每个音频样例以及待测音频流片段用切分点和概率对组成的数对形式表示;将待测音频流片段的数对依次与每个音频样例的数对进行比较,得到匹配点以及对应的匹配概率;采用相似性度量函数对匹配点以及对应的音频样例进行计算,得到两者的相似值;将相似值与一个预先设定的阈值进行比较,若所述的相似值大于该阈值,则认为与匹配点相对应的音频片段和与匹配点相对应的音频样例匹配。本发明具有计算简便、运算速度快的优点。
-
公开(公告)号:CN100580693C
公开(公告)日:2010-01-13
申请号:CN200810057162.3
申请日:2008-01-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种广告检测识别方法,包括:对待检测的广播电视节目数据进行预处理,得到所述数据音频流的短时能量包络;根据音频的短时能量特征,将所得到的短时能量包络切分为能量包络单元,得到待检测的广播电视节目数据的能量包络单元图;利用跳单元的策略和基于能量包络单元的相似性度量方法,对所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现对广告的检测识别。本发明以音频特征取代视频特征、音视频特征结合等进行广告检测,具有计算复杂度低,检测效率高的优点;通过将待测数据与已知广告的音频特征进行比较,可以实现对特定广告的识别;本发明还具有应用范围广的优点。
-
公开(公告)号:CN100527125C
公开(公告)日:2009-08-12
申请号:CN200710099724.6
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种统计机器翻译的在线翻译模型选择方法,包括训练和翻译两个阶段,训练阶段包括:收集双语平行语料库,根据类型,将双语平行语料库划分到不同的子语料库中;为子语料库训练候选翻译模型;为子语料库建立索引,得到语料库索引文件;翻译阶段包括:输入待翻译文本,从语料库索引文件中检索与待翻译文本中的句子相似的句子;根据检索结果,得到与相似句子所在子语料库所对应的候选翻译模型,从所有的候选翻译模型中选择最终翻译模型;根据最终翻译模型对输入的待翻译文本进行翻译,得到最后的翻译结果。本发明很好地解决了统计机器翻译系统不能适应不同领域输入文本的问题,能够有效地提高统计机器翻译系统的翻译质量。
-
公开(公告)号:CN101206643A
公开(公告)日:2008-06-25
申请号:CN200610165532.6
申请日:2006-12-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种融合了句型模板和统计机器翻译技术的翻译方法,该方法包括:A、配置句型模板,建立句型模板库;B、利用配置的句型模板对输入的源语言进行匹配,如果匹配成功,则将输入的源语言转换成包含源语言词语与目标语言词语的句子,并执行步骤D;否则,执行步骤C;C、将输入的源语言按照标点符号切分成子句,对切分的子句进行匹配,将切分的子句转换成包含源语言词语与目标语言词语的句子;D、将匹配得到的包含源语言词语与目标语言词语的句子输出给统计机器翻译系统进行翻译,得到翻译结果。利用本发明,解决了统计机器翻译系统不能很好的翻译具有固定句型结构句子的问题,使对具有固定句型结构的句子的翻译更加流畅。
-
公开(公告)号:CN101090461A
公开(公告)日:2007-12-19
申请号:CN200610087132.8
申请日:2006-06-13
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明公开了一种数字视频字幕自动翻译方法,用于将字幕内容翻译成另一种语言,包括:提取用源语言表示的字幕内容,并转换为文本格式;进行语种判别;选择从源语言到目标语言的翻译短语表;根据目标语言的语种类别,提取目标语言的语言模型;将字幕中的语句划分成短语,查找短语在目标语言中的含义;将翻译后的短语按顺序连接,并计算翻译结果的分数;选择分数最高的翻译结果作为字幕中的语句在目标语言中的含义;将翻译后的字幕内容重新转换为传输流接受的格式并输出。本发明对每个短语保留所有可能的翻译结果,用翻译概率来表示谁的可能性更大,提高了翻译的准确率;对语句作短语切分时考虑所有可能的匹配上的短语切分,使得翻译结果更为全面。
-
公开(公告)号:CN201201830Y
公开(公告)日:2009-03-04
申请号:CN200820078670.5
申请日:2008-01-22
Applicant: 中国科学院计算技术研究所
IPC: B66B1/20
CPC classification number: Y02B50/122
Abstract: 本实用新型公开了一种电梯优化调度智能监控系统,由监控终端和电梯调度控制器两部分组成。所述监控终端中包括第一电源、第一信号接收装置、摄像头、图像智能处理板以及第一信号发射装置,所述电梯调度处理器中包括第二电源、第二信号发射装置、电梯指令采集器、电梯调度控制器以及第二信号接收装置。本实用新型克服了目前基于指令响应的电梯调度系统无法捕获和利用候梯厅层和电梯轿厢内人数信息的缺点,能够辅助进行电梯优化调度,从而减少乘客候梯时间,减少电梯无谓停靠,进一步节省能源,并减少电梯维护费用。
-
-
-
-
-
-
-
-