一种基于字体流形的中文字库自动生成方法

    公开(公告)号:CN108304357A

    公开(公告)日:2018-07-20

    申请号:CN201810093715.4

    申请日:2018-01-31

    Applicant: 北京大学

    Abstract: 本发明公布了一种中文字库自动生成方法,基于流形学习和深度神经网络,针对已有的汉字字库,提取字库的风格特征向量和字形特征向量,建立每个字的风格流形;再训练字体渲染网络,实现从特征向量到汉字图像的映射;在流形空间中获得新的特征向量,放入训练好的字体渲染网络,得到新风格的汉字字库。本发明不需人工书写汉字,无需人工干预;同时,流形空间的创建基于已有字体的特征向量,所以保证了新的特征向量不会出现巨大的偏差,保证了汉字原有的字形,风格特征的可解释性也较高。

    一种快速制作矢量字库的方法及系统

    公开(公告)号:CN103488711A

    公开(公告)日:2014-01-01

    申请号:CN201310407337.X

    申请日:2013-09-09

    Applicant: 北京大学

    CPC classification number: G06T11/80 G06F17/30271

    Abstract: 本发明涉及一种快速制作矢量字库的方法及系统,由计算机、打印机以及扫描仪组成的系统中,其步骤包括:1)指定待建立字库中的文字内容并机器写入一标准表格中;2)在打印出的标准表格上按照书写规范手写入文字,同时以标准表格为单位采集手写入文字得到若干表格图像;3)切分表格图得到文字闭合轮廓,根据文字闭合轮廓选出其中部分点作为关键点,对关键点筛选后得到最优关键点;4)根据最优关键点得到文字的矢量化轮廓,根据矢量化轮廓生成标准TrueType字库。本发明得到的矢量字库质量较高,可以完整的保持原作者的书写风格。在生成字库的过程中完全不需人工干预,扫描得到的图像一步生成高质量的标准字库,利于个性化字库批量生产。

    一种数字航空摄影系统
    23.
    发明公开

    公开(公告)号:CN101294804A

    公开(公告)日:2008-10-29

    申请号:CN200810115306.6

    申请日:2008-06-20

    Applicant: 北京大学

    Abstract: 本发明涉及一种数字航空摄影系统,包括一带有可控快门的大口径光学镜头和一内视场拼接数字成像后背;内视场拼接数字成像后背包括单面散射光学器件、光电转换模块、多路数据存储模块和总控模块;单面散射光学器件置于大口径光学镜头成像面处;光电转换模块置于单面散射光学器件之后,包括CCD成像传感器阵列、脉冲发生器、驱动器和A/D转换器;成像传感器阵列还包括一个独立的高速视频图像采集装置;总控模块包括一核心控制器、多个成像控制器、人机界面设备、视频切换单元、大口径镜头快门触发单元;成像传感器阵列的光电转换与快门触发单元联动控制。本发明大口径光学镜头可以采用现有胶片式航摄仪的高精度大口径镜头,配置本发明所述数字成像后背,使数字航摄仪满足航摄作业、处理等要求。

    一种基于标准字形生成的自然场景文字识别方法

    公开(公告)号:CN112329803B

    公开(公告)日:2022-08-26

    申请号:CN201910716704.1

    申请日:2019-08-05

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于标准字形生成的文字识别方法,建立基于注意力机制和生成机制的神经网络模型,在每个时刻将注意力集中在图片的某个位置,利用该位置的神经网络特征,分别进行文字类别的预测和生成多字体标准字形,直到遍历图片中的所有文字为止,实现对一张包含一个或多个文字的自然场景图片中的文字进行识别和输出。本发明利用多字体字形生成,改进了注意力模块,提高了文字识别精度和字形生成质量,从而提升了文字识别的准确度。

    一种基于强化学习的中文字库自动生成方法及系统

    公开(公告)号:CN112732943A

    公开(公告)日:2021-04-30

    申请号:CN202110074336.2

    申请日:2021-01-20

    Applicant: 北京大学

    Inventor: 连宙辉 刘亦天

    Abstract: 本发明公布了一种基于强化学习的中文字库自动生成方法及系统,通过创建强化学习模块输出薄板样条TPS插值函数参数,并应用TPS插值函数将标准汉字骨架的每个笔画转化为目标风格;再对笔画实际位置与尺寸进行预测,将笔画骨架组合为汉字骨架;对汉字骨架进行渲染生成目标汉字图片,从而得到完整的中文字库文件。系统包括:强化学习模块、笔画位置预测模块、渲染模块。本发明实现了对标准笔画骨架的修改和笔画边界框的预测,确保生成更好的目标风格汉字骨架。模型结构简单,无需进行大规模的预训练处理,即可合成高质量的汉字骨架,自动生成高质量的中文字库。

    笔画骨架信息提取方法、装置、电子设备及存储介质

    公开(公告)号:CN112633428A

    公开(公告)日:2021-04-09

    申请号:CN201910955021.1

    申请日:2019-10-09

    Abstract: 本申请提供一种笔画骨架信息提取方法、装置、电子设备及存储介质。本申请提供的笔画骨架信息提取方法通过获取目标图像,所获取的目标图像中包括目标文字图像,然后根据目标图像确定目标文字图像对应的参考文字,之后,再根据所确定的参考文字以及预设参考数据库确定参考笔画骨架信息,其中,预设参考数据库包括参考文字与参考笔画骨架信息的映射关系,最后根据目标文字图像以及参考笔画骨架信息确定目标笔画骨架信息,从而,能够实现笔画骨架信息的自动化提取,整个提取过程无需人工干预,降低提取成本的同时还提高了效率以及精确度。

    一种基于流形学习的汉字笔画自动提取方法

    公开(公告)号:CN107092917B

    公开(公告)日:2020-06-02

    申请号:CN201710181667.X

    申请日:2017-03-24

    Applicant: 北京大学

    Abstract: 本发明提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。

    一种中文字符缩放方法
    28.
    发明授权

    公开(公告)号:CN107507129B

    公开(公告)日:2019-12-13

    申请号:CN201610422723.X

    申请日:2016-06-14

    Applicant: 北京大学

    Abstract: 本发明公布了一种中文字符缩放方法,包括中文字符拆分过程、笔画缩放重构过程和笔画拼接过程,使得中文字符缩放之后仍能维持中文字符结构信息;通过汉字骨架轮廓提取,将汉字拆分至笔画级别,然后对笔画分别进行缩放重构,将重构缩放后的笔画进行拼接,在对中文字符进行缩放的同时还能够维持中文字符结构信息,避免了非等比例缩放过程中笔画宽度不一致、笔画梯度变化以及笔画细节信息丢失带来的失真,有效提升中文字符领域相关算法的效果,用以解决中文字符在缩放过程中结构信息丢失的问题。

    汉字骨架自动合成方法及大规模中文字库自动生成方法

    公开(公告)号:CN110427989A

    公开(公告)日:2019-11-08

    申请号:CN201910649353.7

    申请日:2019-07-18

    Applicant: 北京大学

    Abstract: 本发明公布了一种汉字骨架自动合成方法及大规模中文字库的自动生成方法,将中文字符视为点的序列(即书写轨迹),通过构建具有单调注意力机制的循环神经网络模型FontRNN来进行汉字骨架的自动合成,从少量训练样本中学习合成其余具有相同风格的汉字字符,实现汉字骨架的自动合成。本发明可克服现有汉字合成技术存在的合成汉字模糊、笔画丢失、结构错误等不足,且本发明模型可以从仅仅几百个训练样本中学习如何合成其余数千个具有相同风格的汉字字符。因此,本发明可以极大地降低制作大规模中文字库的成本,具有很大的实际应用价值。

    一种基于书写风格建模的中文字库自动生成方法

    公开(公告)号:CN106384094B

    公开(公告)日:2019-07-19

    申请号:CN201610828454.7

    申请日:2016-09-18

    Applicant: 北京大学

    Inventor: 连宙辉 肖建国

    Abstract: 本发明公布了一种基于书写风格建模的中文字库自动生成方法,通过对输入的手写体汉字图片进行笔画轨迹自动提取与错误结果筛除操作,得到训练数据,采用人工神经网络对手写体汉字笔画形状风格和笔画间架结构风格进行学习和建模,并通过统计分析得到书写笔画连接特性和笔画端部轮廓书写特征,生成与用户书写风格一致的高质量汉字字形。本发明使得只需书写少量常用汉字作为输入,无需任何人工干预,便可自动生成包含海量汉字字形的矢量中文字库,可为用户快速自动生成具备其书写风格的手写体中文字库,能够显著提高手写体中文字库的制作效率、大幅降低生产成本。

Patent Agency Ranking