一种基于风格学习的汉字合成方法

    公开(公告)号:CN106611172A

    公开(公告)日:2017-05-03

    申请号:CN201510696769.6

    申请日:2015-10-23

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于风格学习的汉字合成方法。本发明为:1)提取用户输入的每一手写字及对应参考字的骨架点坐标;2)根据骨架点分别计算对应手写字和参考字的笔画布局和每个笔画的笔画形状;3)对于每一手写字,计算该手写字与其对应参考字之间的笔画形状差值以及笔画布局差值;4)使用神经网络分别对笔画形状差值、笔画布局差值进行训练,得到笔画形状风格的神经网络权值、笔画布局风格的神经网络权值;5)将新的参考字的笔画惯性、笔画重心位置输入到已训练的神经网络中,分别得到该用户风格的笔画形状和笔画布局;6)组合步骤5)得到的笔画形状和笔画布局得到合成汉字的骨架,然后对该骨架进行平滑、渲染得到该用户风格的手写体汉字。

    一种个性化汉字数字墨水的生成方法

    公开(公告)号:CN103488339B

    公开(公告)日:2016-09-07

    申请号:CN201310407336.5

    申请日:2013-09-09

    Applicant: 北京大学

    Abstract: 本发明涉及一种个性化汉字数字墨水的生成方法,步骤为:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整的笔画训练字并提取得到训练字图像;2)拆分已标定出训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。本发明提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。

    一种面向矢量字形的汉字笔画自动提取方法

    公开(公告)号:CN104992143A

    公开(公告)日:2015-10-21

    申请号:CN201510303067.7

    申请日:2015-06-04

    Applicant: 北京大学

    CPC classification number: G06K9/00865

    Abstract: 本发明涉及一种面向矢量字形的汉字笔画自动提取方法,其步骤包括:1)对待提取的目标字形以及模板数据库中与其相对应的带有笔画归类信息的模板字形进行骨架提取,得到数据点集和模板点集;2)将数据点集、模板点集以及模板点集的笔画归属关系作为输入,进行基于结构信息的非刚性点集注册,得到数据点集的笔画归属关系;3)将数据点集的笔画归属关系转换成数据轮廓段的归属关系,使构成字形轮廓的每一个轮廓段具有相应的归属笔画;4)连接生成的轮廓段,得到最终的矢量笔画提取结果。本发明的矢量化方法能够精确地实现字形的笔画提取,且完全不需要人工的干预,算法可以自动运行,有利于矢量化笔画提取的批量运行。

    基于分块编码与Transformer的中文字形字库自动生成方法及系统

    公开(公告)号:CN114332260B

    公开(公告)日:2024-06-21

    申请号:CN202111635060.7

    申请日:2021-12-29

    Applicant: 北京大学

    Inventor: 连宙辉 刘亦天

    Abstract: 本发明公布了一种基于分块编码与Transformer的中文字形字库自动生成方法及系统,包括第一阶段模型和第二阶段模型;基于分块编码的字形图片编码方法和基于Transformer的少样本高质量字形图片生成方法;通过设计用于降低Transformer计算成本的分块编码,只需要少量用户图片作为参考,将字形图片编码为适用于Transformer生成的序列格式,再使用Transformer生成带有目标风格的高分辨率汉字字形图片,最后对字形图片进行矢量化,得到完整的中文字形和字库文件。采用本发明技术方案,只需要少量用户图片作为参考,能够生成用户指定风格的高分辨率的字形图片和中文字库。

    汉字骨架自动合成方法及大规模中文字库自动生成方法

    公开(公告)号:CN110427989B

    公开(公告)日:2021-07-09

    申请号:CN201910649353.7

    申请日:2019-07-18

    Applicant: 北京大学

    Abstract: 本发明公布了一种汉字骨架自动合成方法及大规模中文字库的自动生成方法,将中文字符视为点的序列(即书写轨迹),通过构建具有单调注意力机制的循环神经网络模型FontRNN来进行汉字骨架的自动合成,从少量训练样本中学习合成其余具有相同风格的汉字字符,实现汉字骨架的自动合成。本发明可克服现有汉字合成技术存在的合成汉字模糊、笔画丢失、结构错误等不足,且本发明模型可以从仅仅几百个训练样本中学习如何合成其余数千个具有相同风格的汉字字符。因此,本发明可以极大地降低制作大规模中文字库的成本,具有很大的实际应用价值。

    一种基于深度学习和部件拼接的中文字形及字库生成方法

    公开(公告)号:CN112784531A

    公开(公告)日:2021-05-11

    申请号:CN201911069573.9

    申请日:2019-11-05

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于深度学习和部件拼接的中文字形及字库生成方法,对目标字库中的汉字字形进行结构拆分得到用于重组的基础矢量部件;根据目标字库中的汉字字形的布局预测待生成字形的布局,将基础矢量部件拼接生成新的矢量字形;生成方法包括线下处理过程和线上处理过程;线下处理过程对已有字库的字体进行处理,得到训练数据和参考模板,线上处理过程针对任意包含少量特定汉字字形的目标字库,采用部件拼接的方法生成完整的中文矢量字形。采用本发明的技术方案,可根据设计好的少量矢量汉字字形,自动生成一套完整且可以被实际使用的高质量中文矢量字库。

    字库生成方法、装置、电子设备及存储介质

    公开(公告)号:CN112669407A

    公开(公告)日:2021-04-16

    申请号:CN201910984727.0

    申请日:2019-10-16

    Abstract: 本申请提供一种字库生成方法、装置、电子设备及存储介质。本申请提供的字库生成方法通过获取文字图像集合,所获取的文字图像集合中包括至少一张文字图像,然后根据所获取的文字图像确定第一参考字库,再根据文字图像集合中的文字图像以及第一参考字库确定目标笔画轨迹数据,所确定的目标笔画轨迹数据可以表征文字图像的形状特征,最后根据目标笔画轨迹数据以及预设处理算法确定目标文字图像,以生成目标字库,从而,能够通过文字图像实现整套字库的自动生成。字库生成过程简洁,提高了字库制作效率,减少了制作成本。并且,所生成字库中的文字能够保持原始文字的书写风格,字库质量较高。

    一种基于纹理合成的三维模型自动上色方法

    公开(公告)号:CN109712223B

    公开(公告)日:2020-11-03

    申请号:CN201711012500.7

    申请日:2017-10-26

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于纹理合成的三维模型自动上色方法,采用纹理合成方法对给定模型和图像进行纹理合成,并通过网格投影恢复模型表面的纹理坐标,由此实现根据用户给定的图像合成模型贴图,方便快捷地实现对三维模型进行自动上色;包括:纹理图像处理阶段、三维模型处理阶段和纹理合成阶段。本发明方法可以方便快捷地对三维模型进行自动上色,无需手动进行网格参数化或手工设计纹理贴图,只需输入二维图像和待上色的三维模型,即可自动地合成模型贴图。本发明适合海量模型的自动上色工程,极大简化了模型着色的难度,也非常适合个性化的模型制作与展示。

    一种基于风格学习的汉字合成方法

    公开(公告)号:CN106611172B

    公开(公告)日:2019-11-08

    申请号:CN201510696769.6

    申请日:2015-10-23

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于风格学习的汉字合成方法。本发明为:1)提取用户输入的每一手写字及对应参考字的骨架点坐标;2)根据骨架点分别计算对应手写字和参考字的笔画布局和每个笔画的笔画形状;3)对于每一手写字,计算该手写字与其对应参考字之间的笔画形状差值以及笔画布局差值;4)使用神经网络分别对笔画形状差值、笔画布局差值进行训练,得到笔画形状风格的神经网络权值、笔画布局风格的神经网络权值;5)将新的参考字的笔画惯性、笔画重心位置输入到已训练的神经网络中,分别得到该用户风格的笔画形状和笔画布局;6)组合步骤5)得到的笔画形状和笔画布局得到合成汉字的骨架,然后对该骨架进行平滑、渲染得到该用户风格的手写体汉字。

    一种自然场景图片中的文本字体的识别方法

    公开(公告)号:CN108376244A

    公开(公告)日:2018-08-07

    申请号:CN201810104830.7

    申请日:2018-02-02

    Applicant: 北京大学

    Abstract: 本发明公布了一种自然场景图片中的文本字体的识别方法,通过图片合成方法获得大量融合不同字体文本的具体类似真实效果的自然场景图片,利用图片训练得到字体识别器和文本定位器,通过文本定位器从互联网图片中定位出更多文本图片,再利用迁移学习方法,通过字体识别器从图片中进一步学习,进一步提高识别的准确度。本发明采用自动合成高质量训练图片的方案,避免了耗时耗力的人工标注,大幅度降低成本,使得字体分类器具有更好的识别精度。此外,本发明引入迁移学习方法,充分利用大量无字体标签的图片,进一步增强字体分类器的准确度。

Patent Agency Ranking