一种基于样例的动态纹理迁移方法及系统

    公开(公告)号:CN114283181A

    公开(公告)日:2022-04-05

    申请号:CN202111582171.6

    申请日:2021-12-22

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于样例的动态纹理迁移方法及系统,将单样本动态纹理迁移任务分解为两个阶段;其中,第一阶段合成具有所需动态纹理的目标视频的起始帧;在第二阶段,将合成图像分解为结构无关的纹理图块,根据纹理图块,利用图像离散化隐空间表示算法VQ‑VAE的Transformers模型来生成长离散序列,并预测相应的后续纹理图块;再采用高斯加权平均合并策略将纹理图块平滑地组合到目标样式化视频的每一帧中,输出自动生成的目标动态特效视频,由此实现动态纹理迁移。本发明将视频样例的动态效果自动转换为目标形状或图像,显著提高动态纹理的设计效率,能够处理仅有一个样例的迁移任务,还可保留精细纹理的细节。

    一种基于单张图像的三维网格模型生成方法及装置

    公开(公告)号:CN110443892B

    公开(公告)日:2021-06-04

    申请号:CN201910675788.9

    申请日:2019-07-25

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于单张图像的三维网格模型重建方法及装置,单张图像可为自然图像或物体的轮廓图,根据用户提供的单张图像,完全自动化地生成与之形状匹配一致的三维模型。包括:语义分割、前景提取、形状特征提取、视角预测、三维模型训练、点云封装表面网格,从而重建生成三维网格模型。本发明能够极大地加快三维模型设计的时间,使得设计三维模型时只需在生成的三维模型的基础上精修即可得到目标模型。

    一种基于标准字形生成的自然场景文字识别方法

    公开(公告)号:CN112329803A

    公开(公告)日:2021-02-05

    申请号:CN201910716704.1

    申请日:2019-08-05

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于标准字形生成的文字识别方法,建立基于注意力机制和生成机制的神经网络模型,在每个时刻将注意力集中在图片的某个位置,利用该位置的神经网络特征,分别进行文字类别的预测和生成多字体标准字形,直到遍历图片中的所有文字为止,实现对一张包含一个或多个文字的自然场景图片中的文字进行识别和输出。本发明利用多字体字形生成,改进了注意力模块,提高了文字识别精度和字形生成质量,从而提升了文字识别的准确度。

    一种基于单阶段少量样本学习的艺术字体自动生成方法

    公开(公告)号:CN110443864A

    公开(公告)日:2019-11-12

    申请号:CN201910670478.8

    申请日:2019-07-24

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于单阶段少量样本建模学习的艺术字体自动生成方法,建立网络模型(AGS-Net),针对已有的完整的合成艺术字体字库,预训练网络模型(AGS-Net),使模型能够从风格参考集输入中提取风格特征、从内容参考集输入中提取内容特征以及合成指定风格和内容的风格化字符;利用只有少量样本的设计师设计的艺术字体字库对网络模型AGS-Net进行微调;通过训练完成的网络模型AGS-Net生成完整的艺术特效字体字库。本发明的网络模型规模、参数量较小。采用本发明技术方案,能够在任何的语言系统上扩展,不局限于特定的语言,能够达到最佳的艺术字体自动合成效果。

    一种字符缩放方法
    45.
    发明公开

    公开(公告)号:CN107818544A

    公开(公告)日:2018-03-20

    申请号:CN201610816680.3

    申请日:2016-09-12

    Applicant: 北京大学

    Abstract: 本发明公布了一种字符缩放方法,通过提取字符的骨架点与轮廓点,计算轮廓点与骨架点之间的控制关系以及空间位置关系,确定有效骨架点以及有效轮廓点,然后对有效骨架点进行仿射变换并对有效轮廓点进行重新分布,最后闭合轮廓点并对字符轮廓点进行填充得到完整缩放后的字符图像,在对字符进行缩放的同时还能够维持字符笔画宽度,能够解决字符在缩放过程中笔画宽度不一致的问题,避免了非等比例缩放过程中笔画宽度不一致带来的失真,有效提升字符领域相关算法的效果,处理效率高、速度快。本发明方法适合于任意语言体系的字符缩放。

    一种基于流形学习的汉字笔画自动提取方法

    公开(公告)号:CN107092917A

    公开(公告)日:2017-08-25

    申请号:CN201710181667.X

    申请日:2017-03-24

    Applicant: 北京大学

    Abstract: 本发明提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。

    一种快速制作矢量字库的方法及系统

    公开(公告)号:CN103488711B

    公开(公告)日:2017-06-27

    申请号:CN201310407337.X

    申请日:2013-09-09

    Applicant: 北京大学

    Abstract: 本发明涉及一种快速制作矢量字库的方法及系统,由计算机、打印机以及扫描仪组成的系统中,其步骤包括:1)指定待建立字库中的文字内容并机器写入一标准表格中;2)在打印出的标准表格上按照书写规范手写入文字,同时以标准表格为单位采集手写入文字得到若干表格图像;3)切分表格图得到文字闭合轮廓,根据文字闭合轮廓选出其中部分点作为关键点,对关键点筛选后得到最优关键点;4)根据最优关键点得到文字的矢量化轮廓,根据矢量化轮廓生成标准TrueType字库。本发明得到的矢量字库质量较高,可以完整的保持原作者的书写风格。在生成字库的过程中完全不需人工干预,扫描得到的图像一步生成高质量的标准字库,利于个性化字库批量生产。

    一种基于书写风格建模的中文字库自动生成方法

    公开(公告)号:CN106384094A

    公开(公告)日:2017-02-08

    申请号:CN201610828454.7

    申请日:2016-09-18

    Applicant: 北京大学

    Inventor: 连宙辉 肖建国

    Abstract: 本发明公布了一种基于书写风格建模的中文字库自动生成方法,通过对输入的手写体汉字图片进行笔画轨迹自动提取与错误结果筛除操作,得到训练数据,采用人工神经网络对手写体汉字笔画形状风格和笔画间架结构风格进行学习和建模,并通过统计分析得到书写笔画连接特性和笔画端部轮廓书写特征,生成与用户书写风格一致的高质量汉字字形。本发明使得只需书写少量常用汉字作为输入,无需任何人工干预,便可自动生成包含海量汉字字形的矢量中文字库,可为用户快速自动生成具备其书写风格的手写体中文字库,能够显著提高手写体中文字库的制作效率、大幅降低生产成本。

    一种基于骨架指导的文字图像矢量化方法及系统

    公开(公告)号:CN103942552B

    公开(公告)日:2017-02-08

    申请号:CN201410047304.3

    申请日:2014-02-11

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于骨架指导的文字图像矢量化方法及系统,其步骤包括:1)对于单个文字图像,系统使用形态学和各向异性扩散算法,对图像进行预处理,包括笔画连接以及边缘平滑;2)得到文字图像的骨架以及骨架上的关键点;3)提取出文字图像的边缘轮廓,将文字图像的边缘轮廓的曲率极值点分类为角点和连接点;4)使用加权的动态规划算法删除多余的连接点;5)曲线拟合,并使得连接点处的曲率连续。与现有技术相比,本发明的矢量化方法及系统可以保持文字书写风格中的重要细节,又能同时去除笔画轮廓上的噪声,且完全不需要人工的干预,算法可以自动运行,有利于矢量化的批量运行。

    一种基于单张全景图像的新视角合成三维重建方法及系统

    公开(公告)号:CN119693543A

    公开(公告)日:2025-03-25

    申请号:CN202411745027.3

    申请日:2024-12-02

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于单张全景图像的新视角合成三维重建方法及系统,包括串行连接的全景图转化网格模块、网格补全模块和网格转化三维高斯场模块;从单个位置的任意相机捕获的全景图像中生成全景图像。包括首先从输入的全景图像构建初步网格,然后通过全景补全器迭代优化网格,同时收集三维一致性伪新视图。最终,将优化后的网格转换为三维高斯场,并使用收集的伪新视图进行训练。本发明能够仅根据一张全景图输入重建现实世界的三维场景,显著降低了三维重建的数据采集成本,能够有效处理大面积遮挡的情况,还可保留精细纹理的细节,合成具有详细几何结构的真实感新视图。

Patent Agency Ranking