基于数字文化熵回归的国画实例分割方法

    公开(公告)号:CN117036687A

    公开(公告)日:2023-11-10

    申请号:CN202310786833.4

    申请日:2023-06-30

    Abstract: 本发明基于数字文化熵回归的国画实例分割方法,本分割方法包括以下步骤:S1、将图像输入残差特征提取网络5层特征图,以不同策略将各层次特征融合获取细节与语义信息;S2、计算图像色彩空间的信息熵,并计算主色调占比,以主色调占比和LAB信息熵结合组成颜色丰富度的表征,预测图像中所有位置语义类别和实例组成,与ground truth进行对比计算损失函数;S3、定位实例对象中心坐标,根据特征图和中心点特征,计算轮廓点相对中心点坐标的偏移量,得到初始轮廓,在轮廓上随机选取128个采样点,预测该点与实例的位置关系。本发明在工笔画图像上获得最优分割效果,可以实现对国画工笔画的实例分割,帮助用户提取其中的文化元素。

    一种基于显著性先验的图像自动分割方法

    公开(公告)号:CN113160251A

    公开(公告)日:2021-07-23

    申请号:CN202110562949.0

    申请日:2021-05-24

    Abstract: 本发明涉及一种基于显著性先验的图像自动分割方法,包括以下步骤:通过背景先验显著性方法计算图像在不同超像素尺度下的显著图;采用中心‑原理公式对显著图进行增强;将增强后的显著图进行图像融合,获取融合显著图;提取原图像的RGB颜色特征、LAB颜色特征和OTC纹理特征;根据颜色特征和纹理特征对图像像素进行相似性度量;根据像素相似性对融合显著图进行处理,将符合相似性规则的像素标记为前景种子点,将不符合相似性规则的像素标记为背景种子点;通过图割原理完成对图像的自动分割。本发明方法能够自动获取种子点,同时克服光照对分割的影响,解决了现有图像分割方法需要人工参与且易受光照影响的问题。

    一种基于基因学习模型的曲艺视频标注方法

    公开(公告)号:CN118823627A

    公开(公告)日:2024-10-22

    申请号:CN202410717013.4

    申请日:2024-06-04

    Abstract: 本发明公开了一种基于基因学习模型的曲艺视频标注方法,本方法包括以下步骤:S1、提取视频的关键帧,记录关键帧在曲艺视频所有帧中的下标,计算当前关键帧的时间,并将关键帧输入特征提取网络进行特征提取;S2、分离曲艺视频的音频,提取音频特征;S3、将每个关键帧的视觉特征以及音频特征进行同步聚合,得到每帧的多模态融合特征,对所有关键帧的多模态融合特征进行时序聚合,得到视频级时序聚合特征;S4、根据得到的视频级时序聚合特征进行推理,得到视频级特征,根据得到的关键帧特征进行推理得到视频帧级特征;本发明可以实现对传统曲艺视频的多粒度标注,有助于后续对该视频的管理、检索,有利于传播中华文化。

    一种基于显著性先验的图像自动分割方法

    公开(公告)号:CN113160251B

    公开(公告)日:2023-06-09

    申请号:CN202110562949.0

    申请日:2021-05-24

    Abstract: 本发明涉及一种基于显著性先验的图像自动分割方法,包括以下步骤:通过背景先验显著性方法计算图像在不同超像素尺度下的显著图;采用中心‑原理公式对显著图进行增强;将增强后的显著图进行图像融合,获取融合显著图;提取原图像的RGB颜色特征、LAB颜色特征和OTC纹理特征;根据颜色特征和纹理特征对图像像素进行相似性度量;根据像素相似性对融合显著图进行处理,将符合相似性规则的像素标记为前景种子点,将不符合相似性规则的像素标记为背景种子点;通过图割原理完成对图像的自动分割。本发明方法能够自动获取种子点,同时克服光照对分割的影响,解决了现有图像分割方法需要人工参与且易受光照影响的问题。

    一种基于超像素多特征融合的快速图像分割方法

    公开(公告)号:CN109712143B

    公开(公告)日:2021-01-26

    申请号:CN201811619273.9

    申请日:2018-12-27

    Abstract: 本发明涉及一种基于超像素多特征融合的快速图像分割方法,通过把图像进行超像素预分割,计算各超像素与其他超像素之间的HOG特征相似性度量、强度特征相似性度量和空间位置特征相似性度量,然后获得超像素之间的多特征相似性度量,依据所述多特征相似性度量,把所述超像素预分割图像转换为相似性关系无向图,并依据图割理论对相似性关系无向图进行划分,分割出所述分割对象。本发明相比基于像素级的图像分割方法,对高分辨率图像进行分割时,具有分割速度快,鲁棒性好等优点。

    一种纹样语义增强的传统纹样图文检索方法

    公开(公告)号:CN120067377A

    公开(公告)日:2025-05-30

    申请号:CN202411971722.1

    申请日:2024-12-30

    Abstract: 本发明公开了S1、收集图文数据,筛选预处理后得到的数据集图像文本对;S2、图像分支和文本分支通过CLIP预训练模型图像和文本编码器得到参数;S3、采用纹样语义增强模块训练模型;S4、计算检索结果,本发明基于预训练模型CLIP强大的迁移能力,将其中已有的大量知识应用在传统纹样图文数据上,并通过纹样语义增强模块训练图像编码器,通过输入缺失纹样信息的文本,指导模型进行选择填空任务,从预先构建的纹样语料库中选择匹配的纹样补全文本,该模块提高了编码器对图像中局部复杂纹样的挖掘能力和判别能力,模型一方面提取纹样的精细特征,另一方面对各类纹样具有一定的判别能力,从而与文本特征对齐。

    一种中文古籍图像的数字化方法
    7.
    发明公开

    公开(公告)号:CN118675190A

    公开(公告)日:2024-09-20

    申请号:CN202410717047.3

    申请日:2024-06-04

    Abstract: 本发明公开了一种中文古籍图像的数字化方法,本方法包括以下步骤:S1、构建中文古籍图像数据库,构建文本检测和文本识别模型;S2、定位古籍图像中的文本位置,将待识别的中文古籍图像送入文本检测模型,绘制文本检测框;S3、取得检测结果,将检测出的文本区域送入文本识别模型,按阅读顺序输出得到识别结果;S4、纠错识别结果,针对文本行识别置信度较低的识别结果进行文本纠错;本发明构建丰富多样的数据集使得算法具有较强的稳定性,改进的文本检测算法能够较好的适应复杂版式下的中文古籍图像,改进后的文本识别算法能取得较好的识别结果,并在一定程度上支持生僻字和异体字的识别,在实现中文古籍图像的数字化上提供了更加高效的解决方案。

    一种基于基因学习模型的传统纹样多标签标注方法

    公开(公告)号:CN118674975A

    公开(公告)日:2024-09-20

    申请号:CN202410685803.9

    申请日:2024-05-30

    Abstract: 本发明公开了一种基于基因学习模型的传统纹样多标签标注方法,包括步骤S1得到特征向量;S2、构件专家关联词表;S3、将特征向量输出至线性分类器;S4、计算分类结果向量;本发明使用字典学习的方法对纹样基因进行表征,即是在图像特征描述的维度下,找到数个基向量对纹样基因的特征进行描述;并且鉴于生物基因组所承载的学习能力遗传机制,引入一种具备迁移学习和先验信息传递功能的基因学习模型;引入专家关联词表,强化模型学习能力;使用深度学习优化字典学习算法结构,注重模型表示能力,多层字典学习中施加全局相似度与Fisher判别约束,简约表示的同时增强字典的识别能力,并且减少人工劳动力,提高标注效率。

    一种基于语义标签规则的硬山建筑自动装配方法

    公开(公告)号:CN120070730A

    公开(公告)日:2025-05-30

    申请号:CN202411971727.4

    申请日:2024-12-30

    Abstract: 本发明公开了一种基于语义标签规则的硬山建筑自动装配方法,步骤包括S1设计硬山建筑语义标签,并存取与硬山建筑语义标签相关联的属性信息;S2构建组件规则库;S3完成整个硬山建筑的装配;S4选择游览方案;本发明对古建筑进行高精度的数字化采集和建模,并利用语义标签规则对古建筑进行自动化构建,不仅可以提高构建效率,还可以确保构建的准确性和一致性,解决古代建筑体系庞大、三维数据获取难、语义理解难、标准不规范、建模成本高的问题;同时,还可以借助各种渠道和平台进行古建筑的传播和推广,让更多人了解和关注古代建筑的保护和传承问题。

    一种基于颜色分层的图像压缩编码方法

    公开(公告)号:CN120014076A

    公开(公告)日:2025-05-16

    申请号:CN202411971729.3

    申请日:2024-12-30

    Abstract: 本发明公开了一种基于颜色分层的图像压缩编码方法,本图像压缩编码方法具体包括以下步骤:S1、输入颜色个数,使用颜色聚类算法得到颜色分层;S2、对每个颜色分层进行编码,用轮廓与颜色采样点简约表示;S3、从编码信息利用生成网络解码得到原真重构图像;本发明解决了图像压缩编码的简约表征,进而提高传输效率的难题;编码阶段将图像划分为多个颜色层,通过边缘和颜色联合采样,构建不同分层的单一颜色表征模型;解码阶段引入具有细粒度判别能力的GAN模型,生成边缘和色彩失真较少的图像,并基于颜色分层编码策略,提高图像传输压缩率并保持图像较高原真性。

Patent Agency Ranking