-
公开(公告)号:CN119516038A
公开(公告)日:2025-02-25
申请号:CN202411392299.X
申请日:2024-10-08
Applicant: 厦门大学
IPC: G06T11/60 , G06T5/60 , G06T5/70 , G06N3/0455
Abstract: 本发明提供一种基于文本指导的图像编辑方法、装置、设备和介质,将输入图片、源提示词和目标提示词输入到模型;输入图片首先经过inversion过程被加噪为噪声图片,然后分别进入重建分支和编辑分支,所述重建分支的重建过程的交叉注意力图会注入到编辑分支中以保持图片的结构与内容;在inversion过程采用对比注意力聚焦策略,对于不同程度的注意力泄漏情况适应性地将注意力精准的引导至编辑区域;随后在编辑分支中使用掩膜引导的混合采样技术,为编辑区域和非编辑区域提供不同的条件指导,以保证图像中变化和保留的平衡整合在编辑过程中仅对需要编辑的区域进行修改,阻止对非编辑区域产生不必要的编辑,防止发生过度编辑的现象。
-
公开(公告)号:CN119251088A
公开(公告)日:2025-01-03
申请号:CN202411698066.2
申请日:2024-11-26
Applicant: 厦门大学
IPC: G06T5/70 , G06T5/77 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明公开一种基于扩散模型的去噪网络模型、甲骨文拓片图像修复方法,提高修复方法的通用性,提升修复结果的多样性,并降低计算开销,减少人工依赖。去噪网络模型基于现有的U‑Net网络进行调整,包括依次连接的卷积干线网络、编码器、中间层、解码器和深度卷积层和前馈神经网络;由卷积干线网络对输入图像进行分割;编码器包括若干组级联的成对视觉状态空间块和图像合并块;解码器包括若干组级联的成对视觉状态空间块和图像扩展块;图像合并块、图像扩展块分别执行下采样、上采样操作;所述视觉状态空间块采用现有Mamba模块的架构,并选用二维选择性扫描模块替代了Mamba模块的S6模块。
-
公开(公告)号:CN118469034A
公开(公告)日:2024-08-09
申请号:CN202410497220.3
申请日:2024-04-24
Applicant: 厦门大学
Abstract: 本发明公开一种基于可逆变换的大语言模型量化方法,通过初始化可逆矩阵N,将其融合到权重和激活中,通过少量校准数据集更新N,保证其可逆性,并最终获得提高量化性能的大语言模型,可以应用在大语言模型相关的任何领域以实现对大语言模型的压缩和加速,具体来说可以应用在文本翻译、常识推理、日常问答等等领域;本发明通过将可逆矩阵N前置应用于权重矩阵W,可以更有效地匹配权重分布和量化函数Q(),通过扩展优化的范围,可以降低权重的量化误差,进而减少模型的困惑度,减少计算开销。
-
公开(公告)号:CN108764054A
公开(公告)日:2018-11-06
申请号:CN201810408845.2
申请日:2018-04-27
Applicant: 厦门大学
CPC classification number: G06K9/00422 , G06K9/6256 , G06K9/6269 , G06N3/04
Abstract: 基于生成式对抗网络的机器人书写书法的方法,涉及机器人。收集标准毛笔字笔画数据,并按笔画类型整理分类,并注上标注;基于生成对抗网络模型训练两个深度神经网络,生成网络G和对抗网络D;将随机采样的向量输入生成网络G,得到笔画轨迹点的概率分布;书法机器人应用抽样方法从概率分布中获取笔画位置信息并书写笔画致画板,写好后,由相机拍摄记录笔画图像;将待处理的图像进行预处理,输入对抗网络D中进行训练,调整参数,以达到收敛。生成机制具有良好的学习能力,可使书法机器人具有可自动生成各种风格笔画的生成机制,解决了目前书法机器人耗费大量人力手动输入的困难。
-
公开(公告)号:CN119250133A
公开(公告)日:2025-01-03
申请号:CN202411224385.X
申请日:2024-09-03
Applicant: 厦门大学
IPC: G06N3/0495
Abstract: 本发明公开一种基于联合优化的LLMs组合压缩方法、电子设备和存储介质,将量化和稀疏化方法相结合,并同时最小化量化和稀疏化带来的误差,包括以下步骤:从WikiText2训练语料库中采样128个片段,每个片段包含2048个标签;使用统计指标初始化对角线变换矩阵,使用等效变换操作对权重进行初步量化,确定量化步长和零点,并通过步骤1采样的数据对其进行校准;计算稀疏掩码,使用重要性指标#imgabs0#进行重新排列权重,优先稀疏化不重要的权重;进行联合优化;使用不同的数据集对压缩后的模型进行评估,验证其性能提升。
-
公开(公告)号:CN118674659A
公开(公告)日:2024-09-20
申请号:CN202410644769.0
申请日:2024-05-23
Applicant: 厦门大学
Abstract: 本发明提供一体式任务的宽度自适应动态图像恢复方法,该方法包括以下步骤:首先,通过宽度自适应骨干网络对输入图像进行特征提取,其包括多个嵌套子网络,能够根据任务选择最合适的计算,从而在运行时实现精度和计算效率的平衡,然后,使用宽度选择器对每个任务的复杂性进行评估,并根据任务的复杂性动态调整网络的宽度,以适应不同的输入图像,最后,使用重建模块对图像进行恢复。该方法能够在保证恢复精度的同时,实现更高的计算效率,且能够针对不同的任务动态调整网络宽度,达到更好的恢复效果,适用于各种图像恢复应用场景。
-
公开(公告)号:CN118081773A
公开(公告)日:2024-05-28
申请号:CN202410487776.4
申请日:2024-04-23
Applicant: 厦门大学
IPC: B25J9/16
Abstract: 本发明提供一种基于综合损失的演员评论家算法的机器人控制方法,包括:利用神经网络技术构建机器人运动的策略网络和价值评估网络;初始化网络模型参数;构建综合损失函数,所述综合损失包括正则化项、动态的裁剪双Q学习,并通过一差异函数检测估计误差的类型与大小来动态调整正则化项和动态的裁剪双Q学习的参数,使其朝着消除估计误差的方向更新;根据综合损失函数训练价值评估网络,并训练机器人运动的策略网络;判断机器人策略网络是否收敛至预期值,若是,则将机器人的多个传感器信息作为当前状态输入到策略网络,输出机器人的动作控制机器人的关节值和速度;否则,继续训练直至收敛至预期值。
-
公开(公告)号:CN114896436A
公开(公告)日:2022-08-12
申请号:CN202210671640.X
申请日:2022-06-14
Applicant: 厦门大学
IPC: G06F16/53 , G06N3/04 , G06N3/08 , G06V10/762 , G06V10/774
Abstract: 一种基于表征互信息的网络结构搜索方法,涉及人工智能技术领域。在神经网络搜索空间中,随机采样n个神经网络,利用RMI联合分类损失函数训练网络,计算n个网络的RMI分数、q分位数τ,训练拟合随机森林分类器π;从整个神经网络搜索空间随机抽取一批新的网络,从中找到概率最大的一个网络,利用损失函数训练网络,计算其RMI分数,重新拟合训练新的随机森林模型π,判断随机森林训练样本中新网络数量是否达到N,将得到的所有优秀网络样本集中网络结构的众数作最终输出的最优网络结构,利用优秀网络结构集上的统计规律,获得最可能的最优架构。高效、快速,并可推广到不同的搜索空间。使用RMI和随机森林有效探索整个搜索空间。
-
公开(公告)号:CN119831032A
公开(公告)日:2025-04-15
申请号:CN202411815941.0
申请日:2024-12-11
Applicant: 厦门大学
Abstract: 本发明公开一种基于缓存融合的大型语言模型推理加速方法、电子设备和存储介质,通过合并缓存的方式实现最小化压缩过程中的信息丢失,有效解决KV缓存压缩过程中面临的问题。该方法包括:1、对于给定的大型语言模型,基于Token Merge技术计算其缓存值,并根据计算得到的缓存值进行剪枝和合并操作;2、对于原有的大型语言模型的KV缓存矩阵,针对需要被舍弃的Token,通过伯努利分布生成二进制掩码;3、对于被保留的大型语言模型的KV缓存矩阵,首先通过注意力权重计算其被合并的概率值,然后利用步骤2的二进制掩码将被舍弃的Token平均地合并到被保留的Token中;4、在大型语言模型的前向传播过程中,不断对生成的KV缓存矩阵执行步骤1至步骤3的处理过程。
-
公开(公告)号:CN119180312A
公开(公告)日:2024-12-24
申请号:CN202411224388.3
申请日:2024-09-03
Applicant: 厦门大学
IPC: G06N3/0495 , G06N3/045
Abstract: 本发明公开一种基于异常值的可变粒度ViTs模型的训练后量化方法、电子设备和存储介质,可减少量化损失、提升模型性能。方法包括:1、在量化过程中将浮点数转换为低位定点数;2、将#imgabs0#个Transformer块作为重建单位,定义量化误差的计算为#imgabs1#,其中#imgabs2#和#imgabs3#分别表示第#imgabs4#个Transformer块的输入激活及其量化,#imgabs5#和#imgabs6#分别表示第#imgabs7#个Transformer块的权重及其量化,#imgabs8#表示期望,#imgabs9#表示Frobenius范数,#imgabs10#表示第#imgabs11#个Transformer块的量化函数;3、在反向传播时采用直通估计器计算舍入操作的梯度估计。
-
-
-
-
-
-
-
-
-