-
公开(公告)号:CN116129924A
公开(公告)日:2023-05-16
申请号:CN202310056306.8
申请日:2023-01-17
Applicant: 杭州联汇科技股份有限公司 , 浙江广播电视集团
IPC: G10L21/0208 , G10L21/0232 , G10L25/45
Abstract: 本发明公开了一种基于Speex的噪音识别方法,其包括以下步骤:S1、对原始音频信号使用Speex降噪,得到一次降噪音频信号以及被滤出的一次噪音信号;S2、对一次噪音信号每T毫秒计算一个噪音值并记录到一次噪音数组D;S3、计算D的一次噪音平均差MD;S4、对一次降噪音频信号再次使用Speex降噪,得到二次降噪音频信号以及被滤出的二次噪音信号;S5、对二次噪音信号每T2毫秒计算一个噪音值并到二次噪音数组D2;S6、计算D2的二次噪音平均差MD2;S7、计算MD和MD2的变异系数K,如果K大于噪音阈值则表示噪音存在。本发明准确度高,适用于广播音频信号处理领域。
-
公开(公告)号:CN119377437A
公开(公告)日:2025-01-28
申请号:CN202411389908.6
申请日:2024-10-08
Applicant: 杭州联汇科技股份有限公司
IPC: G06F16/61 , G06F16/635 , G06F16/638
Abstract: 本发明公开了一种基于歌曲音乐量化属性的广播节目编排方法,包括如下步骤:步骤一,对广播数字化系统中的所有歌曲进行音乐属性的量化标定;步骤二,构建歌曲库,之后将量化后的歌曲信息存储于歌曲库中,每个歌曲都有对应的量化属性标签;步骤三,根据广播节目的需求,基于步骤二歌曲库中的歌曲信息和歌曲预设多种编排策略;步骤四,在编排过程中,预先将歌曲信息及编排策略读入高速缓存,以提升编排效率;步骤五,根据编排策略,从歌曲库中智能抽取符合策略的歌曲,进行节目编排。本发明的基于歌曲音乐量化属性的广播节目编排方法,通过音乐属性的量化分析为广播节目编排提供了新的技术手段。
-
公开(公告)号:CN119337302A
公开(公告)日:2025-01-21
申请号:CN202411236073.0
申请日:2024-09-04
Applicant: 杭州联汇科技股份有限公司
Abstract: 本发明公开了一种基于指示数据集优化的多模态大语言模型训练方法,其包括以下步骤:S1、初始训练:使用初始的多模态数据集对多模态大语言模型进行训练;S2、更新指示数据集;多模态数据集发生变化以后,将多模态数据集输入到多模态动态扩散网络中提取动态特征,然后根据动态特征的重要性和变化情况,动态筛选和调整指示数据集;S3、更新特征融合机制:使用传统多模态语言特征模型对多模态数据集提取静态特征,将动态特征与静态特征融合,获得融合特征;S4、联合训练:根据指示数据集和融合特征对多模态大语言模型进行联合训练;重复步骤S2‑S4,直至完成训练。本方案可以使训练后的模型具有更好的泛化能力和性能表现。
-
公开(公告)号:CN118939983B
公开(公告)日:2025-02-07
申请号:CN202411424151.X
申请日:2024-10-12
Applicant: 杭州联汇科技股份有限公司 , 宏龙科技(杭州)有限公司
IPC: G06F18/21 , G06F18/213 , G06F40/30 , G06N3/0895
Abstract: 本发明公开了多模态向量化模型的训练方法,包括如下步骤:步骤一,进行数据准备,收集图文对数据、文本对数据和图像对数据;步骤二,构建一个统一的多模态向量化模型,能够同时处理文本和图像数据;步骤三,构建损失函数;步骤四,同时使用图文对数据、文本对数据和图像对数据进行两个阶段的训练。本发明的多模态向量化模型的训练方法,在训练过程中同步优化图文单模态向量以及图文跨模态向量的训练方法。
-
公开(公告)号:CN119200996A
公开(公告)日:2024-12-27
申请号:CN202411347940.8
申请日:2024-09-26
Applicant: 杭州联汇科技股份有限公司
IPC: G06F3/06
Abstract: 本发明公开了一种基于存储系统的数据去重方法,其包括以下步骤:S1、将存储系统中的数据划分为若干个数据块;S2、对每个数据块计算唯一的数据指纹;S3、构建指纹索引结构,存储已有数据块的指纹集合,对每个新生成的指纹Fi,在指纹索引结构中查找,如果Fi存在于指纹集合中,则表明对应的数据块是重复的,跳转到步骤S4;如果Fi不存在于指纹集合中,则表明对应的数据块是新的数据块,将Fi添加到指纹集合中;S4、保留一个数据块副本,并在索引中标记重复数据块的位置。本方案实现了对重复数据的识别和删除,从而节省存储空间,提高了存储系统的利用率。
-
公开(公告)号:CN118552774A
公开(公告)日:2024-08-27
申请号:CN202410624064.2
申请日:2024-05-20
Applicant: 杭州联汇科技股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/74 , G06V10/82 , G06V10/25 , G06V20/70 , G06N3/0455
Abstract: 本发明公开了一种基于图像特征向量和像素差异比对的移动物体检测方法,包括以下步骤:S1、通过像素差异对比获得移动物体的边界框;S2、依据边界框获得移动物体的区域图像并提取特征向量;S3、通过已训练的相似物体分类层对特征向量进行分类,从而获得移动物体的类别。不同于常规目标检测需要通过标注和训练来对特定物体进行检测并定位物体在图像中的边界框,本发明不需要标注和训练的步骤,而是通过基于图像像素值的比对算法来实现对移动物体的检测,具有良好的泛化性,可以大大提高移动物体检测识别范围和性能,适用于各类移动物体检测和识别场景。
-
公开(公告)号:CN119377678A
公开(公告)日:2025-01-28
申请号:CN202411514057.3
申请日:2024-10-29
Applicant: 杭州联汇科技股份有限公司
IPC: G06F18/214 , G06F18/25 , G06F16/58 , G06F16/33 , G06N5/04 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于图文交错的视觉语言多模态大语言模型(Vision Large Language Model,VLM)预训练方法。其包括以下步骤:S1、构建图文交错数据集,图片描述数据集,文本数据集S2、构建多模态大语言模型架构,利用图片描述进行视觉模型的向量空间向文本向量空间的初步融合S3、利用图文交错数据,融合视觉信息与文本信息,优化多模态大模型对视觉的理解能力。通过本方案,可以在保持大语言模型在文本理解,逻辑推理的能力的情况下,充分融合视觉信息与文本信息在生成大模型的视觉理解能力。同时,由于图文交错数据的构建,该方法训练的多模态大模型具备处理多张图片的能力。本方案适用于AIGC领域。
-
公开(公告)号:CN118939983A
公开(公告)日:2024-11-12
申请号:CN202411424151.X
申请日:2024-10-12
Applicant: 杭州联汇科技股份有限公司 , 宏龙科技(杭州)有限公司
IPC: G06F18/21 , G06F18/213 , G06F40/30 , G06N3/0895
Abstract: 本发明公开了多模态向量化模型的训练方法,包括如下步骤:步骤一,进行数据准备,收集图文对数据、文本对数据和图像对数据;步骤二,构建一个统一的多模态向量化模型,能够同时处理文本和图像数据;步骤三,构建损失函数;步骤四,同时使用图文对数据、文本对数据和图像对数据进行两个阶段的训练。本发明的多模态向量化模型的训练方法,在训练过程中同步优化图文单模态向量以及图文跨模态向量的训练方法。
-
公开(公告)号:CN114582376A
公开(公告)日:2022-06-03
申请号:CN202210054122.3
申请日:2022-01-18
Applicant: 杭州联汇科技股份有限公司
IPC: G11B27/031
Abstract: 本发明公开了一种数字音频剪辑高质量优化拼接方法,其包括以下步骤:S1、对前述音频信号结束波形分类,并对分类等级赋值,记为前述信号等级值;S2、对后续音频信号起始波形分类,并对分类等级赋值,记为后续信号等级值;S3、计算前述信号等级值和后续信号等级值的级差;S4、依据级差对前述音频信号进行调整;S5、将后续音频信号拼接到前述音频信号的末尾。本方案可以保证接续波形数据的连贯性,抑制了拼接噪声的发生,适用于音频剪辑处理。
-
公开(公告)号:CN119621261A
公开(公告)日:2025-03-14
申请号:CN202411549790.9
申请日:2024-11-01
Applicant: 杭州联汇科技股份有限公司
Abstract: 本发明公开了一种基于DPDK的GPU算力调度系统,包括:DPDK分离处理模型层,与外部应用层通信连接,用于根据应用层发布任务的性质和需求,将任务分配给适合处理该任务的处理器;动态任务调度层,与DPDK分离处理模型层通信连接,用于接收DPDK分离处理模型层分配的任务,以对任务进行调度分配;水位监控层,与外部GPU和CPU通信连接,还与DPDK分离处理模型层通信连接;底层硬件层,包括处理器、网络设备这些硬件组件,用于提供系统运行所需的物理资源。本发明的基于DPDK的GPU算力调度系统,提高系统性能、优化任务调度、加速深度学习推理、提高网络数据包处理效率以及提供灵活的资源动态调配机制。这些目的旨在推动技术创新,提高系统的效率和性能。
-
-
-
-
-
-
-
-
-