-
公开(公告)号:CN1187986C
公开(公告)日:2005-02-02
申请号:CN01136707.5
申请日:2001-10-22
Applicant: 大唐电信科技股份有限公司 , 北京大学
Abstract: 本发明公开了一种小波零树编码的实现方法,至少包括量化过程、主控过程和从属过程,关键在于:该主控过程对小波树的结点是从低层到高层进行扫描处理,并以零树根ZTR(10)、带值零树根VZTR(11)、孤立零点IZ(00)、大系数VAL(01)四种符号来标注零树结构的相应结点;该量化过程可同时执行对一个以上阈值的量化;该主控过程和从属过程从高比特位平面到低比特位平面进行零树编码,而且并行处理八个位平面的零树编码。本发明还同时公开了一种小波零树解码的实现方法,以及该小波零树编、解码方法的实现电路。本发明可降低对电路性能的要求,使零树编解码与小波变换配合更好,具备优良的压缩效率,占用更少的集成电路资源,更灵活且易于实现。
-
公开(公告)号:CN1414791A
公开(公告)日:2003-04-30
申请号:CN01136707.5
申请日:2001-10-22
Applicant: 大唐电信科技股份有限公司 , 北京大学
Abstract: 本发明公开了一种小波零树编码的实现方法,至少包括量化过程、主控过程和从属过程,关键在于:该主控过程对小波树的结点是从低层到高层进行扫描处理,并以零树根ZTR(10)、带值零树根VZTR(11)、孤立零点IZ(00)、大系数VAL(01)四种符号来标注零树结构的相应结点;该量化过程可同时执行对一个以上阈值的量化;该主控过程和从属过程从高比特位平面到低比特位平面进行零树编码,而且并行处理八个位平面的零树编码。本发明还同时公开了一种小波零树解码的实现方法,以及该小波零树编、解码方法的实现电路。本发明可降低对电路性能的要求,使零树编解码与小波变换配合更好,具备优良的压缩效率,占用更少的集成电路资源,更灵活且易于实现。
-
公开(公告)号:CN119229877A
公开(公告)日:2024-12-31
申请号:CN202411143183.2
申请日:2024-08-20
Abstract: 本发明公开了一种说话人验证模型训练方法、装置、介质及设备,所述方法包括:对获取的语音音频数据进行波形提取,得到语音音频数据对应的音频波形数据;将所述音频波形数据输入至预设分类模型中,以通过所述预设分类模型输出所述语音音频数据对应的预测标签;根据语音音频数据对应的防伪标签和预测标签,确定所述预设分类模型的损失值;通过所述损失值对所述预设分类模型进行参数调整,得到说话人验证模型。本发明采取监督学习的方式利用真实的防伪标签对模型的预测标签进行辅助判定,利用最小化输出和真实标签之间的误差来训练整个模型,提高了训练效率降低了成本。
-
公开(公告)号:CN118710807A
公开(公告)日:2024-09-27
申请号:CN202410812616.2
申请日:2024-06-22
Applicant: 北京大学
Abstract: 本发明提供一种基于神经辐射场的水下场景表征方法,通过神经网络中设计相应的模块来实现,包括:混合渐进采样模块、场景参数估计模块、混合体积渲染模块,对于没有时序的水下数据集,实现水下场景高质量的静态重建,提高了在此类数据集上的三维重建表现;对于存在时序信息的水下数据集,实现水下场景高质量的动态重建,恢复水下生物的运动轨迹与光照的实时变化,扩大了算法的应用范围;渲染速度上大大超越了现有的其它水下场景三维重建的方法,提高了在水体消除任务上的表现;在水体迁移任务上实现了更加真实的效果,设计科学合理,适合推广应用。
-
公开(公告)号:CN102799614B
公开(公告)日:2015-01-07
申请号:CN201210199158.7
申请日:2012-06-14
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种基于视觉词语空间共生性的图像检索方法,其步骤包括:统计训练数据库中任意两个视觉词语之间共生的概率,构建视觉词语共生表;提取输入的查询图像的尺度不变特征;在尺度不变特征中随机选择部分特征作为中心特征,对中心特征做精确映射;并在中心特征的仿射不变区域内统计其近邻特征;根据视觉词语共生表和精确映射的结果,利用高阶概率预测器为近邻特征预测候选视觉词语;比较候选词语与尺度不变特征之间的距离,确定最优的视觉词语,进而进行图像检索。本发明利用了视觉词语之间的共生性,能够更加有效、快速的产生视觉词语和进行图像检索。
-
公开(公告)号:CN118447103B
公开(公告)日:2025-04-08
申请号:CN202410602716.2
申请日:2024-05-15
Applicant: 北京大学
IPC: G06T7/80 , G06T5/70 , G06T5/90 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06T5/60
Abstract: 基于事件相机引导的直接光照和间接光照分离方法,属于光照分离方法领域,包括:拍摄阴影变化触发的事件信号、灰度初始分离结果估计、灰度初始分离结果优化和光照分离结果颜色补偿。本发明只需在场景中拍摄一张照片与一段事件数据,缩短了数据拍摄时间,可应用到动态场景之中。事件相机的事件触发模型使其能离散地记录场景光照变化中的连续变化信息,在实现高时间分辨率的同时降低了数据吞吐量。本发明成功融合了事件相机和机器视觉传统相机输出的图像,能从单张图像与光照变化触发的事件信号重构出彩色高质量的直接光照和间接光照分离结果。同时使用深度学习方法,有效结合场景图像和事件信号,在高频间接光照场景下拥有更好的分离效果。
-
公开(公告)号:CN117877520A
公开(公告)日:2024-04-12
申请号:CN202311827242.3
申请日:2023-12-27
Applicant: 北京大学深圳研究院
IPC: G10L25/51 , G10L25/03 , G10L25/87 , G10L21/0232
Abstract: 本申请涉及一种声学事件的检测方法、装置、电子设备及存储介质,方法包括:获取待检测音频数据,并确定待检测音频数据对应的至少两个目标增强频谱,其中,每个所述目标增强频谱对应的目标频谱类型不同;对任一所述目标增强频谱进行语音端点检测,确定所述待检测音频数据对应的目标频段;基于所述目标频段和所有所述目标增强频谱,确定所述待检测音频数据对应的声音类型;根据所述目标频段、所述声音类型,以及所有所述目标增强频谱进行声学事件检测,确定所述待检测音频数据对应的声学事件检测结果。由此可以实现提高声学事件检测的准确率和效率。
-
公开(公告)号:CN117808067A
公开(公告)日:2024-04-02
申请号:CN202211166260.7
申请日:2022-09-23
IPC: G06N3/082
Abstract: 本申请涉及一种神经网络剪枝方法及装置,该方法包括:根据收敛模型的第一权值和对照模型的第二权值确定出初始模型的初始权值中对完成目标任务起反作用的目标权值,收敛模型为基于初始模型训练得到的能够完成目标任务的模型,对照模型为基于初始模型训练得到的对完成目标任务起反作用的模型,初始模型为神经网络模型;利用目标权值对初始模型进行剪枝,形成初始模型的稀疏子网,稀疏子网的权值不包括目标权值。提高了剪枝的可靠性,并能够基于稀疏子网获得准确率更高、计算量更小、参数量更少的紧凑的任务模型。
-
公开(公告)号:CN117409093A
公开(公告)日:2024-01-16
申请号:CN202311251217.5
申请日:2023-09-22
Abstract: 本申请公开了一种特征块的压缩方法及相关设备,该方法包括:获取编码器中的注意力层输出的多个特征块;获取每两个特征块之间的第一参数;基于每两个特征块之间的第一参数,确定每个特征块的第二参数;基于每个特征块的第二参数,从多个特征块中确定出对任务重要程度较高的至少一个第一特征块;将多个特征块中的至少一个第二特征块融合到至少一个第一特征块中;至少一个第二特征块为多个图像块中除至少一个第一特征块之外的特征块。本申请实施例能够压缩特征块的数量,提升模型的推理效率。
-
公开(公告)号:CN104362512B
公开(公告)日:2017-09-26
申请号:CN201410539108.8
申请日:2014-10-13
Applicant: 北京大学
Abstract: 本发明涉及光通信技术中发光光源技术领域,尤其涉及一种采用铒镱、铒钇或铒镱钇硅酸盐无机化合物纳米线材料制备低阈值硅基纳米激光器的方法。该制备包括:原料制备;放入煅烧炉,并通入气体;煅烧生长纳米线;制备纳米线酒精溶液,并得到硅基纳米激光器。本文提供一种采用单晶铒镱、铒钇或铒镱钇硅酸盐化合物纳米线作为波导材料,制备硅基纳米激光器的方法。采用本发明提供的制备方法制备的硅基纳米激光器具有较高波导增益,以及较低的泵浦阈值。
-
-
-
-
-
-
-
-
-