-
公开(公告)号:CN116739090B
公开(公告)日:2023-11-28
申请号:CN202310539967.6
申请日:2023-05-12
Applicant: 北京大学
IPC: G06F9/48 , G06N5/04 , G06N3/0464
Abstract: 本发明提供了一种基于Web浏览器的深度神经网络推理度量方法和装置,涉及软件技术领域,旨在高效地提高深度神经网络推理任务的吞吐率。所述方法包括:获取参考深度神经网络推理任务;采用二分度量法,确定每种调度方式对应的参考深度神经网络推理任务的最佳切分点,每种调度方式包括:将Web浏览器的WebAssembly运行环境和GPU加速的运行环境分别确定为前序运行环境和后序运行环境中不同的一种;根据每种调度方式对应的最佳切分点,获取每种调度方式对应的周期时间;根据每种调度方式对应的周期时间,确定目标调度方式;根据目标调度方式(56)对比文件高赫然等.面向深度学习训练的内存交换机制综述《.软件学报》.2023,1-25.Martín Manso, R等.Face RecognitionEfficiency Enhancements Using Tensorflowand WebAssembly: A Practical Approach.《Iberoamerican Workshop on Human-ComputerInteraction》.2022,84-97.
-
公开(公告)号:CN116501595B
公开(公告)日:2023-09-12
申请号:CN202310779147.4
申请日:2023-06-29
Applicant: 北京大学
Abstract: 本发明提供了一种Web扩展现实应用的性能分析方法、装置、设备及介质,属于计算机技术领域,获取应用在浏览器运行后生成的性能文件和度量记录;从性能文件和度量记录中分别提取点击事件,并将两个点击事件的时间对齐;对齐后从性能文件中获取首帧加载过程中网络传输事件的第一起止时间、图片解码事件的第二起止时间以及实时资源利用数据;通过将首帧加载时间、第一起止时间、第二起止时间和实时资源利用数据在同一时间轴进行表示,输出首帧加载过程中的各个事件的性能变化曲线图。使得用户可以根据性能变化曲线图直观的看到在网页加载的各个时间阶段的性能变化情况,以及加载过程中每个阶段的时间占用情况,方便用户对应用的性能做出评估。
-
公开(公告)号:CN119273826B
公开(公告)日:2025-04-04
申请号:CN202411803903.3
申请日:2024-12-10
Applicant: 北京大学
Abstract: 本申请提供了一种面向WebGPU的WebGL应用动态翻译方法和装置,包括:获取目标浏览器中WebGL应用程序的第一图形渲染调用指令,基于第一图形渲染调用指令的第一渲染调用类型,对第一图形渲染调用指令进行改写,得到与目标浏览器的WebGPU应用程序适配的第二图形渲染调用指令,对第二图形渲染调用指令进行编译,得到第一图形渲染编码,基于第一图形渲染编码,在WebGPU应用程序中进行图形渲染,得到第一图形,能够使得WebGL应用程序可以利用WebGPU应用程序以实现WebGL应用程序自身的图形渲染需求,从而可以在一定程度上提升WebGL应用程序的图形渲染性能。
-
公开(公告)号:CN116739090A
公开(公告)日:2023-09-12
申请号:CN202310539967.6
申请日:2023-05-12
Applicant: 北京大学
IPC: G06N5/04 , G06N3/0464 , G06F9/48
Abstract: 本发明提供了一种基于Web浏览器的深度神经网络推理度量方法和装置,涉及软件技术领域,旨在高效地提高深度神经网络推理任务的吞吐率。所述方法包括:获取参考深度神经网络推理任务;采用二分度量法,确定每种调度方式对应的参考深度神经网络推理任务的最佳切分点,每种调度方式包括:将Web浏览器的WebAssembly运行环境和GPU加速的运行环境分别确定为前序运行环境和后序运行环境中不同的一种;根据每种调度方式对应的最佳切分点,获取每种调度方式对应的周期时间;根据每种调度方式对应的周期时间,确定目标调度方式;根据目标调度方式以及目标调度方式对应的最佳切分点,对相邻的深度神经网络推理任务进行切分和调度。
-
公开(公告)号:CN119338016A
公开(公告)日:2025-01-21
申请号:CN202411908417.8
申请日:2024-12-24
Applicant: 北京大学
IPC: G06N5/04 , G06F40/284
Abstract: 本申请提供了一种基于WebGPU的Web大语言模型推理加速优化方法和装置,包括:基于目标用户输入的第一文本,生成多个第一推理词元,确定各个第一推理词元分别对应的第一推理算子,生成各个第一推理算子分别对应的第一计算管线,在得到至少一个第一计算管线的情况下,持续将第一计算管线输入WebGPU应用程序,得到WebGPU应用程序持续输出的第一推理文本,基于WebGPU应用程序输出第一推理文本的先后顺序,将第一推理文本进行组合,得到目标推理文本,能够使生成计算管线的过程和得到第一推理文本的过程并行执行,一定程度上可以提升Web大语言模型对WebGPU计算资源的使用率,缩短了推理任务的执行时间,从而可以提升大语言模型的推理效率。
-
公开(公告)号:CN119273826A
公开(公告)日:2025-01-07
申请号:CN202411803903.3
申请日:2024-12-10
Applicant: 北京大学
Abstract: 本申请提供了一种面向WebGPU的WebGL应用动态翻译方法和装置,包括:获取目标浏览器中WebGL应用程序的第一图形渲染调用指令,基于第一图形渲染调用指令的第一渲染调用类型,对第一图形渲染调用指令进行改写,得到与目标浏览器的WebGPU应用程序适配的第二图形渲染调用指令,对第二图形渲染调用指令进行编译,得到第一图形渲染编码,基于第一图形渲染编码,在WebGPU应用程序中进行图形渲染,得到第一图形,能够使得WebGL应用程序可以利用WebGPU应用程序以实现WebGL应用程序自身的图形渲染需求,从而可以在一定程度上提升WebGL应用程序的图形渲染性能。
-
公开(公告)号:CN117893663B
公开(公告)日:2024-06-07
申请号:CN202410281919.6
申请日:2024-03-13
Applicant: 北京大学
IPC: G06T15/00 , G06T3/4038 , G06T5/50
Abstract: 本申请公开了一种基于WebGPU的Web图形渲染性能优化方法、装置、电子设备及计算机可读存储介质,属于计算机领域,包括:获取待渲染图像中所有的物体对象的图形数据;确定每个物体对象的图形单元的图形类型,并确定与图形类型对应的图形渲染方法;根据物体对象的图形类型,将物体对象划分至对应的类别集合;将同一类别集合中包括的物体对象的图像数据进行合并,以获得与类别集合对应的组合数据;将组合数据,以及与组合数据中的图形数据包含的图形单元的类型对应的图形渲染方法发送至图形处理单元,以获得与每个组合数据对应的渲染处理结果。解决了解决Web图形渲染时,传输过程重复,数据处理复杂的问题。
-
公开(公告)号:CN116542334B
公开(公告)日:2023-10-20
申请号:CN202310538682.0
申请日:2023-05-12
Applicant: 北京大学
IPC: G06N5/04 , G06N3/0464 , G06N3/08 , G06F9/48
Abstract: 本发明提供了一种基于Web浏览器的深度神经网络推理调度方法和装置,涉及软件领域。所述方法包括:获取第一深度神经网络推理任务和第二深度神经网络推理任务;按照目标切分方式,将第一深度神经网络推理任务切分为第一前序子任务和第一后序子任务,以及将第二深度神经网络推理任务切分为第二前序子任务和第二后序子任务;按照目标调度方式,确定前序运行环境和后序运行环境,前序运行环境和后序运行环境分别为Web浏览器提供的WebAssembly运行环境和GPU加速的运行环境中的一种;将第一前序子任务和第二前序子任务先后调度到前序运行环境中进行执行,以及将第一后序子任务和第二后序子任务先后调度到后序运行环境中进行执行。
-
公开(公告)号:CN116542334A
公开(公告)日:2023-08-04
申请号:CN202310538682.0
申请日:2023-05-12
Applicant: 北京大学
IPC: G06N5/04 , G06N3/0464 , G06N3/08 , G06F9/48
Abstract: 本发明提供了一种基于Web浏览器的深度神经网络推理调度方法和装置,涉及软件领域。所述方法包括:获取第一深度神经网络推理任务和第二深度神经网络推理任务;按照目标切分方式,将第一深度神经网络推理任务切分为第一前序子任务和第一后序子任务,以及将第二深度神经网络推理任务切分为第二前序子任务和第二后序子任务;按照目标调度方式,确定前序运行环境和后序运行环境,前序运行环境和后序运行环境分别为Web浏览器提供的WebAssembly运行环境和GPU加速的运行环境中的一种;将第一前序子任务和第二前序子任务先后调度到前序运行环境中进行执行,以及将第一后序子任务和第二后序子任务先后调度到后序运行环境中进行执行。
-
公开(公告)号:CN119338016B
公开(公告)日:2025-04-04
申请号:CN202411908417.8
申请日:2024-12-24
Applicant: 北京大学
IPC: G06N5/04 , G06F40/284
Abstract: 本申请提供了一种基于WebGPU的Web大语言模型推理加速优化方法和装置,包括:基于目标用户输入的第一文本,生成多个第一推理词元,确定各个第一推理词元分别对应的第一推理算子,生成各个第一推理算子分别对应的第一计算管线,在得到至少一个第一计算管线的情况下,持续将第一计算管线输入WebGPU应用程序,得到WebGPU应用程序持续输出的第一推理文本,基于WebGPU应用程序输出第一推理文本的先后顺序,将第一推理文本进行组合,得到目标推理文本,能够使生成计算管线的过程和得到第一推理文本的过程并行执行,一定程度上可以提升Web大语言模型对WebGPU计算资源的使用率,缩短了推理任务的执行时间,从而可以提升大语言模型的推理效率。
-
-
-
-
-
-
-
-
-