-
公开(公告)号:CN119484947A
公开(公告)日:2025-02-18
申请号:CN202411606840.2
申请日:2024-11-11
Applicant: 上海哔哩哔哩科技有限公司
IPC: H04N21/81 , G06F16/738 , G06V20/40 , G06V20/30 , G06N20/00 , G06F16/783 , G06F16/78 , H04N21/488 , H04N21/439 , H04N21/44 , H04N21/234 , H04N21/233
Abstract: 本申请实施例公开了一种视频标题生成方法及装置。其中,方法包括:获取待处理视频中的多模态数据,其中,多模态数据包含:视频帧及音频数据;根据多模态数据确定视频标题提示关键词,并根据视频标题提示关键词,生成视频标题提示信息,将视频标题提示信息及多模态数据输入至预先训练的多模态大语言模型,生成待处理视频对应的视频标题。由此,可以利用多模态大语言模型结合视频内容的多模态数据自动生成视频标题,使得所生成的视频标题与视频内容高度契合,所生成的视频标题既能准确反映视频内容又能吸引用户点击,从而提高了视频稿件的生产效率及分发效果,提升用户体验度,同时还节省了人力物力成本。
-
公开(公告)号:CN118972639A
公开(公告)日:2024-11-15
申请号:CN202410942213.X
申请日:2024-07-12
Applicant: 上海哔哩哔哩科技有限公司
IPC: H04N21/234 , H04N21/44
Abstract: 本申请提供了一种抽取视频参考帧的方法、相关装置及计算机程序产品,该申请抽取目标视频的第一帧和最后一帧,得到作为首轮抽取结果的第一参考帧集合;循环执行以下抽取过程至达到目标轮次后跳出,得到与各个抽取轮次相对应的第二参考帧集合:基于历史抽取轮次的抽取结果,得到与本抽取轮次对应的第二参考帧集合,其中,本轮次的第二参考帧集合中的参考帧在目标视频中的位置,位于基于已经被抽取出的相邻的历史参考帧所确定的帧区间内;响应于达到目标轮次后跳出,将第一参考帧集合和各个第二参考帧集合对应于目标视频存入参考帧数据库,其中,参考帧数据库用于响应业务方发送的参考帧调取请求,为业务方提供针对目标视频的一组参考帧集合。这样的方式,能够在获取视频后,预先通过“梯度”采集的方式,来抽取、存储参考帧。由此,使得对于各类视频均能够均匀地被采集参考帧,保障采集质量的同时,降低业务方等参考帧需求方的获取消耗,便捷、效率地为其提供所需要的参考帧。
-