-
公开(公告)号:CN116964599A
公开(公告)日:2023-10-27
申请号:CN202280006555.X
申请日:2022-02-25
IPC: G06N20/00
Abstract: 本发明介绍了训练机器学习模型生成基于光探测和测距(LiDAR)点云的三维(3D)动作的系统和方法。在各个实施例中,计算系统可以对代表场景中对象的机器学习模型进行编码。所述计算系统可以使用数据集训练所述机器学习模型,所述数据集包括单目LiDAR传感器捕捉到的同步LiDAR点云以及从IMU设备获得的地面实况三维运动。机器学习模型可以基于单目LiDAR传感器捕捉到的多个点云帧的输入生成对象的三维动作。
-
公开(公告)号:CN117178298A
公开(公告)日:2023-12-05
申请号:CN202280006556.4
申请日:2022-03-03
Abstract: 本申请的实施例提供了一种在场景中捕捉、优化人体动作的方法及动作捕捉系统。该捕捉人体动作的方法包括:在人体上安装多个IMU设备和一个LiDAR传感器。利用所述IMU设备捕捉IMU数据,同时利用所述LiDAR传感器捕捉LiDAR数据。根据所述IMU数据和所述LiDAR数据对人体动作进行估计,根据所述LiDAR数据构建三维场景图。进行优化,获得优化的人体动作和优化的场景图。
-
公开(公告)号:CN113409186B
公开(公告)日:2024-11-22
申请号:CN202110731039.0
申请日:2021-06-30
Applicant: 上海科技大学
IPC: G06T3/04 , G06T9/00 , G06N3/0464 , G06N3/0455 , G06N3/088 , G06N3/09
Abstract: 本申请提供基于先验知识的单张图片重打光方法、系统、终端及存储介质,包括:给定用于重打光的物体图片及作为环境光的全景图片;将所述物体图片和全景图片输入基于先验知识的卷积神经网络;通过所述卷积神经网络的编码器,提取物体图片中物体的高维度特征和所处环境光;将提取出的所处环境光替换为给定的环境光,并将作为环境光的图片与提取到的高维度特征输入所述卷积神经网络中的解码器,并在所述编码器和解码器中布置跳跃连接,据以获得重打光图片。本发明没有前置需求,无需在穹顶光场中预先拍摄所有光纤;渲染快,卷积神经网络在现有硬件条件下可达到实时;相比穹顶光场对于单个物体重打光需要的数个GB,本发明所占用的空间仅为数十MB。
-
公开(公告)号:CN115379104B
公开(公告)日:2024-07-16
申请号:CN202110541401.8
申请日:2021-05-18
Applicant: 上海科技大学
Abstract: 本发明的基于三维打光的数据采集系统,通过信号同步装置向光源控制器及高速图像采集装置发送同步信号,以令布置于球形框架上的大量光源对被采集物体打出特定的三维光场,并同时控制高速相机对不同光场下的物体进行拍摄,从而获得被拍摄物体在不同光照条件下的图像数据。本发明相比于采用大量光源同时进行打光,减少了数据采集时间,有着较高的采集效率,不仅提高了精度还增加了可维护性,解决了现有技术的问题。
-
公开(公告)号:CN118140243A
公开(公告)日:2024-06-04
申请号:CN202180103457.3
申请日:2021-12-09
Applicant: 上海科技大学
Abstract: 本发明描述了一种用于渲染图像的计算核。计算核包括位置编码逻辑和在流水线中串联连接的多个流水线逻辑。位置编码逻辑被配置为将与图像的一部分相对应的采样点的坐标和方向变换为高维表示。多个流水线逻辑被配置为基于坐标的高维表示和方向的高维表示在一个流水线循环中输出与图像的该部分相对应的像素的强度值及颜色值。多个流水线逻辑被配置为并行运行。本文描述了一种计算机实现的方法。计算系统被配置为将待渲染图像划分成多行图像部分。计算系统针对每个图像部分获得与图像部分的像素相对应的采样点的坐标和方向。计算系统针对每个图像部分将坐标和方向变换为高维表示。计算系统通过计算核来确定像素的强度值和颜色值。计算系统基于多行图像部分的像素的强度值和颜色值来重建图像。
-
-
公开(公告)号:CN116579397A
公开(公告)日:2023-08-11
申请号:CN202310397322.3
申请日:2023-04-13
Applicant: 上海科技大学
Abstract: 本发明公开了一种全光非线性神经元,其特征在于,包括隔离器、激光器和滤波器。本发明仅包含半导体激光器、隔离器和滤波器三种主要器件,不需要光电和光电转换的过程,因此具有装置简单、能耗低的优势。由于神经元中的激光器能够提供能量,因此适用于具有多层深度的复杂神经网络,不会出现层数增加激光功率下降的问题,所以具有可拓展性好的优势。本发明提供的神经元不仅能够处理脉冲信号也能够处理连续波信号,因此同时适用于脉冲型和非脉冲型的神经网络。另外,本发明中的神经元工作区间大,因此具有灵活性和可靠性高的优势。
-
公开(公告)号:CN110462679B
公开(公告)日:2022-12-09
申请号:CN201780088856.0
申请日:2017-05-19
Applicant: 上海科技大学
Inventor: 虞晶怡
IPC: G06T5/00
Abstract: 公开了一种生成高分辨率多光谱光场的方法。该方法可包括:拍摄包括多幅子视角图像的多视角光谱图像;对各子视角图像进行对齐和变形,以获得低分辨率多光谱光场;获得高分辨率信号集和低分辨率信号集;根据所述低分辨率多光谱光场和低分辨率信号集,获得稀疏表示形式;以及利用所述稀疏表示形式和所述高分辨率信号集,生成高分辨率多光谱光场。每幅子视角图像均摄于不同视角和不同光谱范围。所述多视角光谱图像通过单次曝光获得。
-
公开(公告)号:CN114513674A
公开(公告)日:2022-05-17
申请号:CN202011279623.9
申请日:2020-11-16
Applicant: 上海科技大学
IPC: H04N21/218 , H04N21/6587 , H04N21/234 , H04N21/232 , H04N21/845 , H04N21/2187 , H04N19/597 , H04N13/161 , H04N13/194
Abstract: 本发明提供一种互动直播数据传输/处理方法、处理系统、介质及服务端,所述互动直播数据传输方法包括:服务端对待播放的当前视角视频解码,并传输至客户端;客户端在播放当前视角视频过程中,监测是否存在视角切换需求;若是,生成一视角切换指令,并将视角切换指令传输至服务端;服务端接收所述视角切换指令,解析视角切换指令;根据视角切换指令,生成转场视频及查找与视角切换指令匹配的目标视角视频,并将转场视频及目标视角视频传输至客户端;待客户端接收到转场视频及目标视角视频后,予以依次播放。本发明可以使视频流在传输过程中,节省传输带宽,从而实现高效的互动直播。
-
公开(公告)号:CN114260894A
公开(公告)日:2022-04-01
申请号:CN202111579561.8
申请日:2021-12-22
Applicant: 上海科技大学 , 广东溢达纺织有限公司
Abstract: 本发明提供一种全自动采棉机器人及控制方法,通过根据地理信息获取装置采集的当前位置信息以及棉花田地理信息控制驱动装置驱动所述全自动采棉机器人进行相应的移动以及根据视觉图像采集装置采集的棉花植株图像控制所述多自由度机械臂移动至一目标位置,以供控制棉花采摘装置在该目标位置进行棉花采摘,以实现自主移动和采摘功能,具有轻便、结构简单、成本低廉、采收效率高以及采摘质量好的优势。
-
-
-
-
-
-
-
-
-