-
公开(公告)号:CN112801271A
公开(公告)日:2021-05-14
申请号:CN202110088842.7
申请日:2021-01-22
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种生成神经网络的方法、数据处理方法、智能行驶控制方法,该生成神经网络的方法包括:生成超网络对应的树结构;利用从超网络中采样出的多个第一神经网络结构的预测误差,确定第一神经网络结构对应的多个节点的性能参数数据;根据性能参数数据,基于树结构确定多个候选神经网络结构;利用样本数据对多个候选神经网络结构进行测试,根据测试结果从多个候选神经网络结构中确定目标神经网络结构;基于目标神经网络结构生成目标神经网络。
-
公开(公告)号:CN111985644A
公开(公告)日:2020-11-24
申请号:CN202010882925.9
申请日:2020-08-28
Applicant: 北京市商汤科技开发有限公司
Abstract: 本申请提供了一种神经网络生成方法及装置、电子设备和存储介质,其中,首先基于预设负载确定目标神经网络对应的多个通道数配置方案;之后针对每个通道数配置方案,基于预设自由权重和该通道数配置方案中各个网络层所包括的通道数,确定该通道数配置方案下的多种神经网络结构;以及,基于每个通道数配置方案下的每种神经网络结构对应的测量精度,确定目标神经网络中各个网络层所包括的目标通道数,最后基于目标神经网络中各个网络层所包括的目标通道数,生成目标神经网络。本申请利用预设自由权重在一定自由度范围内选取通道进行通道数学习,提高了神经网络通道数学习的质量和搜索效率,从而提高了生成的目标神经网络的精确度和速度。
-
公开(公告)号:CN111985644B
公开(公告)日:2024-03-08
申请号:CN202010882925.9
申请日:2020-08-28
Applicant: 北京市商汤科技开发有限公司
IPC: G06N3/0985 , G06N3/04
-
公开(公告)号:CN111985645A
公开(公告)日:2020-11-24
申请号:CN202010882930.X
申请日:2020-08-28
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种神经网络的训练方法、装置、电子设备及存储介质,该方法包括:获取训练图像集和预先设置的多种网络通道数配置方案;基于每种网络通道数配置方案,确定待训练神经网络在该种网络通道数配置方案下参与处理的处理通道构成的双向耦合网络结构;所述双向耦合网络结构包括具有正向通道序列的网络结构和具有反向通道序列的网络结构构成的一对网络结构,所述待训练神经网络的同一卷积层的正向通道序列和反向通道序列包含的处理通道数目相同;基于所述训练图像集对所述待训练神经网络在每种网络通道数配置方案下对应的双向耦合网络结构的网络进行训练,得到训练完成的神经网络。
-
公开(公告)号:CN112801271B
公开(公告)日:2023-04-07
申请号:CN202110088842.7
申请日:2021-01-22
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种生成神经网络的方法、数据处理方法、智能行驶控制方法,该生成神经网络的方法包括:生成超网络对应的树结构;利用从超网络中采样出的多个第一神经网络结构的预测误差,确定第一神经网络结构对应的多个节点的性能参数数据;根据性能参数数据,基于树结构确定多个候选神经网络结构;利用样本数据对多个候选神经网络结构进行测试,根据测试结果从多个候选神经网络结构中确定目标神经网络结构;基于目标神经网络结构生成目标神经网络。
-
公开(公告)号:CN113344181B
公开(公告)日:2022-10-18
申请号:CN202110602497.4
申请日:2021-05-31
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种神经网络的结构搜索方法、装置、计算机设备及存储介质,其中,该方法包括:基于视觉深度自注意力变换ViT网络的结构参数,构造与ViT网络对应的超大神经网络的搜索空间,其中,超大神经网络的搜索空间包括多个处理块层,每个处理块层包括至少一个由多头自注意力机制层和多层感知机构造的处理块;基于搜索空间和图像样本集对超大神经网络进行结构搜索,得到ViT网络的目标搜索路径,目标搜索路径包括多个处理块层中的每一个处理块层的一个处理块;基于目标搜索路径,确定用于处理图像数据的ViT网络的结构。这样,可以较为准确地确定ViT网络的结构,以得到性能更好的ViT网络结构,提升ViT网络的处理精度。
-
公开(公告)号:CN113344181A
公开(公告)日:2021-09-03
申请号:CN202110602497.4
申请日:2021-05-31
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种神经网络的结构搜索方法、装置、计算机设备及存储介质,其中,该方法包括:基于视觉深度自注意力变换ViT网络的结构参数,构造与ViT网络对应的超大神经网络的搜索空间,其中,超大神经网络的搜索空间包括多个处理块层,每个处理块层包括至少一个由多头自注意力机制层和多层感知机构造的处理块;基于搜索空间和图像样本集对超大神经网络进行结构搜索,得到ViT网络的目标搜索路径,目标搜索路径包括多个处理块层中的每一个处理块层的一个处理块;基于目标搜索路径,确定用于处理图像数据的ViT网络的结构。这样,可以较为准确地确定ViT网络的结构,以得到性能更好的ViT网络结构,提升ViT网络的处理精度。
-
公开(公告)号:CN113326922B
公开(公告)日:2023-06-13
申请号:CN202110602323.8
申请日:2021-05-31
Applicant: 北京市商汤科技开发有限公司
IPC: G06N3/045 , G06N3/0475 , G06N3/084
Abstract: 本公开提供了一种神经网络的生成方法、装置、电子设备及存储介质。其中,该方法包括:从基于多个结构相同的超大神经网络确定的路径搜索空间中,确定待训练路径;基于所述待训练路径中的各个算子分别在多个所述超大神经网络中的第一算子内参、以及所述待训练路径分别在多个所述超大神经网络中的路径权重,确定所述待训练路径中各算子在所述待训练路径中的第二算子内参;利用所述第二算子内参,对多个所述超大神经网络进行本轮训练;基于多轮训练后的多个所述超大神经网络,生成目标神经网络。
-
公开(公告)号:CN113326922A
公开(公告)日:2021-08-31
申请号:CN202110602323.8
申请日:2021-05-31
Applicant: 北京市商汤科技开发有限公司
Abstract: 本公开提供了一种神经网络的生成方法、装置、电子设备及存储介质。其中,该方法包括:从基于多个结构相同的超大神经网络确定的路径搜索空间中,确定待训练路径;基于所述待训练路径中的各个算子分别在多个所述超大神经网络中的第一算子内参、以及所述待训练路径分别在多个所述超大神经网络中的路径权重,确定所述待训练路径中各算子在所述待训练路径中的第二算子内参;利用所述第二算子内参,对多个所述超大神经网络进行本轮训练;基于多轮训练后的多个所述超大神经网络,生成目标神经网络。
-
-
-
-
-
-
-
-