-
公开(公告)号:CN115469469A
公开(公告)日:2022-12-13
申请号:CN202211078145.4
申请日:2022-09-05
Applicant: 清华大学
Abstract: 本申请涉及半导体光学芯片技术领域,特别涉及一种半导体光学非线性运算器件、调制方法及运算器,其中,包括:波导、P型半导体与N型半导体,其中,P型半导体与N型半导体分别掺杂在波导的两侧,形成PN结,其中,当施加在PN结上的反偏电压值大于预设阈值时,使得波导处于雪崩临界状态,波导吸收入射光产生光电流触发雪崩,在波导中产生等离子体,并基于等离子体色散效应或热效应等非线性效应改变波导的折射率,实现光强度的非线性调制。由此,解决了相关技术中非线性系数不高、可扩展性不强、功耗高、应用范围小以及弱光非线性不强等问题。
-
公开(公告)号:CN115358389B
公开(公告)日:2024-08-20
申请号:CN202211063580.X
申请日:2022-09-01
Applicant: 清华大学
Abstract: 本申请涉及神经网络技术领域,特别涉及一种神经网络的训练误差降低方法、装置、电子设备及介质,其中,方法包括:确定目标神经网络的每个输出端口的优先级;根据优先级匹配目标神经网络的每个输出端口的误差权重系数,其中,优先级高的输出端口的误差权重系数大于优先级低的输出端口的误差权重系数;根据每个输出端口的误差权重系数计算目标神经网络的训练误差,以进行训练,直至在训练误差满足预设精度条件时,完成目标神经网络的训练。由此,解决了相关技术采用各个输出端口均一权重定义误差函数的训练方法,会导致训练输出结果从低位到高位精度依次递减,无法使所有端口都满足精度要求,且训练时间长,效率低等问题。
-
公开(公告)号:CN115358391A
公开(公告)日:2022-11-18
申请号:CN202211078157.7
申请日:2022-09-05
Applicant: 清华大学
Abstract: 本申请涉及神经网络技术领域,特别涉及一种神经网络的规模拓展方法、装置、电子设备及存储介质,其中,方法包括:确定目标神经网络的实际运算位宽;利用算术逻辑运算训练策略训练目标神经网络运算位宽中小于实际运算位宽的第一规模子网络,得到的权重参数作为运算位宽大于第一规模子网络的第二规模子网络的初始权重参数,训练第二规模子网络,并按照运算位宽由低位至高位的顺序逐级拓展网络规模,直到网络规模的运算位宽达到实际运算位宽,得到目标神经网络的初始权重参数,实现对目标神经网络的训练。由此,解决了相关技术利用整体网络参数初始化的方法,无法充分挖掘算术逻辑运算任务本身的可复用性,训练复杂度高,训练时间长,效率低等问题。
-
公开(公告)号:CN115358390A
公开(公告)日:2022-11-18
申请号:CN202211078131.2
申请日:2022-09-05
Applicant: 清华大学
Abstract: 本申请涉及神经网络技术领域,特别涉及一种神经网络的训练方法、装置、电子设备及存储介质,其中,方法包括:确定待训练的目标神经网络;按照预设拆分策略将目标神经网络拆分成多个结构相同的子网络,并对任意一个子网络进行逻辑运算训练,得到该子网络的权重参数;利用预设拼接策略将每个子网络拼接成整体网络,利用整体网络实现相应的逻辑运算,和/或者,将整体网络的权重参数作为初始权重参数训练目标神经网络,并利用训练完成的目标神经网络实现相应的逻辑运算。由此,解决了相关技术利用整体网络参数初始化的方法,无法充分挖掘逻辑运算任务本身的可复用性,训练复杂度高,训练时间长,效率低等问题。
-
-
-