一种光学神经网络全光非线性激活层及其实现方法

文档序号:532086 发布日期:2021-06-01 浏览:42次 >En<

阅读说明:本技术 一种光学神经网络全光非线性激活层及其实现方法 (Optical neural network all-optical nonlinear activation layer and implementation method thereof ) 是由 廖琨 戴天翔 胡小永 龚旗煌 于 2021-03-24 设计创作,主要内容包括:本发明公开了一种光学神经网络全光非线性激活层及其实现方法。本发明通过将MZI波导构型与石墨烯异质增强的Bi-2Te-3非线性材料相结合,利用片上波导结构设计进一步放大石墨烯异质增强的Bi-2Te-3材料的非线性响应,完成了片上集成非线性激活层的设计,实现了片上集成波导中进行光学非线性计算,解决了光学非线性材料非线性程度较弱的问题,扩展了光学神经网络的功能,为多层纯光学神经网络的使用提供了可能;本发明提出的光学非线性激活层不仅能够用于片上集成光学神经网络,还能够用于其他集成光学信号处理平台中需要使用非线性计算的场景,且响应速度极快,能够满足低能耗高速计算的需求。(The invention discloses an optical neural network all-optical nonlinear activation layer and an implementation method thereof. According to the invention, the MZI waveguide configuration and graphene heteroenhancement Bi are adopted 2 Te 3 Nonlinear material combination, and on-chip waveguide structure design is utilized to further amplify graphene heteroenhancement Bi 2 Te 3 The nonlinear response of the material completes the design of the on-chip integrated nonlinear activation layer, realizes the optical nonlinear calculation in the on-chip integrated waveguide, solves the problem of weak nonlinear degree of the optical nonlinear material, expands the functions of the optical neural network and provides possibility for the use of a multilayer pure optical neural network; the invention provides an optical nonlinear active layerThe method can be used for not only an on-chip integrated optical neural network, but also scenes needing nonlinear calculation in other integrated optical signal processing platforms, has extremely high response speed, and can meet the requirements of low energy consumption and high speed calculation.)

一种光学神经网络全光非线性激活层及其实现方法

技术领域

本发明涉及光学信号处理技术,具体涉及一种用于片上光学神经网络中全光非线性激活层的设计和实现方法。

背景技术

在大部分现有片上集成波导的光学神经网络及其他片上光学计算平台设计中的主要结构为分束波导单元及级联的马赫曾德干涉仪Mach-Zehnder interferometers(MZI),其只适用于线性计算。由于线性计算的叠加仍然是线性计算,上述设计无论总层数如何,它的计算结果都可以等同于一次矩阵乘法操作,参数范围受限,不能满足神经网络对数据进行拟合的需求。故此种光学神经网络依赖于后续信息处理过程中在电子电路中进行进一步的非线性计算,不能在光学平台上集成完整的神经网络的功能。目前光学非线性材料的非线性响应较弱,对信号的调制深度不够;另外,超快的响应时间和巨大的非线性之间常常呈现出一种固有的折衷,使得较大的非线性系数通常只能以较慢的响应时间为代价。所以在大规模光硬件平台的移植过程中很难实现高效可行的非线性计算,因此光学非线性激活层只停留在理论概念,还不能实现现实应用。

另一部分片上光学神经网络设计中使用相变材料来引入非线性计算,例如锗锑碲合金(GST)。具体实现为将GST材料覆盖于波导上,由于GST材料非晶态透光率较高,而晶态透光率较低,且在光的热效应影响下可使用弱脉冲加热材料使之从非晶态复原为晶态,也可以用强脉冲快速加热后冷却使之从晶态转换为非晶态,在此两种状态之间存在一个临界光强,在此临界光强以上才会发生GST材料晶态向非晶态转化的过程,且转化率与光强正相关。因此可以使用此种材料相变的临界光强为波导中传播的光强设定阈值,当且仅当脉冲总强度超过这一阈值时才能通过材料,由此进行非线性计算。但是此种相变材料具有非易失性,如果上一次脉冲超过阈值使之进入非晶态,则需要额外输入能量复位至晶态,因而不能连续进行操作,响应时间和能耗都不能满足高速计算的需求。

在光学平台上难以进行非线性计算的原因在于材料的全光非线性效应较弱,缺乏具备足够强的非线性材料,难以在片上集成器件中实现较强的非线性效应;而可以用于非线性计算的GST材料具有非易失特性,同样不适用于快速响应的高效计算。因此,目前对于意在硬件平台实现具有超快时间响应和超低能耗的光学神经网络来说,全光非线性激活层的真正引入还是一个亟待解决的问题。

发明内容

针对以上现有技术中存在的问题,本发明提出了一种基于Bi2Te3材料的光学神经网络全光非线性激活层,解决了光学非线性材料非线性响应较弱的问题,扩展了光学神经网络的功能,为多层纯光学神经网络的实现提供了可能。

本发明的一个目的在于提出一种基于Bi2Te3材料的光学神经网络全光非线性激活层。

本发明的基于Bi2Te3材料的光学神经网络全光非线性激活层包括多个单元结构,每一个单元结构包括:波导结构、第一电控相移器、石墨烯异质增强的Bi2Te3非线性材料和第二电控相移器;其中,波导结构包括波导分束器、第一上支路波导、第一下支路波导、定向耦合器、第二上支路波导和第二下支路波导,通过波导分束器的输出端分成光强均等的两路支路波导,分别为第一上支路波导和第一下支路波导,第一上支路波导和第一下支路波导的末端耦合进入定向耦合器;定向耦合器的输出端分成两路支路波导,分别为第二上支路波导和第二下支路波导;在第一上支路波导上设置第一电控相移器;在第二上支路波导上覆盖单层石墨烯,在单层石墨烯上再沉积一层碲化铋Bi2Te3,实现了单层石墨烯-碲化铋的异质结构,从而得到石墨烯异质增强的Bi2Te3非线性材料;石墨烯异质增强的Bi2Te3非线性材料的异质结构中的载流子弛豫变得比碲化铋中的更快,并且能显著提高光吸收强度,有利于增强光非线性,提高调制深度;在第二下支路波导上设置第二电控相移器;第二上支路波导和第二下支路波导的末端合束;由此,整个单元结构构成一个马赫曾德干涉仪结构;将多个马赫曾德干涉仪结构的波导分束器的输入端与分别与对应的线性计算单元波导的输出端相连,从而构成光学神经网络全光非线性激活层;

从波导分束器的输入端输入的光信号,通过波导分束器的输出端分为光强均等的两路,一路通过设置有第一电控相移器的第一上支路波导,一路通过第一下支路波导,通过调节第一电控相移器的电压在第一上支路波导中引入相位差,两路再经定向耦合器耦合,从而实现耦合之后的两路中任意光强的分束比;两路分别通过设置有石墨烯异质增强的Bi2Te3非线性材料的第二上支路波导和设置有第二电控相移器的第二下支路波导,通过调节第二电控相移器的电压,使得第二上支路波导的光信号与第二下支路波导的光信号具有相位差π,从而抵消掉碲化铋对光信号的线性吸收部分,由此放大碲化铋对光信号的非线性吸收部分,最终合束为一路后,即得到对光信号的非线性透过部分;将多个马赫曾德干涉仪结构的波导分束器的输入端与线性计算单元波导的输出端相连,作为非线性激活层使用,由此在片上光学神经网络中引入光学非线性计算。

波导结构是在绝缘衬底上沉积波导材料,再刻蚀波导材料形成的脊形波导或狭缝波导;刻蚀掉绝缘衬底上波导材料的其他部分,保留下来的部分形成脊形波导;或者,刻蚀绝缘衬底上波导材料,被刻蚀的部分形成狭缝波导。

波导材料采用与互补金属氧化物半导体(CMOS)工艺相兼容的通讯波段低传输损耗的半导体材料,传输损耗<3dB/cm,如硅或氮化硅。

波导结构的厚度为70~220nm,宽度为400~500nm。波导分束器的输出端连接至第一上支路波导和第一下支路波导的部分分别由两段圆弧拼成,以降低转弯时所引入的弯曲损耗。

碲化铋的厚度为10~20nm,面积不小于2μm×2μm。

作为新型的可饱和吸收材料,碲化铋具有很高的调制深度,在1570nm波长处调制深度达到70%。但是研究它的瞬态载流子动力学发现其带内和带间电子弛豫时间很长,分别超过500fs和5ps。而作为典型的可饱和吸收体,石墨烯能在很宽的工作波长范围内发生饱和吸收并具有超快恢复时间,带内弛豫时间<150fs,带间电子弛豫时间~1.5ps。但由于一个原子层的吸收强度相对较低,单层石墨烯的光学调制深度非常低,通常在1%左右。尽管增加石墨烯层的数量可以提高调制深度,但不必要的不饱和损耗也会随之增加,这对于实际应用是不太可取的。

类似于金属-半导体接触形式的在单层石墨烯上沉积碲化铋形成异质结构,在其界面上电子从石墨烯转移到碲化铋。基于这种特殊的能量结构,预测一些光学性质,即由于石墨烯的零带隙和碲化铋的小带隙,异质结构应该具有从可见光到红外的宽带吸收特性;并且这种异质结构中载流子动力学发生了改变。因为石墨烯的出现为光激发载流子的弛豫提供了一个快速通道,即碲化铋中的光激发载流子由于层间相互作用引起的能带弯曲而注入到石墨烯中,成为“狄拉克费米子”。直接结果是,与纯碲化铋相比,异质结构中的载流子弛豫将变得更快,并且能显著提高光吸收强度,有利于增强光非线性,提高调制深度。

结合碲化铋的带隙和石墨烯的光学特性可以得知,石墨烯异质增强的Bi2Te3非线性材料的透光率α(I)用如下方程表述:其中αS和αNS分别为可饱和和不可饱和的吸收率,I和IS分别为输出光强和饱和光强;此种材料对光的吸收存在饱和特性,其吸收率随光强增大而降低,最终趋于一常数,且其弛豫时间为皮秒量级,可近似认为不具有记忆特性,在每次使用之后都会自行快速复位,无需继续输入能量,因此适合于高速计算中使用。然而这种材料的非线性程度尽管强于通常材料,但与线性的偏离程度还是较小,直接应用于片上计算时效应不明显,对计算过程不利。

本发明的另一个目的在于提出一种基于Bi2Te3材料的光学神经网络全光非线性激活层的实现方法。

本发明的基于Bi2Te3材料的光学神经网络全光非线性激活层的实现方法,包括以下步骤:

1)结构制备:

在绝缘衬底上形成波导结构,波导结构包括波导分束器、第一上支路波导、第一下支路波导、定向耦合器、第二上支路波导和第二下支路波导,通过波导分束器的输出端分成光强均等的两路支路波导,分别为第一上支路波导和第一下支路波导,第一上支路波导和第一下支路波导的末端耦合进入定向耦合器;定向耦合器的输出端分成两路支路波导,分别为第二上支路波导和第二下支路波导;在第一上支路波导上设置第一电控相移器;在第二上支路波导上覆盖单层石墨烯,在单层石墨烯上再沉积一层碲化铋Bi2Te3,实现了单层石墨烯-碲化铋的异质结构,从而得到石墨烯异质增强的Bi2Te3非线性材料;石墨烯异质增强的Bi2Te3非线性材料的异质结构中的载流子弛豫变得比碲化铋中的更快,并且能显著提高光吸收强度,有利于增强光非线性,提高调制深度;在第二下支路波导上设置第二电控相移器;第二上支路波导和第二下支路波导的末端合束;由此,整个单元结构构成一个马赫曾德干涉仪结构;将多个马赫曾德干涉仪结构的波导分束器的输入端与分别与对应的线性计算单元波导的输出端相连,从而构成光学神经网络全光非线性激活层;

2)从波导分束器的输入端输入的光信号,通过波导分束器的输出端分为光强均等的两路,一路通过设置有第一电控相移器的第一上支路波导,一路通过第一下支路波导,通过调节第一电控相移器的电压在第一上支路波导中引入相位差,两路再经定向耦合器耦合,从而实现耦合之后的两路中任意光强的分束比;

3)两路分别通过设置有石墨烯异质增强的Bi2Te3非线性材料的第二上支路波导和设置有第二电控相移器的第二下支路波导,通过调节第二电控相移器的电压,使得第二上支路波导的光信号与第二下支路波导的光信号具有相位差π,从而抵消掉碲化铋对光信号的线性吸收部分,由此放大碲化铋对光信号的非线性吸收部分,最终合束为一路后,即得到对光信号的非线性透过部分;

4)将多个马赫曾德干涉仪结构的波导分束器的输入端与线性计算单元波导的输出端相连,作为非线性激活层使用,由此在片上光学神经网络中引入光学非线性计算。

其中,在步骤1)中,波导结构是在绝缘衬底上沉积波导材料,再刻蚀波导材料形成脊形波导或狭缝波导;其中,刻蚀掉绝缘衬底上波导材料的其他部分,保留下来的部分形成脊形波导;或者,刻蚀绝缘衬底上波导材料,被刻蚀的部分形成狭缝波导。

波导材料采用与互补金属氧化物半导体(CMOS)工艺相兼容的通讯波段低传输损耗的半导体材料,传输损耗<3dB/cm。

本发明的优点:

本发明通过将MZI波导构型与石墨烯异质增强的Bi2Te3非线性材料相结合,利用片上波导结构设计进一步放大石墨烯异质增强的Bi2Te3材料的非线性响应,完成了片上集成非线性激活层的设计,实现了片上集成波导中进行光学非线性计算,解决了光学非线性材料非线性程度较弱的问题,扩展了光学神经网络的功能,为多层纯光学神经网络的使用提供了可能;本发明提出的光学非线性激活层不仅能够用于片上集成光学神经网络,还能够用于其他集成光学信号处理平台中需要使用非线性计算的场景,且响应速度极快,能够满足低能耗高速计算的需求。

附图说明

图1为本发明的基于Bi2Te3材料的光学神经网络全光非线性激活层的单元结构的一个实施例的示意图;

图2为本发明的基于Bi2Te3材料的光学神经网络全光非线性激活层的一个实施例的使用MZI结构修正前后碲化铋的输入输出功率关系对比图。

具体实施方式

下面结合附图,通过具体实施例,进一步阐述本发明。

如图1所示,本实施例的基于Bi2Te3材料的光学神经网络全光非线性激活层包括多个单元结构,每一个单元结构包括:波导结构、第一电控相移器PS1、石墨烯异质增强的非线性材料BiTe和第二电控相移器PS2;其中,刻蚀绝缘衬底上的硅SOI(Silicon-On-Insulator)形成脊形波导的波导结构,波导结构包括波导分束器BS、第一上支路波导、第一下支路波导、定向耦合器(Directional Coupler,DC)、第二上支路波导和第二下支路波导,波导分束器输出端连接至第一上支路波导和第一下支路波导的部分分别由两段圆弧拼成,为降低转弯时所引入的弯曲损耗,每段圆弧曲率半径设计为20μm,通过波导分束器的输出端分成光强均等的两路支路波导,分别为第一上支路波导和第一下支路波导,第一上支路波导和第一下支路波导的末端耦合进入定向耦合器;定向耦合器的输出端分成两路支路波导,分别为第二上支路波导和第二下支路波导,波导的厚度为220nm,宽度为500nm;在第一上支路波导上设置第一电控相移器;在第二上支路波导上覆盖单层石墨烯,在单层石墨烯上再沉积一层碲化铋Bi2Te3,碲化铋的厚度为20nm,面积为2μm×2μm实现了单层石墨烯-碲化铋的异质结构,从而得到石墨烯异质增强的Bi2Te3非线性材料;石墨烯异质增强的Bi2Te3非线性材料的异质结构中的载流子弛豫变得比碲化铋中的更快,并且能显著提高光吸收强度,有利于增强光非线性,提高调制深度;在第二下支路波导上设置第二电控相移器;第二上支路波导和第二下支路波导的末端合束。整个单元结构构成一个马赫曾德干涉仪结构;将多个马赫曾德干涉仪结构的波导分束器的输入端与分别与对应的线性计算单元波导的输出端相连,从而构成光学神经网络全光非线性激活层,马赫曾德干涉仪结构的数量与线性计算单元波导的数量一致。

从波导分束器的输入端输入的光信号,通过波导分束器的输出端分为光强均等的两路,一路通过设置有第一电控相移器的第一上支路波导,一路通过第一下支路波导,通过调节第一电控相移器的电压在第一上支路波导中引入相位差,两路再经定向耦合器耦合,从而实现耦合之后的两路比例为1.79:1的光强分束比;两路光信号分别通过设置有石墨烯异质增强的Bi2Te3非线性材料的第二上支路波导和设置有第二电控相移器的第二下支路波导,通过调节第二电控相移器的电压,使得第二上支路波导的光与第二下支路波导的光信号具有相位差π,从而抵消掉碲化铋对光信号的线性吸收部分,由此放大碲化铋对光信号的非线性吸收部分,最终合束为一路后,即得到对光信号的非线性透过部分。

合束之后的光信号从最右端输出端输出,得到如图2实线所示的输入输出光强的关系曲线,可以看到与没有利用片上MZI波导结构设计进一步放大的非线性的(修正前的)输入输出功率响应相比,碲化铋的非线性效应得到了较大的增强。

多个纵向排列为一维阵列的马赫曾德干涉仪结构,置于线性计算单元的末端,作为非线性激活层使用,由此在片上光学神经网络中引入光学非线性计算。

最后需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:面板、显示模组及显示模组的显示视角控制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!