基于多梯度神经网络的半导体器件特性建模方法和系统

文档序号:830067 发布日期:2021-03-30 浏览:17次 >En<

阅读说明:本技术 基于多梯度神经网络的半导体器件特性建模方法和系统 (Semiconductor device characteristic modeling method and system based on multi-gradient neural network ) 是由 陆叶 杨启航 齐国栋 于 2020-12-03 设计创作,主要内容包括:本发明属于集成电路半导体技术领域,具体为一种基于多梯度神经网络的半导体器件特性建模方法和系统。在现存的基于神经网络的半导体器件建模方法之上,提出了利用神经网络反向传播中梯度的特性来拟合半导体器件的电导、电荷量变化曲线的方案,该建模方案能够高精度地表达晶体管电导特性和电容特性。基于该建模方开发的建模软件系统,只需点击相关功能按钮并设置合适的参数,就自动化地能完成繁琐的模型建立、模型练训、模型测试等过程;本发明方法大大提高了半导体器件的建模精度,降低了建模难度,缩短了建模周期,为半导体器件的建模与仿真提供了更准确、便捷、快速的方案。(The invention belongs to the technical field of integrated circuit semiconductors, and particularly relates to a semiconductor device characteristic modeling method and system based on a multi-gradient neural network. On the basis of the existing neural network-based semiconductor device modeling method, a scheme for fitting a conductance and charge quantity change curve of a semiconductor device by using the characteristics of the gradient in the back propagation of the neural network is provided, and the modeling scheme can express the conductance characteristics and the capacitance characteristics of a transistor with high precision. Based on the modeling software system developed by the modeling party, the complex processes of model establishment, model training, model testing and the like can be automatically completed only by clicking relevant function buttons and setting appropriate parameters; the method greatly improves the modeling precision of the semiconductor device, reduces the modeling difficulty, shortens the modeling period, and provides a more accurate, convenient and rapid scheme for the modeling and simulation of the semiconductor device.)

基于多梯度神经网络的半导体器件特性建模方法和系统

技术领域

本发明属于半导体器件仿真技术领域,具体涉及一种基于多梯度神经网络的半导体器件特性建模方法和系统。

背景技术

新型半导体器件需要做电路级仿真测试来评估晶体管在电路中的各项性能。这一仿真过程需要对器件建立准确的数学模型,其目的是找到一个数学函数关系式,来映射器件的输入输出关系。基于人工神经网络的半导体器件建模方法,可以根据测量数据对器件进行快速、准确的建模而不用过于关注其内部结构,避免了在建模过程对研究人员物理知识及建模经验的过度依赖,可以大大缩短建模周期。

现存的基于神经网络的建模方案存在两个问题:1)在对器件的各个等效器件建模时,现有的方法只拟合了输入与输出的直接特性而对于其导数、积分特性则没有进行考虑。如对于一个场效应晶体管包含的等效电流源,现有方法使用神经网络拟合其Ids-Vgs和Ids-Vds动态负载线对其进行建模,建模后通过模型输出的Ids对Vgs/Vds求一阶导得到Gm/Gds,但是在Ids变化缓慢的电压区间里,神经网路拟合Ids时1%的误差会使得Gm/Gds变化几十倍甚至几百倍!这样导致了最后建立的模型只能准确的拟合Ids特性,而对于Gm/Gds特性的拟合精度很差。要准确的对器件进行建模,需要一种能够同时拟合晶体管输入输出特性和输入输出导数特性的建模方案来解决以上问题。2)基于神经网络的器件建模过程需要大量的机器学习知识,以及繁琐的训练、验证、数据制图和模型的数学函数关系式推导过程,这些步骤会在建模过程中耗费研究人员大量的精力和时间。

发明内容

针对现有技术的不足,本发明提出了一种基于多梯度神经网络的新型半导体器件特性建模方法。本发明利用神经网络中输出关于输入的梯度是输出关于输入的导数这一特性,通过多梯度神经网络同时拟合半导体器件的输入输出特性及输出关于输入的导数、积分特性,从而达到对半导体器件特性进行准确建模的目的。本发明的技术方案具体介绍如下。

一种基于多梯度神经网络的半导体器件特性建模方法,包括以下步骤:

(1)建立半导体器件的等效模型,将晶体管按照等效模型的各结点分解为若干个等效器件;

(2)数据测量:在不同温度下测量各个等效电流源、电荷源对应节点的电流或电容随输入电压改变而变化的情况,并记录数据;如晶体管在闭合状态附近电流数量级较小(10-12A以下),会出现测量噪音,需要平滑测量曲线,数据经过平滑后根据建模需要对其做求导或积分得到电导或电荷量;测量数据的数量级跨度很大,使用函数将数据映射至较小的数据分布内;

(3)构建各等效器件的多梯度神经网络模型:模型包含至少三层神经元和若干层反向传播梯度,多梯度神经网络对输出进行反向传播并求出输出关于输入的梯度,并用实际测量的输出关于输入的导数对此梯度进行约束,以此来对半导体器件需要求导的特性进行准确的建模;

通过求输出关于输入的梯度求得输出关于输入的一阶导数,对输出关于输入的梯度再次进行反向传播求出其关于输入的梯度求得输出关于输入的二阶导数,以此类推,神经网络求出输出关于输入的任意阶导数;在多梯度神经网络中每一次网络权重更新的方向由总损失函数的梯度方向决定,而总损失函数由若干个损失函数加权构成;具体来说,用等效器件对应节点的测量数据来监督神经网络的输出,构造损失函数1;通过反向传播求得神经网络输出关于输入的梯度,此梯度为输出关于输入的一阶导数。用输出关于输入的实际一阶导数数据来监督神经网络输出关于输入的梯度,构成损失函数2;以此类推,每一阶输出关于输入的梯度,都构造损失函数监督它们,最后将这些损失函数按照一定的权重累加,构成总损失函数,总损失函数的梯度用于指导神将网络权重更新;

(4)训练和测试:使用测量数据和其导数对模型进行训练,迭代训练完成以后,测试模型输出的特性曲线和特性曲线的导数曲线是否符合预期,是否出现过拟合或欠拟合。

优选的,步骤(1)中,半导体器件包括晶体管、电容、电感和电阻。

优选的,步骤(2)中,通过对数变换将测量数据映射至较小的数据分布内。当步骤(2)中把测量数据进行对数变换,将原电流数据的分布压缩至合理的范围,步骤(3)中,将需要用神经网络梯度拟合的Gm/Gds和C的值也根据求导链式法则进行相应变换。将变换后的数据输入多梯度神经网络进行训练,训练完成后对神经网络的输出进行对数反变换,将网络模型输出数据恢复到原测量数据的分布区间。

优选的,步骤(3)中,在半导体器件建模中,一般只需要拟合输出关于输入的一阶导数即可。多梯度神经网络模型为双梯度神经网络模型。

优选的,步骤(3)中,半导体器件需要求导的特性包括电导特性和电容特性。

优选的,步骤(4)中,述过拟合或欠拟合的判别方法如下:

若模型训练时随着迭代次数的增加损失函数和预测误差无法收敛到一个较小的值,则判定为发生欠拟合;

若模型训练时随着迭代次数的增加损失函数和预测误差可以收敛到一个较小的值,但当输入比训练数据更密集的数据点测试时,模型的输出特性曲线有不同程度的震荡现象,则判定为发生过拟合;

若训练和测试时模型的误差都在预期内且输出特性曲线平滑,则模型符合预期;

对于过拟合和欠拟合,都需要调整神经网络超参数后再次训练:

出现欠拟合时,调整神经网络超参数包括:增大神经网络的层数、节点数量、迭代次数或学习率;

出现过拟合时,简化神经网络结构或减少迭代次数。

本发明还提供一种基于上述建模方法的基于多梯度神经网络的半导体器件建模系统,记为MOSFitApply,其包括如下模块:半导体器件的等效模型构建模块,数据测量模块,等效器件建模模块,训练和测试模块;这4个模块分别执行建模方法的四个步骤。

和现有技术相比,本发明的有益效果在于:

本发明用神经网络中输出关于输入的梯度是输出关于输入的导数这一特性,通过多梯度神经网络同时拟合半导体器件的输入输出特性及输出关于输入的导数、积分特性,从而达到对半导体器件的特性进行准确建模的目的。

附图说明

图1基于多梯度人工神经网络的新型晶体管建模方案流程图。

图2多梯度人工神经网络结构示意图。

图3MOSFitApply用户界面及功能。

图4使用本方案对N型TFET晶体管建模输出Ids-Vgs曲线与测量值对比。

图5使用本方案对N型TFET晶体管建模输出Gm-Vgs曲线与测量值对比。

图6使用本方案对N型TFET晶体管建模输出Qgd-Vgd曲线与测量值对比。

图7使用本方案对N型TFET晶体管建模输出Cgd-Vgd曲线与测量值对比。

具体实施方式

图1基于多梯度人工神经网络的新型晶体管建模方案流程图。以建立隧穿场效应晶体管(TFET)多梯度神经网络模型为例,TFET有栅极(g)源极(s)和漏极(d),其中源极和漏极之间的电流Ids可以等效为一个受Vgs(栅极和源极之间的电压)、Vds(漏极和源极之间的电压)控制的电流源,栅极和漏极、栅极和源极之间可以等效为两个受Vgs、Vgd(栅极和漏极之间电压)控制的电荷源。忽略掉一些其他微小的因素之后,我们可以将一个TFET等效为以上三个等效器件,由于TFET又分为N型和P型,所以我们需要建立六个等效器件的模型。

取一定的Vgs、Vds间隔,测量Ids随Vgs、Vgd变化值和Cgd(栅极和漏极之间的电容)、Cgs(栅极和源极之间电容)随Vgs、Vgd的变化值。经过曲线平滑后,利用测量的Ids、Cgd、Cgs通过对电压求导或者积分求出Gm/Gds(Gm是晶体管的跨导,Gds是漏极和源极之间的电导)、Qgd(栅极和漏极之间的电荷量)、Qgs(栅极和源极之间的电荷量)。对数据进行以10为底的对数变换,将[10-20,10-3]区间内的数据压缩到[-20,-3]范围。由于输入数据进行了对数变化,其一阶导数数据(Gm/Gds、Cgd或Cgs)也要进行相应转换:

对各个等效器件分别构建合理的神经网络模型,图2为多梯度人工神经网络结构示意图;对于TFET,不仅要通过神经网络的输出拟合Ids、Qgd、Qgs还要通过输出关于输入的梯度拟合Gm/Gds、Cgd、Cgs,所以每个等效器件都需要建立一个双梯度神经网络模型,一个梯度用来求输出关于输入导数,另一个梯度用来指导网络总损失函数的下降和权重更新。

将处理过的数据输入到模型中进行训练,使用MSE损失函数约束模型输出和真实值之间的误差,构造损失函数1。并将模型输出关于输入的梯度和真实输出关于输入的一阶导数(Gm/Gds、Cgd、Cgs等)再次用MSE损失函数进行约束,构造损失函数2。将损失函数2乘以系数15,与损失函数1累加,构成总损失函数。求总损失函数的梯度,并在梯度方向更新神经网络的权重,直到误差小于预期值。

我们编写了一个工程应用软件,用来完成以上建模步骤的自动化,并带有数据可视化功能,可以在训练、测试过程中直观的看到建模情况。图3为软件的交互式界面,界面分为菜单栏、模型训练/测试/转换三个功能区、数据可视化区和日志区,用户可以通过此界面使用软件的各种功能。具体来说,各个区域包括以下功能:

参数设置区:在进行模型训练前需要在该区域设置参数,“epoch”是训练迭代的总次数;“learningrate”是初始学习率;“batch size”是神经网路训练时一次权重更新需要的数据数量;“displayepoch”是两次数据可视化中间间隔的训练迭代次数;“lrdecayweight”是学习率衰减权重;“secondlossweight”是输出关于输入导数损失函数的权重。“hiddenlayernode”是隐藏层神经元数量。

模型训练功能区:点击“Importfile”按钮导入数据表格文件后选择输入列和输出列。软件内置多种神经网络模型,可以灵活的选择是否拟合输入关于输出的导数。点击“Startfitting”按钮软件会按照设置的参数开始训练网络。软件的模型训练功能使用了基于Python的多线程技术,并对模型训练功能的进程进行了优化,使得软件在模型训练过程中不会给用户带来电脑卡顿。点击“Stopfitting”可以强制退出模型训练。

数据可视化区:实现数据可视化功能,在训练过程中每隔一定设置的迭代次数,就会可视化数据的拟合情况,方便研究人员在训练中及时发现问题。若发现神经网路收敛情况不好,可以及时调整神经网络隐藏层节点的数量、学习率等超参数后再次训练。

菜单栏:内含将可视化区的图像保存到本地、关闭数据可视化区子窗口等控制功能。

日志区:一个只读的本文提示区域,可以显示用户操作提示信息,并在模型训练过程中输出当前训练情况,包括已完成的迭代次数、需要完成的总迭代次数、当前学习率、当前总损失函数的值、当前模型平均精度、当前模型最大误差等信息。

测试模型功能区:模型训练完成后,使用软件测试功能,点击“Loadmodel”按钮导入模型后点击“Testfile”按钮导入测试文件并选择输入列,最后点击“Starttest”按钮一键完成测试,并生成测试数据文件,自动绘制输出数据曲线。

模型转换功能区:新型半导体器件等效器件的模型全部建立以后,将这些符合预期的等效器件神经网络模型映射为数学函数关系式并写入Verilog-A文件,以便输入Hspice等仿真软件中进行电路级仿真测试。点击“Selectmodel”按钮选择各等效器件模型,点击“Transform”按钮即可完成模型转换和Verilog-A文件的写入。

对训练后的模型进行测试,测试结果符合预期后将六个等效器件的模型输入软件中,软件会根据神经网络的结构和权重值自动将模型的数学函数表达式推导出来,并写入Verilog-A文件,使各个等效器件数学函数表达式组合起来,可以完整映射一个TFET的Id-Vgs、Id-Vds、Qgd-Vgd、Cgd-Vgd、Qgs-Vgs和Cgs-Vgs特征曲线。将此VerilogA文件输入Hspice等仿真软件,即可结合特定电路做TFET的电路级仿真测试。

使用本方案对N型TFET晶体管建模输出Ids-Vgs曲线与测量值对比的结果如图4所示。使用本方案对N型TFET晶体管建模输出Gm-Vgs曲线与测量值对比的结果如图5所示。使用本方案对N型TFET晶体管建模输出Qgd-Vgd曲线与测量值对比如图6所示。使用本方案对N型TFET晶体管建模输出Cgd-Vgd曲线与测量值对比如图7所示。我们非常精准的拟合了TFET的特性曲线,其中Ids-Vgs、Qgd-Vgd等不需要用梯度拟合的特性曲线模型输出与真实数据误差在2%以内,Gm-Vgs、Cgd-Vgd等需要用梯度拟合的特性曲线模型输出和真实数据误差在5%以内。将训练好的模型转化为数学函数表达式并写入VerilogA文件,我们使用此文件在Hspice中仿真,计算得到模型转化前后输出的数据的误差不超过1%。

而之前基于神经网络的晶体管建模方法在Gm-Vgs、Cgd-Vgd等需要输出对输入求导的特性曲线的拟合上,平均误差往往在50%以上。多梯度人工神经网络建模方案解决了之前基于神经网络的建模方案无法准确对晶体管的导数特性进行建模的问题,可以更加快速准确的完成对TFET的建模从而进行电路级仿真测试。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种混合电容器功率状态在线估计方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类