Chinese Journal of Nature Vol.45 No.3 REVIEW ARTICLE 1.6结合深度学习的光学测量技术 预测,预测结果的均方根误差约为1.6A,标准 深度学习技术作为近年来发展非常迅速的 差约为士0.2A。如图7所示,石磊等6将多层薄 技术,已经密切结合到半导体多层膜测量领域 膜厚度表征视为神经网络来构建映射关系,将反 中16o62。南开大学Liu等61提出基于深度神经网 向传播算法引入薄膜优化过程,极大缩短了百层 络驱动的迭代学习技术用以解决椭圆偏振技术在 薄膜厚度的优化时间,单次优化时间相比于传统 多层膜测量中的问题,通过采用随机梯度迭代 方法缩短为原来的2%,通过采用薄膜神经网络 对模拟数据进行训练,可成功得到薄膜厚度的 对232层非周期薄膜结构进行厚度量测,误差在 唯一解集。成维等6提出了一种极紫外光刻掩 10以内(<0.1nm). 模多层膜相位型缺陷的形貌重建方法,采用卷 2波长移相干涉测量技术概述 积神经网络与多层感知器两种深度学习模型构 2.1波长移相干涉测量理论模型 建空间像振幅/相位与缺陷底部形貌参数之间的 关系。在5~50nm之间的缺陷中随机选取20组作 当参考光束与测量光束具有相同的传播方 为检测对象,实验结果表明:凸起型底部半峰 向、恒定的相位差时,两束光波将发生干涉现 全宽重建结果和底部高度重建结果的均方根误 象。按照电磁理论,第k次移相后所得干涉图在 差分别为0.51nm、3.35nm:凹陷型缺陷底部半 (x,y)位置处的干涉强度可表示为: 峰全宽和底部高度重建结果的均方根误差分别为 1x,yk)=4化,y0+7k,y)cos(4, (1) 0.43nm、1.73nm。因机器学习算法无需物理模 型解释即可有效学习光谱数据和多层膜厚度之间 式中(x,y)表示(x,y)位置处的背景光强,x,y) 的相关性,Kwak等6s-6使用一种基于光谱测量 表示调制度,h称为干涉腔长,=入+k△(k=O,1, 和机器学习的算法,将光谱数据和膜层厚度分别 2,·,N-1)表示第k次移相后的输出波长,,为激 作为输入和输出,使用线性回归模型对层数约为 光器起始波长(2,=0.6328m),△1代表单次移相 200、总厚度约为5.5um的多层膜结构进行厚度 时波长调谐量。 (a) 1.00 2层 0.7 波长hm (b) 60层 0.75 050 Exp. 02 一lni 一Ft 500 800 波长m (c) 232层 0.2 500 60 700 波长nm 图7基于光学逆问题的反向传播算法表征多层膜信息6例:(@)双层薄膜厚度预测:(b)60层薄膜厚度预测:(c)232层薄膜厚度预测 ■162
162 Chinese Journal of Nature Vol. 45 No. 3 REVIEW ARTICLE 1.6 结合深度学习的光学测量技术 深度学习技术作为近年来发展非常迅速的 技术,已经密切结合到半导体多层膜测量领域 中[60-62]。南开大学Liu等[63]提出基于深度神经网 络驱动的迭代学习技术用以解决椭圆偏振技术在 多层膜测量中的问题,通过采用随机梯度迭代 对模拟数据进行训练,可成功得到薄膜厚度的 唯一解集。成维等[64]提出了一种极紫外光刻掩 模多层膜相位型缺陷的形貌重建方法,采用卷 积神经网络与多层感知器两种深度学习模型构 建空间像振幅/相位与缺陷底部形貌参数之间的 关系。在5~50 nm之间的缺陷中随机选取20组作 为检测对象,实验结果表明:凸起型底部半峰 全宽重建结果和底部高度重建结果的均方根误 差分别为0.51 nm、3.35 nm;凹陷型缺陷底部半 峰全宽和底部高度重建结果的均方根误差分别为 0.43 nm、1.73 nm。因机器学习算法无需物理模 型解释即可有效学习光谱数据和多层膜厚度之间 的相关性,Kwak等[65-66]使用一种基于光谱测量 和机器学习的算法,将光谱数据和膜层厚度分别 作为输入和输出,使用线性回归模型对层数约为 200、总厚度约为5.5 μm的多层膜结构进行厚度 预测,预测结果的均方根误差约为1.6 Å,标准 差约为±0.2 Å。如图7所示,石磊等[67]将多层薄 膜厚度表征视为神经网络来构建映射关系,将反 向传播算法引入薄膜优化过程,极大缩短了百层 薄膜厚度的优化时间,单次优化时间相比于传统 方法缩短为原来的2%,通过采用薄膜神经网络 对232层非周期薄膜结构进行厚度量测,误差在 10-4 以内(<0.1 nm)。 2 波长移相干涉测量技术概述 2.1 波长移相干涉测量理论模型 当参考光束与测量光束具有相同的传播方 向、恒定的相位差时,两束光波将发生干涉现 象。按照电磁理论,第k次移相后所得干涉图在 (x, y)位置处的干涉强度可表示为: 0 4 ( , , ) ( , )[1 ( , ) cos( )] k πh I x y k I x y x y , (1) 式中I0(x, y)表示(x, y)位置处的背景光强,γ(x, y) 表示调制度,h称为干涉腔长,λk=λ0+kΔλ(k=0, 1, 2,…, N−1)表示第k次移相后的输出波长,λ0为激 光器起始波长(λ0=0.632 8 μm),Δλ代表单次移相 时波长调谐量。 图7 基于光学逆问题的反向传播算法表征多层膜信息[67]:(a)双层薄膜厚度预测;(b) 60层薄膜厚度预测;(c)232层薄膜厚度预测
有数来志、第45卷第3期■专题综述 干涉图(x,y)位置处的干涉强度呈余弦变 像。一般而言,在求解初始相位中涉及的干涉条 化,第次移相后的相位可表示为: 纹图数量越多,求解精度也越高,但其计算量与 8xy)= 4πh 名+kA元 (2) 复杂度也提高。 2.2干涉测量相位解调算法 当波长发生变化时,相位呈现非线性变 2.2.1硬件移相相位解调算法概述 化,其n阶泰勒级数展开式为: 4πh 4元h_4πhk△2+ 在硬件移相技术中,按照移相步进间隔类 0(x,y,k)= +kA2,2 型,相位解调算法主要分为定步长移相解调算 4h(k△2P++ 4π (kA2-。 3 法、等步长移相解调算法和随机移相解调算法。 (1)定步长移相解调算法具有固定的移相步 初始相位可表示为: 进间隔和移相值,即同一像素点在相邻两帧干涉 p)=4h (4) 图之间的相位改变量相同且已知。目前,具有代 表性的定步长移相解调算法主要包括3步移相法、 考虑到激光光源调谐分辨率与干涉腔长量级, 4步移相法、5步移相法、11步移相法、13步移相 可以忽略式(3)中的非线性高阶项,故简化为: 法等6-0,移相值通常为π/2、π/3、π/4。在该算 0x,y,k)= 4h=4h_4k△, (5) 法中相位解调结果对移相帧数比较敏感。一般而 。+k△7,62 言,移相帧数越多,算法对系统移相误差、随机 式中,第次移相的相位变化量即移相值为: 噪声(如环境扰动)等因素的抑制能力越强,相位 d=-4k△2。 (6) 解调精度越高。然而,较多移相帧数会导致干涉 2 图采集数量增加,相应计算复杂度显著提高,不 由式(6)知,在波长移相干涉测量中,通过 利于实时计算,需要系统硬件、软件具有较高性 预先设定起始波长、干涉腔长和波长调谐量可主 能。同时,该算法要求每步移相值严格相同,故 动控制指定相位变化,利用CCD相机即可记录 需要对移相系统进行预先严格标定。 多帧移相干涉图。为求解被测元件初始相位,式 (2)等步长移相解调算法相较于定步长移相 (1)改写为: 解调算法,只要求相邻两帧干涉图之间的相位差 I(x,y,k)=1(x,y)1+a(x,y)cos((k))+a,(x,y)sin((k))], 固定,不需要预先对移相值进行标定。此类算法 a(x,y)=r(x,y)cos(o(x,y)), (7) 主要包括Carre算法、Schwider?算法、Stoilove算 a,(x,y)=-y(x,y)sin(o(x,y))o 法和Hariharan.算法-两。在实际工程应用中发现 通过采集的多帧移相干涉图,由式(7)求解 Stoilove算法可以有效抑制线性移相误差和二阶 的初始相位可表示为: 非线性误差,其计算时间也相对较长。Harris和 p(x,)=arctan,(化,2少 (8) Surrel等7s-基于离散傅里叶变换和特征多项式 a(x,y) 发展了基于采样窗分析的移相算法,这种算法可 综上所述,位于被测光学元件波面(x,)位置 以通过设计自变量系数分布使等步长算法具有相 处的待测表面相对参考面的形变量可表示为: 应的误差抑制能力。影响该算法测量精度的根本 Wx,)=2p(x,)。 (9) 问题在于各谐波信号频率的确定。针对该问题, 4π 目前通用的算法是利用各表面的光程差以及采样 在单表面波长移相干涉情形下,被测表面 频率对谐波频率进行估计,但在实际使用中,直 初始相位求解至少需要3帧移相干涉条纹图。 接对多个谐波信号的光程差进行精确估计具有一 以传统的4步移相算法为例,移相值分别为0、 定难度。 π/2、π、3π/2,共计采集4帧移相干涉条纹图 (3)随机移相算法不要求相邻两帧干涉图间 163
163 Chinese Journal of Nature Vol. 45 No. 3 REVIEW ARTICLE 第 45 卷第 3 期 ■专题综述 干涉图(x, y)位置处的干涉强度呈余弦变 化,第k次移相后的相位可表示为: 0 4 ( , , ) πh x y k k 。 (2) 当波长发生变化时,相位呈现非线性变 化,其n阶泰勒级数展开式为: 2 1 2 3 0 0 0 0 0 4 4 4 4 4 ( , , ) ( ) ( )n n π π h h π h hπ πh x y k k k k k 2 1 2 3 0 0 0 0 0 4 4 4 4 4 ( , , ) ( ) ( )n n π π h h π h hπ πh x y k k k k k 。 (3) 初始相位可表示为: 0 4 ( , ) πh x y 。 (4) 考虑到激光光源调谐分辨率与干涉腔长量级, 可以忽略式(3)中的非线性高阶项,故简化为: 2 0 0 0 4 4 4 ( , , ) π h hπ πh x y k k k , (5) 式中,第k次移相的相位变化量即移相值为: 2 0 4 ( ) πh k k 。 (6) 由式(6)知,在波长移相干涉测量中,通过 预先设定起始波长、干涉腔长和波长调谐量可主 动控制指定相位变化,利用CCD相机即可记录 多帧移相干涉图。为求解被测元件初始相位,式 (1)改写为: (7) 0 1 2 1 2 ( , , ) ( , )[1 ( , ) cos( ( )) ( , )sin( ( ))], ( , ) ( , ) cos( ( , )), ( , ) ( , )sin( ( , ))。 I x y k I x y a x y k a x y k a x y x y x y a x y x y x y 通过采集的多帧移相干涉图,由式(7)求解 的初始相位可表示为: 2 1 ( , ) ( , ) arctan ( , ) a x y x y a x y 。 (8) 综上所述,位于被测光学元件波面(x, y)位置 处的待测表面相对参考面的形变量可表示为: 0 ( , ) ( , ) 4π W x y x y 。 (9) 在单表面波长移相干涉情形下,被测表面 初始相位求解至少需要3帧移相干涉条纹图。 以传统的4步移相算法为例,移相值分别为0、 π/2、π、3π/2,共计采集4帧移相干涉条纹图 像。一般而言,在求解初始相位中涉及的干涉条 纹图数量越多,求解精度也越高,但其计算量与 复杂度也提高。 2.2 干涉测量相位解调算法 2.2.1 硬件移相相位解调算法概述 在硬件移相技术中,按照移相步进间隔类 型,相位解调算法主要分为定步长移相解调算 法、等步长移相解调算法和随机移相解调算法。 (1)定步长移相解调算法具有固定的移相步 进间隔和移相值,即同一像素点在相邻两帧干涉 图之间的相位改变量相同且已知。目前,具有代 表性的定步长移相解调算法主要包括3步移相法、 4步移相法、5步移相法、11步移相法、13步移相 法等[68-70],移相值通常为π/2、π/3、π/4。在该算 法中相位解调结果对移相帧数比较敏感。一般而 言,移相帧数越多,算法对系统移相误差、随机 噪声(如环境扰动)等因素的抑制能力越强,相位 解调精度越高。然而,较多移相帧数会导致干涉 图采集数量增加,相应计算复杂度显著提高,不 利于实时计算,需要系统硬件、软件具有较高性 能。同时,该算法要求每步移相值严格相同,故 需要对移相系统进行预先严格标定。 (2)等步长移相解调算法相较于定步长移相 解调算法,只要求相邻两帧干涉图之间的相位差 固定,不需要预先对移相值进行标定。此类算法 主要包括Carre算法、Schwider算法、Stoilove算 法和Hariharan算法[71-74]。在实际工程应用中发现 Stoilove算法可以有效抑制线性移相误差和二阶 非线性误差,其计算时间也相对较长。Harris和 Surrel等[75-76]基于离散傅里叶变换和特征多项式 发展了基于采样窗分析的移相算法,这种算法可 以通过设计自变量系数分布使等步长算法具有相 应的误差抑制能力。影响该算法测量精度的根本 问题在于各谐波信号频率的确定。针对该问题, 目前通用的算法是利用各表面的光程差以及采样 频率对谐波频率进行估计,但在实际使用中,直 接对多个谐波信号的光程差进行精确估计具有一 定难度。 (3)随机移相算法不要求相邻两帧干涉图间