非线性回归模型的线性化以上介绍了线性回归模型。但有时候变量之间的关系是非线性的。例如y=αo+aix,β+uy,=αoer+u上述非线性回归模型是无法用最小二乘法估计参数的。可采用非线性方法进行估计。估计过程非常复杂和困难,在20世纪40年代之前几乎不可能实现。计算机的出现大大方便了非线性回归模型的估计。专用软件使这种计算变得非常容易。但本章不是介绍这类模型的估计。另外还有一类非线性回归模型。其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。称此类模型为可线性化的非线性模型。下面介绍几种典型的可以做线性化处理的非线性模型。(1)指数函数模型y,= aeb,+n,(4.1)b>0和b<0两种情形的图形分别见图4.1和4.2。显然x和y的关系是非线性的。对上式等号两侧同取自然对数,得(4.2)Lmy,= Lna + b x,+ ut令Lny,=y*,Lna=a*,则(4.3)y*= a* + bx, + ut变量y*和x,已变换成为线性关系。其中u表示随机误差项。50Y1LF400.83020ie0.100.6a.XA23O10.51.52.5图4.1 y,=aeb+,(b>0)图4.2y,=aebx,+i,(b<0)(2)对数函数模型(4.4)y,=a+bLnx,+ub>0和b<0两种情形的图形分别见图4.3和4.4。x,和y的关系是非线性的。令x*=Lnxt则(4.5)y,=a+bx*+ut变量y和x*已变换成为线性关系。1
非线性回归模型的线性化 以上介绍了线性回归模型。但有时候变量之间的关系是非线性的。例如 yt = α 0 + α1 + ut β1 t x yt = α 0 + ut t x eα1 上述非线性回归模型是无法用最小二乘法估计参数的。可采用非线性方法进行估计。估 计过程非常复杂和困难,在 20 世纪 40 年代之前几乎不可能实现。计算机的出现大大方便了 非线性回归模型的估计。专用软件使这种计算变得非常容易。但本章不是介绍这类模型的估 计。 另外还有一类非线性回归模型。其形式是非线性的,但可以通过适当的变换,转化为线 性模型,然后利用线性回归模型的估计与检验方法进行处理。称此类模型为可线性化的非线 性模型。下面介绍几种典型的可以做线性化处理的非线性模型。 ⑴ 指数函数模型 yt = (4.1) tt ubx ae + b>0 和 b<0 两种情形的图形分别见图 4.1 和 4.2。显然 xt和 yt的关系是非线性的。对上式等 号两侧同取自然对数,得 Lnyt = Lna + b xt + ut (4.2) 令 Lnyt = yt*, Lna = a*, 则 yt* = a* + bxt + ut (4.3) 变量 yt* 和 xt 已变换成为线性关系。其中 ut 表示随机误差项。 0 10 20 30 40 50 0 1 2 3 4 X Y1 图 4.1 yt = , (b > 0) 图 4.2 yt = , (b < 0) tt ubx ae + tt ubx ae + ⑵ 对数函数模型 yt = a + b Ln xt + ut (4.4) b>0 和 b<0 两种情形的图形分别见图 4.3 和 4.4。xt 和 yt 的关系是非线性的。令 xt* = Lnxt, 则 yt = a + b xt* + ut (4.5) 变量 yt 和 xt* 已变换成为线性关系。 1
10015020010015020050图4.3,=a+bLnx,+u,(b>0)图4.4y,=a+bLnx,+u,(b<0)(3)幂函数模型y=ax,be"(4.6)b取不同值的图形分别见图4.5和4.6。x和y的关系是非线性的。对上式等号两侧同取对数,得(4.7)Lny,=Lna +b Lnx,+ut令y*=Lny,a*=Lna,x*=Lnx,则上式表示为(4.8)y*=a*+bx*+ut变量y*和x*之间已成线性关系。其中u,表示随机误差项。(4.7)式也称作全对数模型。b<-1b>10>b>-110<b<10.50.511.50.511.50图4.5y,=ax*e"图4.6y=axe"(4)双曲线函数模型(4.9)1/y, = a + b/x, + u,也可写成,yr= 1/ (a + b/x + u)(4.10)b>0情形的图形见图4.7。x,和y,的关系是非线性的。令y*=1/y,x*=1/x,得y*=a+bx,*+u已变换为线性回归模型。其中u表示随机误差项。2
图 4.3 yt = a + b Lnxt + ut , (b > 0) 图 4.4 yt = a + b Lnxt + ut , (b < 0) ⑶ 幂函数模型 yt = a xt b (4.6) t u e b 取不同值的图形分别见图 4.5 和 4.6。xt 和 yt 的关系是非线性的。对上式等号两侧同取 对数,得 Lnyt = Lna + b Lnxt + ut (4.7) 令 yt* = Lnyt, a* = Lna, xt* = Lnxt, 则上式表示为 yt* = a* + b xt* + ut (4.8) 变量 yt* 和 xt* 之间已成线性关系。其中 ut 表示随机误差项。(4.7) 式也称作全对数模型。 图 4.5 yt = a xt b 图 4.6 yt = a xt ut b e t u e ⑷ 双曲线函数模型 1/yt = a + b/xt + ut (4.9) 也可写成, yt = 1/ (a + b/xt + ut) (4.10) b>0 情形的图形见图 4.7。xt 和 yt 的关系是非线性的。令 yt* = 1/yt, xt* = 1/xt,得 yt* = a + b xt* + ut 已变换为线性回归模型。其中 ut 表示随机误差项。 2
1351300.61251200.411511010510000.51.50.51.52.52图4.8y,=a+b/x,图4.7y,=1/(a+b/x,),(b>0)(b > 0)双曲线函数还有另一种表达方式,(4.11)yr= a+ b/x, + utb>0情形的图形见图4.8。x和y的关系是非线性的。令x*=1/x,得y,=a+bx*+u上式已变换成线性回归模型。(5)多项式方程模型一种多项式方程的表达形式是Y= bo +b1x, + b2 x? + b3 x3 + ut(4.12)其中bi>0,bz>0,b>0和bi<0,b>0,b;<0情形的图形分别见图4.9和4.10。令x=x,xr2=xx3=x,上式变为(4.13)J/=bo+biX1+b2Xi2+b3X13+u这是一个三元线性回归模型。如经济学中的总成本曲线与图4.9相似。140001250012000100001000080007500600050004002500200020406080204060980图4.9y,=bo+b,x,+b2x+b3x3+u图4.10y,=bo+bix,+bax?+b3x+u另一种多项式方程的表达形式是y,= bo + bix,+ b x2 + u(4.14)其中bi>0,b2>0和bi<0,b<0情形的图形分别见图4.11和4.12。令x1=x,Xt2=x2,上式线性化为,(4.15)/=bo+bix+b2x+ut如经济学中的边际成本曲线、平均成本曲线与图4.11相似。3
图 4.7 yt = 1/ (a + b/xt ), (b > 0) 图 4.8 yt = a + b/xt , (b > 0) 双曲线函数还有另一种表达方式, yt = a + b/xt + ut (4.11) b>0 情形的图形见图 4.8。xt 和 yt 的关系是非线性的。令 xt* = 1/xt,得 yt = a + b xt* + ut 上式已变换成线性回归模型。 ⑸ 多项式方程模型 一种多项式方程的表达形式是 yt = b0 +b1 xt + b2 xt 2 + b3 xt 3 + ut (4.12) 其中 b1>0, b2>0, b3>0 和 b1<0, b2>0, b3<0 情形的图形分别见图 4.9 和 4.10。令 xt 1 = xt,xt 2 = xt 2 , xt 3 = xt 3 ,上式变为 yt = b0 +b1 xt 1 + b2 xt 2 + b3 xt 3 + ut (4.13) 这是一个三元线性回归模型。如经济学中的总成本曲线与图 4.9 相似。 图 4.9 yt = b0 +b1 xt + b2 xt 2 + b3 xt 3 + ut 图 4.10 yt = b0 + b1 xt + b2 xt 2 + b3 xt 3 + ut 另一种多项式方程的表达形式是 yt = b0 + b1 xt + b2 xt 2 + ut (4.14) 其中 b1>0, b2>0 和 b1<0, b2<0 情形的图形分别见图 4.11 和 4.12。令 xt 1 = xt,x t 2 = xt 2 ,上式 线性化为, yt = b0 + b1 xt1 + b2 xt2 + ut (4.15) 如经济学中的边际成本曲线、平均成本曲线与图 4.11 相似。 3
16001506014050130401202011020100109010203040104305060405060图4.11 ,=bo+bix,+b2x?+ u图4.12y,=bo+bix,+bax?+u(6)生长曲线(logistic)模型A(4.16)yi=1+e/(0)+m,一般f)=ao+ait+a2t?+...+ant",常见形式为)=do-atkk(4.17)y=1 +e(aar)+u,I + be -at+n,其中b=e。a0情形的图形分别见图4.13和4.14。美国人口统计学家Pearl和Reed广泛研究了有机体的生长,得到了上述数学模型。生长模型(或逻辑斯谛曲线,Pearl-Reed曲线)常用于描述有机体生长发育过程。其中k和0分别为y的生长上限和下限。Limy,=k,1→oLnbkLimy,=0。a,b为待估参数。曲线有拐点,坐标为(),曲线的上下两部分对称于拐2a1→-2点。k0.80.60.4k/22025301015(Lnb)/a图4.13J,=k/(1+be-at+)图4.14y,=k/(1+be为能运用最小二乘法估计参数a.b,必须事先估计出生曲线长上极限值k。线性化过程如下。当k给出时,作如下变换,kly,=1 + be=af+kly,-1= be-ar+u移项,取自然对数,Ln(klyr-1)=Lnb-at+u(4.18)令y*= Ln(klyr-1),b*=Lnb, 则(4.19)y*=b*-at+ut4
图 4.11 yt = b0 +b1xt + b2xt 2 + ut 图 4.12 yt = b0 + b1xt + b2xt 2 + ut ⑹ 生长曲线 (logistic) 模型 yt = utf t e k + + )( 1 (4.16) 一般 f(t) = a0 + a1 t + a2 t 2 + . + an t n ,常见形式为 f(t) = a0 - a t yt = uata u e k +− + )( 0 1 = uat t be k +− 1+ (4.17) 其中 b = 。a > 0 情形的图形分别见图 4.13 和 4.14。美国人口统计学家 Pearl 和 Reed 广 泛研究了有机体的生长,得到了上述数学模型。生长模型(或逻辑斯谛曲线,Pearl-Reed 曲 线)常用于描述有机体生长发育过程。其中 k 和 0 分别为 yt 的生长上限和下限。 = k, = 0。a, b 为待估参数。曲线有拐点,坐标为( 0 a e t ∞→ Limyt t −∞→ Limyt a Lnb , 2 k ),曲线的上下两部分对称于拐 点。 图 4.13 yt = k / (1 + ) 图 4.14 yt = k / (1 + ) t uat be +− t uat be + 为能运用最小二乘法估计参数 a, b,必须事先估计出生曲线长上极限值 k。线性化过程 如下。当 k 给出时,作如下变换, k/yt = 1 + t uat be +− 移项, k/yt - 1 = uat t be +− 取自然对数,Ln ( k/yt - 1) = Lnb - a t + ut (4.18) 令 yt* = Ln ( k/yt - 1), b* = Lnb, 则 yt* = b* - a t + ut (4.19) 4
此时可用最小二乘法估计b*和a。5月1日起内地每日非典数据一览→新增确诊→新增似→新增治愈→新增死亡350322300251250244222207200187181189WY17176159160114415016345146103711595584100B0AB62704140R50037352926234464282819.2120710172R17121627054-910111213141516171819202122232425262728日期图4.15内地5月1日至28日每天非典数据一览(7)龚伯斯(Gompertz)曲线英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可用来描述一项新技术,一种新产品的发展过程。曲线的数学形式是,Ekk/eJ,=ke-be-at(Lnb)/a图 4.15 y= ke-be-al曲线的上限和下限分别为k和0,Limy,=k,Limy,=0。a,b为待估参数。曲线有拐点,坐101-→-0标为(Lmb)),但曲线不对称于拐点。一般情形,上限值k可事先估计,有了k值,龚伯a斯曲线才可以用最小二乘法估计参数。线性化过程如下:当k给定时,y/k= e-be-atkly,= ebe-atLn (kly)= be-atLn[Ln(k/y)] = Lnb - a t令y*=Ln[Ln(kly)],b*=Lnb,则5
此时可用最小二乘法估计 b*和 a。 图 4.15 内地 5 月 1 日至 28 日每天非典数据一览 ⑺ 龚伯斯(Gompertz)曲线 英国统计学家和数学家最初提出把该曲线作为控制人口增长的一种数学模型,此模型可 用来描述一项新技术,一种新产品的发展过程。曲线的数学形式是, yt = at be ke − − 图 4.15 yt = at be ke − − 曲线的上限和下限分别为 k 和 0, = k, = 0。a, b 为待估参数。曲线有拐点,坐 标为( t ∞→ Limyt t −∞→ Limyt a Lnb , e k ),但曲线不对称于拐点。一般情形,上限值 k 可事先估计,有了 k 值,龚伯 斯曲线才可以用最小二乘法估计参数。线性化过程如下:当 k 给定时, yt / k = , k/yt = at be e − − at be e − Ln (k/yt) = , Ln[Ln(k/yt)] = Lnb - a t at be− 令 y*= Ln[Ln(k/yt)], b* = Lnb,则 5