F (1.2.54) Rsr /(n 它服从F(k,n-p)分布,可以用来检验原假设 具体Y=Za+c的表达式我们放在下节讨论。 在一元线性回归的显著性检验中有一个相关系数检验,统计量是rxY(0.2.32),到(02.36) 我们推导出R2统计量,它与r3有完全相同的形式。R2统计量可以推广到多元。事实上,由 正规方程XXB=XY,我们有 YY=(XB)(XB)=BXXB=BXY=Br (1.2.55) 于是∑=∑,进一步由F=F,有 ∑(-YXx-)=∑(x-1)2 是雷同于(0.2.36)有 ∑(①-1)2①(x-1)x-) R2 =r2y(1.2.57) ∑(-1)2∑(-Y)2 我们看到了R2的几何意义,它是资料Y(=1,…,n)与H1的估计值,(i=1…,m)之间的相关 系数的平方。当回归效果特别好时,R2应该近似于1,即表示拟合值Y1几乎与观测值Y重合。 当回归效果特别不好时,R2近似为0,表示拟合值Y,与观测值完全不相关。可见R2是回归 效果一个很好的度量。一般称R为复相关系数,或全相关系数 本书所附软件利用拟合值与观测值在二维图像上显示回归效果,计算统计量R2供使用者 参考,方便使用者对多元回归效果的直观观察。 、多元線性回歸預测與金數的區間估計 在通過了線性回歸的顯著性檢驗後,可以利用回歸方程作預測。點預測只須將X= (X01,…,Xo)代入回歸方程算出】 。=X0B即可
16 /( ) ( )/ S n p S S k F RSX RSZ RSX − − = (1.2.54) 它服从 F(k,n-p)分布,可以用来检验原假设。 具体 Y=Zα+ε的表达式我们放在下节讨论。 在一元线性回归的显著性检验中有一个相关系数检验,统计量是 rXY(0.2.32),到(0.2.36) 我们推导出 R 2 统计量,它与 2 XY r 有完全相同的形式。R 2 统计量可以推广到多元。事实上,由 正规方程 X X = X Y ˆ ,我们有 Y ˆ Y ˆ = (X ˆ )(X ˆ ) = ˆ X X ˆ = ˆ X Y = ˆ Y (1.2.55) 于是 = = = n i i i n i Yi Y Y 1 1 2 ˆ ˆ ,进一步由 Y ˆ I = Y ,有 2 1 1 ) ˆ ) ( ˆ ˆ (Y Y )(Y Y Yi Y n i i i i n i − − = − = = (1.2.56) 于是雷同于(0.2.36)有 r Y Y Y Y Y Y Y Y Y Y Y Y Y R Y i n i i n i i i i n i i n i i n i ˆ ) ( ) ˆ ( )] ˆ ˆ [ ( )( ( ) ) ˆ ( 2 2 1 2 1 2 1 2 1 2 2 1 = − − − − = − − = = = = = = (1.2.57) 我们看到了 R 2 的几何意义,它是资料 Yi (i=1,…,n)与 Yi 的估计值 ( 1, , ) ˆ Yi i = n 之间的相关 系数的平方。当回归效果特别好时,R 2 应该近似于 1,即表示拟合值 Yi ˆ 几乎与观测值 Yi 重合。 当回归效果特别不好时,R 2 近似为 0,表示拟合值 Yi ˆ 与观测值 Yi 完全不相关。可见 R 2 是回归 效果一个很好的度量。一般称 R 为复相关系数,或全相关系数。 本书所附软件利用拟合值与观测值在二维图像上显示回归效果,计算统计量 R 2 供使用者 参考,方便使用者对多元回归效果的直观观察。 三、多元線性回歸預測與參數的區間估計 在通過了線性回歸的顯著性檢驗後,可以利用回歸方程作預測。點預測只須將 X0 = (X01,…,X0p) 代入回歸方程算出 Y ˆ 0 = X0 即可
要作出Y的區間估計,需要求得它的分佈。在誤差正態假設下,由定理1.2.2的(1),因 焉B~N2(B,2(XX)2),故 Y,=XB-N(XB, o2X'(Xx-Xo (1.2.58) 則當a2未知時,以G2=S(n-P)替代,有 (1.2.59) G√X(Xx)-X 故y的區間估計(顯著性水平a)爲: 土t-2(m-p)、√X(x 當σ2已知時,直接由定理1.2.2的(1)可以作出β的區間估計。因爲 (B-B)XX(B-B)/a2~N(0,1) (1.2.61) 故β的聯合置信域(顯著性水平a)爲: (B-B)XX(B-B)≤ 這是一個橢球。 當a2未知時,可以由定理1.22的(2)與(4)構造一個新的統計量: (B-B'XX(B-B)/op (n-p)a2/(a2(n-p)) (B-B)XX(B-22- F(P, n-p) (1.263) 於是得橢球置信域(顯著性水平a) (B-B)XX(B-B)spo Fo(p, n-p) (1.2.64) 對於給定的橢球,可以解出各參數分量的置信區間。當維數太多時,注意0.9°-0(p-∞) 成了小概率事件,這樣的置信域意義不大 現在對一般多元線性回歸模型的參數估計與假設檢驗結果總結如下 =B+B1 BX
17 要作出 0 Y ˆ 的區間估計,需要求得它的分佈。在誤差正態假設下,由定理 1.2.2 的(1),因 爲 ~ ( , ( ) ) ˆ 2 −1 NP X X ,故 ~ ( , ( ) ) ˆ ˆ 0 1 0 2 Y0 X0 N X0 X X X X − = (1.2.58) 則當σ2 未知時,以 ˆ /( ) 2 = S RS n − p 替代,有 ~ ( ) ˆ ( ) ˆ ˆ 0 1 0 0 0 t n p X X X X Y X − − − (1.2.59) 故 0 Y ˆ 的區間估計(顯著性水平α)爲: 0 1 0 1 / 2 0 ( ) ˆ ( ) X ˆ t a n p X X X X − − − (1.2.60) 當σ2 已知時,直接由定理 1.2.2 的(1)可以作出 ˆ 的區間估計。因爲 )/ ~ (0,1) ˆ ) ( ˆ ( 2 − X X − N (1.2.61) 故 ˆ 的聯合置信域(顯著性水平α)爲: / 2 2 ) ˆ ) ( ˆ ( X X − Ua − (1.2.62) 這是一個橢球。 當σ2 未知時,可以由定理 1.2.2 的(2)與(4)構造一個新的統計量: ( ) ˆ /( ( )) )/( ) ˆ ) ( ˆ ( 2 2 2 n p n p X X p F − − − − = ~ ( , ) ˆ ) ˆ ) ( ˆ ( 2 F p n p p X X − − − = (1.2.63) 於是得橢球置信域(顯著性水平α): ) ˆ ( , ) ˆ ) ( ˆ ( 2 − XX − p F p n − p (1.2.64) 對於給定的橢球,可以解出各參數分量的置信區間。當維數太多時,注意 0.9p→0(p→∞) 成了小概率事件,這樣的置信域意義不大。 現在對一般多元線性回歸模型的參數估計與假設檢驗結果總結如下 模型: , ~ (0, ), 1, , ; 2 Yi = 0 + 1X1i ++ m X mi + i i N i = n
Ex y=X B+E, ENO,0,),p=m+1 參數估計:B=(XX)-XY, P P 顯著性檢驗: 回歸方程整體顯著性檢驗:Ho:β1=…=βm=0 F統計量:F= SEs /(p-D) 臨界值F。(P-l,n-p); Rs(n-p) 回歸平方和:Ss=(Y-Y)(Y-y) 殘差平方和:SBs=(Y-1)(- 回歸係數逐一顯著性檢驗:Ho:β=0,产=1,…,m; F統計量:F,= B2Cn,臨界值F(1,nP C是矩陣(X′)主對角線上第j個元素。 t統計量:t B Sgs/(n-p) 臨界值la(-p) 全相周係數R:R2=5s 四、會計資訊在股市中作用的回歸分析 上海財經大學博士生谷澍在導師指導下運用CAPM與APT研究公司會計資訊在上海股市 中的作用,獲得很有價值的成果。他發現,除系統風險R與股票市場組合收益率R灬外,其餘 變數與公司會計資訊密切相關。公司的會計資料可以提供有關淨現金流量C的資訊。例如在 某個時段,設企業的會計利潤爲Ai投資爲l折舊爲唯一的會計應計專案且其數額爲Oa,則 有 A.+o (1.2.65) 般地,企業爲維持再生產所進行的追加投資l與折舊額On基本相等,故進一步有C=An 可見,會計指標如每股盈利等直接反映了企業現金淨流量C的狀況,從而在股票價格的確定 中起著重要作用
18 或 , ~ N(0, I n ), p m 1 2 1 1 = + = + p n n p Y X 。 參數估計: ( ) , ˆ 1 = X X X Y − ( ˆ ) ( ˆ )。 1 1 ˆ 2 Y Y Y Y n p S n p RS − − − = − = 顯著性檢驗: 回歸方程整體顯著性檢驗:H0∶β1= … =βm=0: F 統計量: ( ) /( 1) S n p S p F RS ES − − = ,臨界值 Fα(p-1,n-p); 回歸平方和: ); ˆ ) ( ˆ SES = (Y −Y Y −Y 殘差平方和: SRS = (Y −Y ˆ )(Y −Y ˆ )。 回歸係數逐一顯著性檢驗: H0∶βj=0, j=1,…,m; F 統計量: /( ) / ˆ 2 S n p C F RS j jj j − = ,臨界值 Fα(1, n-p), Cjj 是矩陣(X′X) -1 主對角線上第 j 個元素。 t 統計量: /( ) / ˆ S n p C t RS j jj − = ,臨界值 ( ) 2 t n − p 。 全相關係數 R: 2 ˆ 2 YY ES RS ES r S S S R = + = 。 四、會計資訊在股市中作用的回歸分析 上海財經大學博士生谷澍在導師指導下運用 CAPM 與 APT 研究公司會計資訊在上海股市 中的作用,獲得很有價值的成果。他發現,除系統風險 Rf 與股票市場組合收益率 Rm 外,其餘 變數與公司會計資訊密切相關。公司的會計資料可以提供有關淨現金流量 Cit 的資訊。例如在 某個時段,設企業的會計利潤爲 Ait,投資爲 Iit,折舊爲唯一的會計應計專案且其數額爲 Oit,則 有 it it it it C = A + O − I (1.2.65) 一般地,企業爲維持再生産所進行的追加投資 Iit 與折舊額 Oit 基本相等,故進一步有 Cit=Ait。 可見,會計指標如每股盈利等直接反映了企業現金淨流量 Cit 的狀況,從而在股票價格的確定 中起著重要作用
在股票的市場風險值β的計算中,會計資料同樣扮演著重要角色。 Ramada(1969)對資本結 構與β係數之間的關係進行了實證分析並得岀結論ε較高的負債比率會導致較髙的市場風險。 Relicher與Rush(1974)則發現公司的盈餘狀況與財務杠杆對β係數有顯著影響 Bildersee(1975) 以逐步回歸的方法,選岀了對β係數具有重要解釋能力的會計變數依次是負債比率、優先股權 比率、流動比率、財務杠杆的標準差、銷貨與普通股權益之比。所以在一個完善的資本市場中, 股價與會計資訊間肯定存在著一定的函數關係這種函數關係的存在反映了會計資訊在股市中 的重要地位與作用 設會計資訊爲X闩=l,…’n非會計資訊(如宏觀經濟政策,股市人氣狀況等)爲X=1,… m,則某一時點股價Y可表爲 Y=f(X1,…,Xm,X1,…,Xn) (1.2.66) 由於在同一時點,非會計資訊對各種股票的影響基本一致,故相對於各股票而言在同一時點可 將非會計資訊的作用表爲常量C。於是 Y=C0+f(x1,…,Xn) (1.267) Ohlson(1989)曾推斷在一定條件下,股價P與會計資訊間存在線性關係,這樣我們引進了多元 線性回歸: Y=C0+C1X1+…+CnX (1.2.68) 具體列出各項會計指標,一般主要有 X1:每股稅後利潤(元/股) Ⅺ2:每股淨資產值(元/股)=股本權益/股本數額; 杓:速動比率=速動資產/流動負債 Ⅺ4:應收帳款周轉率=主營業務收入/應收款平均餘額 s:銷售利潤率≡主營業務銷售利潤/主營業務收λ; X6:資本利潤率≡稅後利潤/股東權益 杓:流動比率=流動資產/流動負債 Ⅸ8:存貨周轉率=營業成本存貨平均餘額 採集資料代入多元線性回歸模型中,就可以估計出參數,並作岀檢驗分析。他通過回歸分析的 結論是,會計資訊對上海股價有明顯影響,影響最大的是每股稅後利潤其次是每股淨資產值, 再次是速動比率。他還具體計算岀,按採集資料的當時情況,每股稅後利潤每提高0.1元,股 價平均上升3.95元;每股淨資產每增加1元,股價平均上升3.375元:速動比率每提高1個 單位,股價平均上升0.85元。他的研究對優選個股有重要的參考價值。 算例1.2.4多元線性回歸統計量檢驗與回歸效果圖像顯示 下面我們給出具體數位例子,並演示軟體使用方法。假如我們選取三個引數,連同因變 數Y共採集18組資料。首先按軟體提示將資料鍵λ,形成一個資料檔案。然後在功能表上選 多元線性回歸,以下的提示與計算結果就列印出來
19 在股票的市場風險值β的計算中,會計資料同樣扮演著重要角色。Ramada(1969)對資本結 構與β係數之間的關係進行了實證分析並得出結論:較高的負債比率會導致較高的市場風險。 Relicher 與 Rush(1974)則發現公司的盈餘狀況與財務杠杆對β係數有顯著影響。Bildersee(1975) 以逐步回歸的方法,選出了對β係數具有重要解釋能力的會計變數依次是負債比率、優先股權 比率、流動比率、財務杠杆的標準差、銷貨與普通股權益之比。所以在一個完善的資本市場中, 股價與會計資訊間肯定存在著一定的函數關係,這種函數關係的存在反映了會計資訊在股市中 的重要地位與作用。 設會計資訊爲 Xi,i=1,…,n;非會計資訊(如宏觀經濟政策,股市人氣狀況等)爲 X j ~ ,j=1,…, m,則某一時點股價 Y 可表爲 ) ~ , , ~ , ~ , , ~ (X1 X m X1 Xn Y = f (1.2.66) 由於在同一時點,非會計資訊對各種股票的影響基本一致,故相對於各股票而言在同一時點可 將非會計資訊的作用表爲常量 C0。於是 ( , , ) 0 X1 Xn Y = C + f (1.2.67) Ohlson(1989)曾推斷在一定條件下,股價 P 與會計資訊間存在線性關係,這樣我們引進了多元 線性回歸: Y =C0+C1X1 ++CnXn (1.2.68) 具體列出各項會計指標,一般主要有: X1:每股稅後利潤(元 / 股); X2:每股淨資産值(元 / 股) = 股本權益 / 股本數額; X3:速動比率 = 速動資産 / 流動負債; X4:應收帳款周轉率 = 主營業務收入 / 應收款平均餘額; X5:銷售利潤率 = 主營業務銷售利潤 / 主營業務收入; X6:資本利潤率 = 稅後利潤 / 股東權益; X7:流動比率 = 流動資産 / 流動負債; X8:存貨周轉率=營業成本/存貨平均餘額。 採集資料代入多元線性回歸模型中,就可以估計出參數,並作出檢驗分析。他通過回歸分析的 結論是,會計資訊對上海股價有明顯影響,影響最大的是每股稅後利潤,其次是每股淨資産值, 再次是速動比率。他還具體計算出,按採集資料的當時情況,每股稅後利潤每提高 0.1 元,股 價平均上升 3.95 元;每股淨資産每增加 1 元,股價平均上升 3.375 元;速動比率每提高 1 個 單位,股價平均上升 0.85 元。他的研究對優選個股有重要的參考價值。 算例 1.2.4 多元線性回歸統計量檢驗與回歸效果圖像顯示 下面我們給出具體數位例子,並演示軟體使用方法。假如我們選取三個引數,連同因變 數 Y 共採集 18 組資料。首先按軟體提示將資料鍵入,形成一個資料檔案。然後在功能表上選 多元線性回歸,以下的提示與計算結果就列印出來。 -------------------------------------------------------------------------------------------------------------------------
般多元線性回歸模型計算程式,例1.2.4 例01241D中,n=18,m=3 第一列爲Y,以後各列爲X 要顯示原始資料嗎?0=不顯示,1=顯示(1:顯示) 11.2000 33 2.4000 4.3000 3.4000 13.3000 4.7000 3.9000 4.3000 17.7000 6.4000 5.5000 5.7000 13.7000 5.7000 4.3000 3.300 11.1000 3.1000 7000 4.5000 3.4000 13.6000 3.4000 4.7000 5.7000 15.9000 5.1000 17.8000 6.9000 5.9000 5.4000 5.6000 13.2000 3.7000 4.6000 5.1000 4.2000 2.9000 3.7000 12.90 4.7000 3.5000 5.6000 4.4000 4.5000 4.6000 15.9000 4.9000 4.8000 4.7000 11.7000 3.6000 5.7000 2.9000 現在作線性回歸顯著性檢驗,計算t,F,R統計量 請輸入顯著性水平a,通常取a=0.01,0.05,0.10,a=?(0.05) 線性回歸分析計算結果 樣本總數18 引數個數3 回歸方程Y=b0+b1*X1+.,+b3*X3 0.0627+ 1.3427X1+ 0.8217X2+ 0.9369X3 回歸係數b0,b1,b2, b 3 1.3427 殘差平方和 3.8878回歸平方和: 98.5583 誤差方差的估計 2160標準差= 4647 線性回歸顯著性檢驗顯著性水平:.050 回歸方程整體顯著性F檢驗,HO:b0=b1=..=b3=0 F統計量:118.3031F臨界值F(3,14)3.3439
20 一般多元線性回歸模型計算程式, 例 1.2.4 例 01241.D 中,n=18, m=3 第一列爲 Y, 以後各列爲 X 要顯示原始資料嗎? 0=不顯示, 1=顯示 (1:顯示) 9.1000 3.1000 2.4000 3.2000 11.2000 3.6000 4.3000 3.4000 13.3000 4.7000 3.9000 4.3000 17.7000 6.4000 5.5000 5.7000 13.7000 5.7000 4.3000 3.3000 11.1000 4.2000 3.1000 2.7000 13.7000 4.9000 4.5000 3.4000 13.6000 3.4000 4.7000 5.7000 15.9000 5.5000 5.1000 4.2000 17.8000 6.9000 5.9000 3.9000 17.4000 5.3000 5.4000 5.6000 13.2000 3.7000 4.6000 5.1000 11.5000 4.2000 2.9000 3.7000 12.9000 4.7000 3.5000 4.2000 12.3000 2.6000 5.6000 4.2000 13.1000 4.4000 4.5000 4.6000 15.9000 4.9000 4.8000 4.7000 11.7000 3.6000 5.7000 2.9000 現在作線性回歸顯著性檢驗, 計算 t,F,R 統計量 請輸入顯著性水平 a, 通常取 a=0.01, 0.05, 0.10, a=? (0.05) ----------------------------------------------------- 線 性 回 歸 分 析 計 算 結 果 樣本總數 18 引數個數 3 ----------------------------------------------------- 回歸方程 Y = b0+b1*X1+...+b 3*X 3 Y= -0.0627 + 1.3427 X1 + 0.8217 X2 + 0.9369 X3 回歸係數 b0, b1, b2, ..., b 3 -.0627 1.3427 .8217 .9369 ----------------------------------------------------- 殘差平方和: 3.8878 回歸平方和: 98.5583 誤差方差的估計 : .2160 標準差 = .4647 ----------------------------------------------------- 線 性 回 歸 顯 著 性 檢 驗 顯著性水平 : .050 ----------------------------------------------------- 回歸方程整體顯著性 F 檢驗, H0:b0=b1=...=b3=0 F 統計量: 118.3031 F 臨界值 F(3, 14) 3.3439