第1章财产保险业务1173 (名,,)=(… (2) 式中,C4一子集j,k,1,…的赔付成本(或索赔次数): n(x1,…,x) nu一子集j,k,1,…包含的保单数。 增加一个对生变量X:可以将上述每个保单子集划分 上述模型即为加法模型。 为两个新的保单子集。如果这两个保单子集都是非空的,即 在很多情况下,下述的乘法模型可能更加适用: n(名,…,x,0)与n(x,…,x,1)都大于零,则称这个保单 C…=nw…[B。×β)×β2(k)×β(I)×…]×eu 子集对新增变量是可分的。用M(k+1)表示可分保单子集 (6) 的数目,则有M(k+1)=M(k)+M(k+1)。 通过对数变换,上述模型即可转化为加法模型: 现在需要检验假设 In(Cu.)=In(n)+[InB'o InB'(j)+InB'2 () H0:Po(x1,…,x,0)=P(x1,…,x,0) lnβ'3(l)+…]+lne'w- (7) 对于所有的可分保单子集都是成立的。其对立假设H, 应该注意的是,乘法模型是点数计价系统的基础。在点 为:至少有一个可分保单子集不满足上述关系。 数计价系统中,每增加一个点数,保费都以固定的百分数 上述假设可以通过下述统计量进行检验: 增加。 m(k+1) +1)=i((…40)-i(…41)2 对于经过交叉分组的数据,为了估计模型参数,可以令 下式达到最小: n(x1,…,x,0)·n(x1,…,x) (3) o(x,“,x) 0- 在零假设H。成立的条件下,中(k+1)渐近服从自由度为 m(k+1)-1的x2分布。 =∑L4-[A±B)+B()+B()+] n (8) 参数估计多元回归法(Parameter Value Estimate Multiple Return Method) 对于1,2,…和j1,2.,将品=0展开即得 最常见的多元回归模型是加法多元线性回归模型。在 (其中下标为星号时,表示对相应变量的所有取值求和): 加法多元线性回归模型中,因变量(索赔频率、平均赔付额、y,…=邛+m..B(1)+几2.B(2)+…+n1,… 风险保费等等)被表示为若干个自变量(风险分级变量)的线 B2(1)+n2.…B2(2)+…+… 性组合。对于保单组合中的第i份保单 y1..…=n.B0+n1."B(1)+n1.B2(1)+n2, y:=B6+B1x1+B2x21+…+E (1) B2(2)+…+n1.1…B(1)+n12…B(2)+…+ 式中,y:一第i份保单的因变量取值: .…=n.B+n2.…2(2)+n2.…B(1)+n2. x一第i份保单的第j个自变量的取值: B2(2)+…+n21…B(1)+n2…B(2)+…+ B,一一常数,它表示第j个自变量对模型的贡献: EEEE E (9) &一随机误差项。 y1.…=n1.B。+n1.B2(1)+n1.B(1)+n2,… 模型参数可以在使下式达到最小的前提下求得: B(2)+…+n.…B(1)+n.i2…B(2)+…+… Q=∑=∑{y-(R+B4+B+…)(2)2.…=n2.…8。+n2.…8(2)+n2…B,(1)+n2… 在上述多元线性回归模型中,要求所有自变量都是数值 B(2)++n,21…B(1)+n,2…B(2)+…+… 变量。自变量的取值相对应。这种模型通常被称作加法多 元线性回归模型,在此模型中,因变量被表示为自变量的函y1…=n1“B。+n,1B(1)+n11…B(1)+n21 数的线性组合: β,(2)+…+n,n…B2(1)+n21…B2(2)+…+… =B0+B(x)+B2(2)+…+E (3)y.2…=n.2B。+n.sB(2)+n12…B(1)+n22… 式中,少一第i份保单的因变量取值: B(2)+…+n.22(1)+n,2B2(2)+…+ x。一第i份保单的第j个自变量的取值: 如果有m个风险分级变量,共取k个值,则上述方程组包 B0一一函数,它表示第j个自变量在第i份保单上 含k+1个方程,有k+1个未知数。在上述方程组中,其中m 对模型的贡献: 个方程是多余的,因为对每一个变量所对应的所有方程求和即 e一随机误差项。 得第一个方程。因此,如果对一个特定变量的每一个参数加上 假设某个子集的自变量的取值为广,k,1…,且将其记为 一个常数,然后再从常数项中减去,则拟合值不会改变。 子集j,k,1…则对属于该子集的个体保单,可以记 为了求得惟一解,可以对每个变量的某个参数任意赋 y=B。+B)+B2(k)+B(I)+…+Em…(4) 值。传统的做法是对每个定性变量附加一个方程,它们是: 其中y4一是因变量的取值,而自变量的取值是显然 m1..B(1)+n2.B(2)+…=0 的。对该子集的所有保单求和则有 n..B(1)+n.2.…B2(2)+…=0 (10) C4-=nm[B。×BGj)+B,(k)+B(I)+…]+ew.(5) n,1B(1)+n,2…B(2)+…=0
1174第六篇保险实务定量分析 上式等价于将定性变量的取值进行缩放使其均值为零。 在上式中,每个等式对应若干个方程,比如第一个等式 如果对所有的变量都作如此处理,则常数项将等于y的总对应的方程个数就是第一个分级变量的取值个数,第二个等 均值。 式对应的方程个数就是第二个分级变量的取值个数,依此 应该注意到(10)与(8)是不同的,而且(8)并非是惟一 类推。 的一个可以通过极小化拟合模型参数的函数。如果令 如果预选的分级变量有P个,而所有变量的总取值个数 au…=B+B()+B2()+B(I)…(11)为m个,则(2)式包含m个方程,m+1个未知数。解决这一 为子集,k,1,…中每份保单的期望值,则可以将(8)表 问题的通常做法是对常数项B。取任意值,比如取 示为(省略下标): B=1 Q=∑c-na2 (12) 或 n 如果误差项ε是一正态随机变量,且独立于风险分级变 B= 量,则上式在统计上是最优的。如果因变量C是一泊松随机 na -. 变量,均值为na,则统计上的最优拟合可通过对下式极小化 后一取值为总平均经验风险保费。 求得: 事实上,上述方程组中有P-1个线性依从关系,但这并 0=∑(C-na2 (13) 不影响下文给出的迭代结果。由方程组(2)可知: no 一种极端的情况就是给每一子集赋予完全相同的权数, ∑∑…Cw B()=- 此时,(12)式变形为 ×〉mw-×A)×A0X一 0=∑(G-na2 (14) n ∑∑…C4 一种折中的处理方法是给每一个子集赋予的权数等于 B()= A×∑∑n4.×B)×B(W× (3) 其风险单位数的平方根,此时(12)式变形为 0=∑ (15) B(I)= ≥264 在上述模型中,关于正态分布和线性的基本假设在实际 A×≥子m4-×B0)xB,(X 问题中通常会遭到破坏。数值变量与真实的风险保费之间 的关系极少是线性的,取对数后也很少是线性的,而且,不同 上述迭代方程组中,除去一个分级变量所对应的相对保 的风险分级变量之间也通常不存在线性关系。由于赔付额 费水平之外,其他分级变量相对保费水平可取任意初值(通 或索赔次数不可能是负值。因此误差项一般是下截断的,从 常取1)并将其代入(3)式进行迭代计算,很快即可得到收敛 而正态分布的假设只能近似成立。然而,上述模型具有便于 结果。 实际应用的优点,而且在多数情况下,其结果也能给出一个 可以接受的合理近似。 参数估计的Brigstock方法(Bringstook Method of 参数估计的边际总和法(Parameter Estimate Mar. Parameter Estimate) ginal Total Method) Brigstock(1980)提出了一种应用单步骤分析法对费率结 一个理想的费率结构应该是能够使对于那些保单数量很 构进行调整的方法。从数学的角度看,这种方法与边际总和 大的组别,其风险保费应该等于该组实际观察到的赔付成本。 法相似,这种方法对数据处理的要求也不算太高,但是,应用 特别地,在交叉分组的系统中,每一变量所对应的风险保费的 该方法的一个基本前提是,必须存在一个能较好反映经验赔 边际总和应该等于相应的实际赔付成本。对于所有变量均为 付成本的费率结构。 定性变量的乘法模型而言,可以通过简单的递推方法求得 Brigstock方法对每个变量的调整是独立进行的。它在一 此解。 张表中反映每个变量取值所对应的商业毛保费和实际赔付 乘法模型的一般表达式为 成本。将每个组别的保费盈余或保费不足与总体平均数进 CH…=nw[B×B)×B2(k)×B(I)×…]×Ew…(1) 行对比,从而判断哪些组别的经营情况好于总体平均数,哪 为了使得风险保费的边际总和等于实际赔付成本的边些组别的经营情况不如总体平均数。据此可以对某些变量 际总和,令 的风险保费进行调整,使其保费盈余接近于总体平均数(或 .-=B×B,02于uB)×g0X… 其他理想值)。作为更加经常化的调整,对总体平均保费的 调整是以总体平均盈余为基础的。 6=AA孚子uAxA0X (2) 如表6-1-32根据被保险人的年龄分析了某家保险公 C,=R×B()∑∑nw-B×B()×… 司私人汽车保单的索赔经历数据,从中可以看出,平均每份 保单的保费随着年龄不同而有很大变化
第1章财产保险业务1175 表6-1-32 一个汽车保单组合的索赔经历 平均索赔频率(%) 平均赔付额(元) 年 龄 保单年数 已赚保费 索赔次数 赔付额 平均已赚保费(元) (1) (千元)(2) (3) (千元)(4) (5)=(2)/(1) (6)=(3)/(1) (7)=(4)/(3) 16-20 12503 2347 2842 2155 188 22.7 758 21-24 18329 2732 2990 2227 149 16.3 745 25-29 30507 3371 4021 2583 110 13.2 642 3034 37695 3641 4222 2415 97 11.2 572 35-39 34372 3238 3822 2121 94 11.1 555 4044 33391 3226 4007 2274 97 12.0 567 45-49 32805 3189 3963 2294 97 12.1 579 50-54 32774 3087 3671 1957 94 11.2 533 55-59 27462 2455 2878 1506 89 10.5 523 60以上 47779 3813 4587 2228 80 9.6 486 其他 43483 4078 4281 2161 94 9.8 505 合 计 351058 35176 41284 23920 100 11.8 579 从表6-1-32可以看出,整个保单组合的赔付率为23920/35176=68%。 表6-1-33和表6-1-34列示了两种不同的分析过程。 表6-1-33 赔付率分析 赔付率为68%时 年 质 黯付率(%)】 相对赔付率(%) 赔付成本(千元) 利润或亏损(千元) 16-20 91.85 135.07 1596 -559 2124 81.52 119.88 1858 -369 25-29 76.64 112.70 2292 -291 30-34 66.31 97.51 2476 61 35-39 65.51 96.34 2202 81 40~44 70.49 103.66 2193 -81 45-49 71.93 105.77 2168 -126 50-54 63.39 93.22 2099 142 55-59 61.32 90.17 1670 164 60以上 58.42 85.92 2593 365 其他 53.00 77.93 2773 612 合计 68.00 100.00 23920 0 表6-1-34 平均成本与利润分析 平均每份保单 每份保单提供32.06元盈余时 年龄 己赚保费(元) 赔付成本(元) 盈余(元) 已赚保费(元)】 赔付成本(千元) 利润或亏损(千元) 16-20 188 172 16 2347 2556 -209 21-24 149 122 27 2732 2815 -83 25~29 110 85 25 3371 3561 -190 30-34 97 64 3641 3623 18 35-39 94 62 32 3238 3223 15 40-44 97 68 西 3226 3344 -118 45-49 97 70 27 3189 3345 -156 50-54 94 60 34 3087 3008 79 5559 89 55 34 2455 2386 69 60以上 80 47 33 3813 3759 54 其他 94 50 4 4078 3555 523 合计 100 68 32 35176 35176 0
1176第六篇保险实务定量分析 表6-1-33是基于赔付率的分析。各组的赔付率是赔 进行统计检验,以判断拟合效果。方差分析法是常用的模型 付成本与已赚保费的比率,如16~20的年龄组的赔付率为 检验方法之一。 2155/2347=91.82%,这就意味着我们将成本和利润表示成 一个保单组合的方差可以分解为三部分: 了已赚保费的一个百分数。相对赔付率一栏给出了各组的 1.经交叉分组后所形成的风险子集内部的方差,它反映 赔付率与总体赔付率68%的比率。最后两栏反映了赔付率 个体保单与该风险子集的平均值之间的差异。 变化所造成的财务影响。其中,“赔付成本“栏给出了将赔付 2.由各风险子集的实际平均值与拟合值之间的差异所 率假设为68%时的赔付成本。如16~20年龄组,已赚保费 形成的方差。 为2347千元,如果假设赔付率为68%,则赔付成本应为2347 3.由各风险子集的拟合值与保单组合的总平均值之间 ×68%=1596千元。 的差异所形成的方差。 “利润”栏给出了假设赔付率为68%时的利润或亏损,它 第i份保单的方差可分解为下述三个组成部分: 是各组的实际赔付成本与假设赔付率为68%时的赔付成本 A=(a4-cg)2 之差,如16-20岁年龄组的实际赔付率为91.82%,实际赔 VB,=(C4--)2 付成本为2155千元,如果假设赔付率为68%,则赔付成本为 VC=(a.-m)2 1596千元,因而假设赔付率为68%时的亏损为1596-2155= V=VA VB VC -559千元。 式中,a,一第i份保单的观察值: 表6-1-34给出了平均每份保单的成本和利润。平均 cg一风险子集…的均值: 已赚保费减去平均每份保单的赔付成本即得平均每份保单 4—风险子集…的拟合值: 的盈余。如16~20岁年龄组,平均每份保单的已赚保费为 m一总体平均值; 2347千元/12503=187.7元,平均每份保单的赔付成本为 VA,一第i份保单对风险子集k…的内部方差的贡献: 2155千元/12503=172.4元,因此该组平均每份保单的盈余 VB,一第i份保单对风险子集…的均值与拟合值之 为187.7-172.4=15.3元。平均每份保单的盈余首先用于 间的方差的贡献: 弥补经营费用,所剩即为利润(或亏损)。 VC一第i份保单对风险子集…的拟合值与总体均 保险公司的已赚保费总额为35176千元,总赔付成本为 值之间的方差的贡献: 23920千元,因此总盈余为35176-23920=11256千元,平均 V一第i份保单(它属于风险子集k…)对方差的总 每份保单的盈余为11256千元/351058=32.06元。如果假设 贡献。 每份保单都提供32.06元的盈余,那么各组的总赔付成本和 如果省略下标表示对整个保单组合求和,则有 利润如表6132的最后两栏所示。其中“总赔付成本”是在 V=VA+VB+VC 实际赔付成本的基础上再加上每份保单的32.06元盈余计算 如果用N表示保单总数,则保单组合的总方差为V/N。 的。从商业保费中减去总成本即得每份保单提供32.06元盈 若令RA=A/V 余时的利润。仍以16-20岁年龄组为例,该组的实际赔付成 RB VB/V 本为2155千元,如果假设每份保单提供32.06元盈余,那么 RC VC/V 该组应该提供的盈余总额为32.06×12503=401千元,因此 则当模型对实际数据的拟合效果较好时,RB相对于RA 在假设每份保单提供32.06元盈余的前提下,该组的总赔付 和RC应该较小。 成本应该为2155+401=2556千元。而该组的已赚保费为 如果模型是适合的,那么风险子集…关于VB的期望 2347千元,因此在上述假设下,该组的总亏损为2347-2556 值可估计如下: =-209千元: VA EL VBA-]=N (2) 从上述分析可知: 利用上述关系式,可以识别出模型在哪些风险子集不太 (1)对年轻司机的保费附加不够充足。随着驾驶人年龄 适用。 的增长,他们的索赔经历越来越好。 (2)对年龄在29岁以下的司机应该有显著的保费附加。 x2拟合优度模型检验法(x2 Goodness of Fit Model (3)年龄在40~49岁的驾驶人具有比较糟糕的索赔经 Testing Method) 历。进一步的调查表明,这是由于他们的汽车被其子女驾驶 当我们没有个体保单的数据时,可以利用风险子集的期 所造成的。因此在费率结构中应该考虑父母的汽车是否充 望值与观察值进行拟合优度检验。令 许其子女驾驶。 A为风险子集…的观察值 E.为风险子集…的期望值 方差分析模型检验法(Varianceitem Model Test 则可以定义下述统计量 Method) 对任何一个模型,在将其用于厘定保险费率之前,必须 =∑4 E (1)
第1章财产保险业务117刀 其中求和号表示对所有非空风险子集求和。 S—第i期的季节波动值: 当上述观察值与期望值为索赔次数时,X统计量将服从 C一第i期的周期波动值: 自由度为n-p-1的X2分布,其中n为非空风险子集的个 R,—第i期的残差。 数,P为模型的待估参数个数。 则加法模型可表示为 Yi=T +S +C+R (1) 点数计价系统(Point-price System)】 乘法模型可表示为 在保险实务中,保费的呈现方式是十分重要的,它必须 Y,=T×SXC×R (2) 简单明了,便于保险代理人使用。在点数计价系统中,只需 乘法模型通过对数变换可转化为下述的加法模型: 两种类型的一维表,一种用于将每一个风险分级变量的不同 In(Y)In(T)In(S,)+In(C)+In(R;)(3) 取值转化为各种点数,另一种用于将不同的点数转化为相应 当然,在模型中引入其他类型的关系式,或构造加法与 的费率水平。 乘法混合型的模型都是可能的,但由于数学处理上的困难, 点数计价系统通常与边际总和法中的乘法模型相联系。 通常较少使用。 在乘法模型中,保险费率随着点数的增加而呈固定比率增 加法模型的优点是比其他模型都易于处理,但乘法模型 加。费率与点数之间的关系可表示为 对许多实际问题的拟合效果可能更好。在乘法模型中,季节波 P=BXR (1) 动和残差都倾向于随着长期趋势或周期波动的增加而增加,但 式中,P—费率水平; 在加法模型中,残差不会受到长期趋势和周期波动的影响。 B一当点数为零时的费率水平,可以选择B值使平均 为了预测变量Y,首先需要预测长期趋势T、季节波动$ 费率处在一个所希望的水平上; 和周期波动C。在一般情况下,可以通过简单的变换将季节 R一相邻两个费率水平之间的比率: 波动和周期波动从时间序列中消除掉,从而只剩下长期趋势 n=n1+n2+…为总点数。 进行分析。在另外一些情况下,应用乘法模型时可以将长期 几1为分级变量i所对应的点数,分级变量i的不同取值 趋势、季节波动和周期波动看做是三个独立的变量分别进行 对应着不同的点数,我们用n表示分级变量i取第j个值时 预测,然后将其结果综合在一起即可得到最终预测模型。 的点数。 R的取值不宜太大,否则会给竞争对手留下可乘之机。 稳定环境下的预测模型(Stable Environment Fore- R的合理取值范围为1.025到1.05之间。这样既能有效区分cast Model) 不同的风险水平,又不至于使得费率级别太多。 如果假定预测环境在过去是稳定的,在将来也不会发生 ,应在每一风险分级变量所对应的相对费率水平的基础变化,那么时间序列中将不包含长期趋势、季节波动或周期 上确定,并适当考虑定价策略的影响。从(1)式可以看出,ng 波动。此时Y.的预测值Y。,将是历史数据的算术平均 的绝对值并不重要,重要的是几g之间的相对差异。对一个风数,即 险分级变量的所有取值所对应的点数分别增加一个常数a, SY 仅仅意味着将常数B除以R的a次幂。因此,对每一个风险 k=1,2,… (1) 分级变量都可以任意确定其初始点数。 n 第i个风险分级变量的第j个取值所对应的点数为 关于Y。,的标准差可以用历史数据的标准差进行估计。 ny logR (ry)+k (2) 当我们难以肯定是否存在长期趋势时,可以使用指数平 其中Y,为第i个风险分级变量的第j个取值的费率 滑模型。指数平滑法对近期的观察值赋予相对较高的权数。 水平: 指数平滑模型可表示为: k是一常数,通常取一固定值,使得第i个风险分级变量 =aY。+(1-a)-,d (2) 所对应的最低费率水平的点数为零。 在上述表达式中,Y。是第n期的实际值,是夕-1.在第(n 对于连续型分级变量(比如保险金额),变量的取值范围 -1)期对第n期的预测值。由此可见,第(n+1)期的预测值 可以划分成若干个区间,从而使得相邻区间的费率水平以比 是n期的实际值与第n期的预测值的加权平均数。注意将此 率R递增。 式与可信性公式进行比较,它们是比较相似的。 时间序列预测模型(Time Order Forecast Model) 如果将指数平滑模型展开,则有 时间序列模型是具有惟自变量一时间的单变量模型,预 Yn1=aY。+a(1-a)Y-1+a(1-a)Y.-2+…(3) 测完全依赖于一个独立时间序列的观察值。即根据时间序 可以看出,指数平滑模型对最近期的数据赋予了最高的 列的观察值拟合一条曲线进行外推预测。加法模型和乘法 权数。 模型是时间序列模型的两种基本形式。若令 (2)式还可以表示为 Yy一第i期的观察值: nl=ae。+Ya-ll+ (4) T一第i期的长期趋势值: 其中e。=y。-y.-1:是第n期的实际值Y.与第n-1期