1168第六篇保险实务定量分析 得对期望索赔频率的最佳估计从a/B转变为(a+y)/(B+ 单组合的索赔经验确定,还可以纯粹是一种主观估计值。当 )。当保险人获得更新的信息时,可以重复进行上述过 已知该保单组合在当年的索赔经验以后,总赔付成本C可用 程。 于确定下述的可信性估计值: 如果平均赔付额为m,则保险人的期望年赔付成本为 P2 ZC+(1-Z)P, (2) E=N.g·m 完全可信性(Complete Liability)在什么情况下,直接数 (6) B 据才具有完全可信性,即可信性系数的取值可以为1。 经过简单的代数运算,(a+y)/(B+N)可表示为 假设当估计值可以有很高的概率(100p%)位于真值的 E c·m E+a·mN+E+a·m∵B (7) 一个较小区间(100k%)时,保险公司同意对直接数据赋予完 全可信性,这就意味着必须满足下述条件: 或 Pr[(1-k)Nxm <C<(1+k)Nxm]p (3) 片+1-20吕 (8) 或 其中: 器浩} (4) Z=E+a·m 可以看作是权数,即后验索赔频率的估计 当数据比较充足时,(C-Nxm)/Var(C)将近似服从标准 值是索赔频率的观察值y/N与先验估计a/B的加权平均数, 正态分布,假设式(4)服从标准正态分布,则有 权数分别为Z和(1-Z)。 kNxm y (5) 保险人的经验信息积累得越丰富,则E和Z的值越大, /Var(C) 从而赋予索赔频率观察值的权数越大。 其中y。是标准正态分布曲线上的一个点,它使得标准正 如果保险人对其先验估计缺乏信心,则变异系数1/将 态分布曲线下面从-y。到+y,的面积为P。 增大,从而a变小,Z增大,此时赋予索赔频率观察值y/N的 将Vam(C)=Nx(c2+m2)代入(5)即得完全可信性所需 的索赔次数为 权数增大,这一结果与人们的直观感觉相吻合。 n,=x=(1+(] (6) 可信性理论(Liability Theory) 式中,N一期望保单数。 所谓可信性理论,事实上就是根据历史赔付经验对续期 某些完全可信性系数的取值如表6-1-26所示。 保费进行调整的过程,目前还主要集中在汽车保险中。 表6-1-26 可信性理论的出现是由于某些险种缺乏直接信息所形 完全可信性系数(y,/k)2 成的。当某个险种的直接信息不足时,根据这种信息厘定的 k=0.3 k=0.2 k=0.1 k=0.05 k=0.01 保费就很不可靠。此时,在厘定保费中,必须利用其他相似 0.9 30 68 271 1082 27060 险种的间接信息。这就要求一种能将直接信息和间接信息 0.95 43 96 384 1537 38416 结合起来的方法。 0.99 74 166 663 2654 66358 通常用于估计未知参数Y的可信性方法可描述如下: 如果将完全可信性定义为以90%的可靠程度保证估计 了,是根据与研究对象直接相关但又不太充分的数据计 值位于真值±5%的区间内,则完全可信性所需的最小索赔 算的估计值: 次数为 Y,是根据其他间接数据计算的估计值。 未知参数Y的最终估计值可表示为 ,=1082[1+(g] (7) Y=ZY,+(1-Z)2 (1) 在完全可信性理论的应用中,1082是一个很常用的值, 可信性系数Z的取值在0与1之间。 它不仅假设只要能以90%的可靠程度保证估计值位于真值 其实,贝叶斯公式(8)关于期望索赔频率的估计也是一 ±5%的区间内,就可以应用完全可信性理论,而且假设所有 种可信性估计。 的赔付额是相等的,即σ=0。后一个假设在团体人寿保险中 假设某保单组合包含N份保单,每份保单的期望索赔频 比较合理,但在许多非寿险业务中却是不成立的。 率是x。该保单组合在给定年份的索赔次数服从参数为Nx 部分可信性(Partial Liability)在实际应用中,通常难以 的泊松分布。如果进一步假设赔付额是独立同分布的随机积累足够多的索赔数据以保证完全可信性公式的应用。在 变量,均值为m,方差为a2,则当年总期望赔付成本的均值为这种情况下,只能应用部分可信性,即Z<1。这就要求我们 Nxm,方差为Nx(c2+m2)。 确定Z的取值。 保险公司需要估计的是该保单组合的总风险保费,即P 1.有限波动原理。确定Z值的一种方法是有限波动原 =Wxm。在未知该保单组合在当年的索赔经验之前,可以得理。在可信性公式(4)中的间接估计值户2是一个固定值,它 到关于P的一个近似估计是P2。这个近似估计既可以根据 基于以前年份的赔付数据。总赔付成本C是基于当年赔付 该保单组合在以前年份的索赔经验确定,也可以根据相似保经验的随机变量。按照有限波动原理,可信性估计P,必须
第1章财产保险业务1169 以100%的概率位于真值±100k%的区间内。由于只有C 是随机变量,因此ZC必须以100p%的概率位于其期望值±k ⊙ Nxm的区间内。也就是说, 信 Pr (ZNxm -kNxm)ZC (ZNxm +kNxm)=P (8) 性 或 系 数 品器器‘z}o 当赔付数据足够充分时,(9)中的随机变量(C-Nxm)/ 期望赔付成本 Var(C)近似服从标准正态分布,此时将有 kNxm 图6-1-2可信性曲线 -yn (10) Z√Tar(C 如果假设图6-1-3中的切点位置是(Q,Q/(Q+K)), 将上式变形即得 则修正后的可信性曲线是 Z=kNxm (11) 。√Tar(c) (&,100) 可 离 信 2,Q/Q+) 性 用Nx(σ2+m2)代替Vam(C),用n代替期望索赔次数 系 Nx,则由(9)式可得 数 n z= (12) 期望赔付成本 例:某保险公司有8000份保单,当年的总赔付成本是 图6-1-3修正后的可信性曲线 450000元,而总风险保费是520000元。试问保险公司在下 「E 年应该收取多少保费? E+K 当E≤Q时 计算结果表明,完全可信性所需的索赔次数是445。由 1 4K(S-E) (14) 于期望索赔频率是0.03,所以8000份保单的期望索赔次数 (S+K)2 当Q<E≤S时 是240。将这些数据代入(12)式即得 当E>S时 2=√儒=05 其中 0=S-K 2 (15) 将其代入贝叶斯定理(8)式,即得8000份保单的总风险 保费是 公式(15)给出了关于K,Q,S的限制条件,它们必须都 P=0.735×450000+0.265×520000=468550 是正值,而且有 因此,每份保单在下一年度的风险保费为 0<0≤ (16) 468550/8000=58.6(元) 2.其他方法。可信性系数Z的取值必须在0与1之间。 0<K≤S (17) 当期望赔付成本E=Nxm较小时,可信性系数接近于0。随 3.方法的选择。将上述方法与有限波动原理作一比较 着期望赔付成本的增加,可信性系数将不断趋于1。从这些 是很有意义的。临界点S与完全可信性所需的期望索赔次 限制条件可知,当E较小时,可信性系数Z的增长速度相对 数n相对应,即S等于nr与平均赔付额的乘积。因此,有限 较快,而当E较大时,可信性系数的增长速度相对较慢。因 波动原理下的可信性系数可重新表示为 此通常假设Z服从下述的双曲线函数: Z= n 2= BE (13) (18) 式中,K一经适当选取的一个大于零的常数。 公式(13)表示的双曲线如图6-1-2所示,它随着期望 E 赔付成本的增加逐渐趋于1。 =NS 在实际应用中,当Z达到一定值之后,它将与1没有太 注意,当K接近于S时,由(15)可知Q接近于0,从而在 大区别,因此,通常可能选定一个点S,当Z值达到或超过S(14)式中的曲线部分较短,这就使得可信性曲线接近于一条 点之后,即可将其视为1。实际的可信性曲线又必须是一条直线,即 平滑曲线,因此可以通过临界点(S,1)作一条切线。修正后 (19) 的可信性曲线如图6-1-3所示。 2=1袋是=号
1170第六篇保险实务定量分析 无赔款折扣系统(Nor Claim Discount System) 示为表6-1-28所示的形式。 在汽车保险中,大多数国家的保险人都使用了无赔款 譬如,对于属于第1个等级的被保险人的,如果他发生2 折扣(NCD:No-Claim Discount)系统,即根据被保险人在上 次或2次以上的索赔(概率为1-P%-P1),他在下一个保险 一保险年度的索赔经验调整他次年的续期保费。无赔款折 年度将转入第6个等级:发生1次索赔(概率为P,),将转入 扣系统也被称作奖惩系统(BMS:Bonus-Malus System)。在 第3个等级:发生0次索赔(概率为P%),将继续缴纳第1个 NCD系统中,如果被保险人在过去的一个保险年度没有发 等级的保险费。因此,相应的转移概率如表6-1-28中的最 生索赔,保险人将降低其续期保费,否则将提高续期保费。 后一行所示。其余类推。 这种调整只考虑被保险人是否发生索赔以及索赔次数的多 表6-1-28 香港NCD系统的概率转移矩阵 少,而不考虑赔付金额的大小,表6-1-27给出了香港地 、新等级 区的NCD系统。 432 原等级 若用数学的语言,NCD系统可描述为: (1)所有的被保险人被分成有限个等级,每个等级用C, 6 1-Po Po 表示,i=1,2,…,s被保险人的年保费只依赖于他所属的等 1-Po Po 级(其中s表示等级总数): 1-Po Po (2)新投保的被保险人缴纳初始等级C。的保险费: 1-P% Po (3)被保险人的续期保费取决于他在上一个保险年度所 3 1-P%-P Po 属的等级和索赔次数。 1-Po-P1 P Po 表6-1-27 香港地区的NCD系统 计算稳态概率分布的方法有许多种,此处仅用其中的两种。 一年以后的等级(按索赔次数分) (1)计算转移矩阵的特征向量。 等级 费率水平 0 1 ≥2 稳态概率分布是特征值为1时转移矩阵的左特征向量, 6 100 5 6 6 因此,如果令稳态概率分布为(x6,x,x,x,2,x1,),则在 下述方程组 5 80 4 6 6 x6=x6(1-P)+x3(1-P0)+xa(1-%)+ 4 70 3 6 6 x3(1-%)+x2(1-P%-P1)+x(1-P%-P) 3 60 2 6 5=x6P0 2 50 6 x4 =xsPo 40 6 X3 xaPo +x1P 由此可见,NCD系统由下述三个要素组成:保费水平、初 X2 x3Po +x1P1 始等级和转移规则。其中转移规则是在已知被保险人的索 x x2Po +xP 赔次数时,决定被保险人从原等级转移到新等级的规则。譬 x6=x5+x4+x3+x2+x1=1 如在表6-1-27中,新投保的被保险人所属的初始等级是第 由于这7个方程线性相关,因此可删去第1个方程。假 6级,各个等级的保费水平如第二栏所示,最后三栏给出了转 设被保险人的索赔频率服从参数为入的泊松分布,则有 移规则。 Po =e 稳态概率分布(Firm Probability Distribution) P1 Ae 在NCD系统中,被保险人的续期保费等级只取决于他在 当时A=0.1时,P%=0.90484,P1=0.090484 解上述线性方程组可得 当年的保费等级和索赔次数,而与历史无关,因此上述保费 等级之间的转移过程事实上就是一个马尔可夫过程。如果 x1=0.77284 假设被保险人的索赔频率在时间上是稳定的,即不随时间而 x2=0.08128 变化,那么这个马尔可夫过程就是齐次的。 x3=0.08983 x4=0.02199 如果用M(入)表示马尔可夫过程的转移概率矩阵,则有 3=0.01618 PP2… P x6=0.01788 M(A)= P21 P2 (2)计算n步转移矩阵(转移矩阵的n次方)。 譬如计算上述转移矩阵的25次方即得25步转移概率矩 阵如表6-1-29所示。由此转移矩阵仍然可以得到上述的 其中P,表示从状态i转移到状态j的概率。在NCD系 稳态概率分布。 统中,就是从第i个等级转移到第j个等级的概率。 对于表6-1-27所示的NCD系统,转移概率矩阵可表
第1章财产保险业务1171 表6-1-29 25步转移概率矩阵 频率A的后验估计,简记为入1记F1(入1,A)为用入 b 与 3 2 (k,…,k,)估计A时的损失,它是一个关于估计误差(入1 0.017880.01618 0.02200 0.08984 0.08129 0.77281 入)的非负函数,称作损失函数:则我们希望下式(即平均损 0.017880.01618 0.02200 0.08983 0.08129 0.77282 失)达到最小: 0.017880.01618 0.02199 0.08983 0.08128 0.77283 0.017880.01618 0.02199 0.08983 0.08128 0.77284 F1(入1,A)u(A11,…,k)dn=最小 0.01788 0.01618 0.02199 0.08983 0.08128 0.77284 如果取损失函数F1(入1,A)=(入1-入)2,则上式 0.017880.016180.021990.089830.081280.77284 变为 由此可见,从长期来看,在香港的NCD系统中,索赔频率 为λ=0.1的被保险人缴纳的期望费率水平是 [A1-A]2u(a1k,…,k)d=最小 0.01788×100+0.01618×80+0.02199×70 由此可得 +0.08983×60+0.08128×50+0.77284×40 =44.81 A1=入·u(AIk,…,k)d八 对于其他索赔频率的被保险人,采用同样的方法可以求 上式表明,当前t年的索赔次数记录为k1,2,…,k,时, 得其期望费率水平如表6-1-30所示。 第(t+1)年关于入的最优估计为其后验均值。由于后验结 表6-1-30不同索赔频率的被保险人的期望保费水平 构函数u(入Ik,…,k,)服从参数为(a+k,B+t)的伽玛分 索黯频率 0.1 0.15 0.20 0.25 布,均值和方差分别为 期望费率水平 44.81 48.36 52.33 56.41 +k和a+k B+(B+)2 从表6-1-30可以看出,在香港的NCD系统中,被保险 人的费率水平与其索赔频率并非成正比例变化。NCD系统 从而第(1+1)年关于入的最优估计为:=盐 B+1 在区分不同风险水平的被保险人方面,功能十分有限。 至此我们得到了关于入在各个时期的最优估计序列: 入,入2,…入,…。当→∞时,这一估计序列趋于随机个体保 最优NCD系统(Best NCD System) 单的真实索赔频率A=/,而估计方差(a+k)/(B+)2趋于 最优NCD系统的主要目的是使每个被保险人缴纳的风 零。因此,对个体保单的观察时间越长,对其索赔频率的估 险保费与其真实的风险水平相适应。最优NCD系统可以在 计越准确。 不同的索赔次数模型下建立。 为简明起见,如果进一步假定对个体保单平均每次的赔 假设给定个体保单(用其索赔频率入标记)的索赔次数 付额为一个货币单位,则在期望值原理下,当随机个体保单 X服从参数为入的泊松分布,而保单组合关于入的结构函数 在1年内的索赔次数记录为k,2,…,k,时(其中k:为第i 服从参数为(α,β)的伽玛分布(这就意味着随机个体保单的 年的索赔次数),其第:+1年的续期风险保费应为 素略次数服从参数为“,号B)的负二项分布).即 P(,…,k)=(1+r)4=(1+r)g+ (4) B+t e P(X=)= 其中,为安全附加系数。这种根据个体保单的索赔经历 (k=1,2,…) (1) 调整其续期保费的系统即为所谓的最优NCD系统。 u(A)Be (2) I(a) 财险风险分级(Property Insurance Risk Degree) 则当随机个体保单在:年内的索赔次数记录为k,2, 所谓风险分级就是把被保险人按其风险大小进行分组, …,k,时(其中k为第i年的索赔次数),由Bayes定理可知, 并以分组结果厘定各组的保险费。风险分级的目的是为了 A的后验分布为 获得相对同质的风险子集,从而使得保费厘定有利于消除逆 P(k,…,k,IA)u(A) u(入|k1,…,k)= 选择和道德危险。 P(k,…,k,IA)u(A)dn 风险分级模型的建立有赖于将风险集合区划成同质的 =B+) 风险子集的能力,因此,风险分级在那些风险单位数量庞大 (3) 且近似特征较多的险种中具有十分重要的作用。比如汽车 I(a+k) 保险,家庭财产保险和小型企业保险等。 此即参数为(α+kB+t)的伽玛分布,其中k= ∑ko 然而,风险分级模型的建立要基于一系列风险分级变 因此随机个体保单的后验索赔次数服从参数为 量,每个变量可以取若干个不同的值。风险子集就是这些分 (++的负二项分布。 级变量交叉划分的结果。风险分级模型确定了每个风险子 集与单个风险分级变量之间的关系。 如果我们用入1(k,…,k)表示在第(t+1)年时对索赔 风险分级模型的内容,包括分级变量的选择,根据分级
1172第六篇保险实务定量分析 变量对数据的分组以及模型参数的估计等。 1,当定性变量的取值为S或W时 l0,其他 风险分级变量选择的单步骤分析法(Single Step A- 1,当定性变量的取值为S或D时 nalysis Method of Risk Degree Variable Choice) l0,其他 分析一个潜在的风险分级变量是否对被保险人的风险 1,当定性变量的取值为M或W时 水平具有显著影响,最简单的方法就是单步骤分析法,即排 10,其他 除其他变量不予考虑,在一个单变量的表格中只搜集该变量 「1,当定性变量的取值为M或D时 的数据并分析它对风险大小的区分能力。初步的分析可以 0,其他 基于索赔频率,平均赔付额或单位风险的平均赔付成本上。 「1,当定性变量的取值为W或D时 YwD 表6-1-31给出了一家保险公司的私人汽车保单组合 l0,其他 根据两个变量所确定的单步骤分析结果。这两个变量分别 1,当定性变量的取值为S,M或W时 是“是否是新投保人”和“购车款是否付清”。保险公司搜集 l0,其他 这两个变量的数据并不是用于厘定保费的,而仅仅是出于管 1,当定性变量的取值为S,M或D时 理上需要。表中的相对风险水平是赔付成本与风险保费的 0,其他 比率,假定整个保单组合的赔付成本与风险保费之比为100。 1,当定性变量的取值为S,W或D时 yswD 新投保人的风险水平要高于续保客户60%以上,未付清购车 l0.其他 款的投保人的风险水平要高于其他投保人80%以上。 1,当定性变量的取值为M,W或D时 注意 显然,单步骤分析的结果要求将上述两个变量都引入保 l0,其他 费厘定系统。 到ys与ywwn是两个互逆的变量,其他诸如yM与yswy,与 表6-1-31 单步骤分析表 Ysu Yn与yswm以及ysw与YwD.Ysw-与YwDYs知与yw都是互逆 的变量,因此上述对生变量中有一半是多余的。换言之,我 变量 变量值 相对风险水平 们只需7个对生变量即可表述上述所有的结果。更一般地, 新客户 143 是否是新投保人 如果定性变量有个取值,则所需要的对生变量数为: 续保客户 89 购车款未付清 157 2()+()+…+(”】 购车款是否付清 购车款已付清 86 如果事先忽略变量值的组合所产生的对生变量,而在后 面的分析中再引入特定的组合结果,则可将分析过程仅限于 n个定性变量值所对应的n个对生变量之上。 风险分级变量选择的Hallin-Inglebleek模型(Hal- 数值变量也可以进行对生化处理。首先将数值变量通 lin -Inglebleek Model of Risk Degree Variable 过分段处理转化成定性变量,然后采用上述方法形成对生变 Choice)】 量。若令ω为汽车保险中平均每周的行驶里程数,则可以用 Hallin-Inglebleek模型是一种非参数方法,它不需要任 下述的定性变量x代替之: 何建模假设。它所需要的仅仅是将所有的潜在风险分级变 r1,当0≤w<2000 量表述成对生变量(只取两个值:0或1)即可。 x={2,当2000≤w<3500 设一简例:定性变量一婚姻状况可以有未婚、已婚、丧偶 3,当3500≤w 和离异等四个取值。丧偶和离异之间的共性特征较多,因此 于是x可以进一步转化为3个对生变量。 应该将它们合并在一起分析。 下面考虑由k个对生变量X,…,X对一个保单集合进 如果用S,M,W和D分别表示定性变量的四个取值,则 行划分,形成M(k)个保单子集。每个特定的保单子集由对 有下述的对生变量: 生变量的一个取值x1,,x所确定。 「1,当定性变量的取值为S时 假设在M(k)个保单子集中,每个保单子集至少包含有 ys= 0,其他 一份保单。对于一个特定的保单子集,定义如下符号: 1,当定性变量的取值为M时 n(x,…,x)为保单数: l0,其他 no(x,…,x)为未发生索赔的保单数: 「1,当定性变量的取值为W时 n(x,…,x)为至少发生一次索赔的保单数: l0,其他 P%(,…,x)为未发生索赔的概率: 1,当定性变量的取值为D时 P1(x1,…,x)为至少发生一次索赔的概率。 yD 0,其他 则可以有如下估计: 1,当定性变量的取值为S或M时 l0.其他 %(名,…,4)="o(… (1) n(1,…,x)