第1章财产保险业务1153 离散型结构函数:二元和三元风险模型(Dispersion 表6-1-6 索赔次数的拟合值:泊松分布 Construction Function Binary and Ternary Risk 索赔次数k 观察值nk 拟合值 Model) 0 96978 96689.6 假设保单组合由两种类型的风险构成,其中高风险的保 1 9240 9773.5 单(泊松参数为入,)占α,低风险的保单(泊松参数为入2)占 2 704 493.9 a2,且α,+a2=1,则从保单组合中任意抽取的随机个体保单 3 为 16.6 的索赔次数分布为 4 9 0.4 >4 0 0 k=0,1,2,…(1) 合计 106974 106974.0 二元风险模型有4个未知参数,可用如下方程组求得其 从表6-1-6可以看出,这一拟合结果不甚理想,在x 矩估计值: 检验中被拒绝,因为计算值x2=191.41大于查表值x.。5= [a+a=1 5.991。这表明此保单组合是非同质的。 01入1+C2A2=1 2.负二项分布。若令负二项分布的均值和方差分别等于 (2) a(A+入1)+a2(A2+A2)=2 观察值x=0.1011和s2=0.1074,则可得参数的矩估计值为 1(A+3A7+A1)+a2(A2+3A径+A2)=a 2 其中α,2,a3为各级样本原点矩。当然,极大似然估 a=-i =1.6049 计值也是容易求得的。 =15.878 B-x 同理,假设保单组合由三种类型的风险构成,其中高风 参数的极大似然估计值为 险的保单(泊松参数为入1)占α,中等风险的保单(泊松参数 &=1.6313,p=16.1384 为A2)占2,低风险的保单(泊松参数为入,)占am,且a1+ 用负二项分布的拟合结果如表6-1-7所示。 %2+a=1,则从保单组合中任意抽取的随机个体保单的索 赔次数分布为 表6-1-7 索赔次数的拟合值:负二项分布 Aie-a Aie-2 索赔次数k 观察值k 拟合值(矩估计)拟合值(极大似然估计) P=a++ k=0.1,2.… 0 96978 96985.5 96980.8 (3) 9240 9222.5 9230.9 三元风险模型的参数估计与二元风险模型类似。 2 704 711.7 708.6 表6-1-5给出了一家保险公司1976年汽车第三者责 43 50.7 50.1 任保险索赔的观察分布。它包括106974辆被保险汽车,每 4 9 3.6 3.4 辆汽车签订一份保单,因此保单数也就是被保险的汽车数。 >4 0 0 0.2 每辆汽车的保险责任都是1976年全年,即没有中途退保的汽 合计 106974 106974.0 106974.0 车,也没有未及时续保的汽车。从表6-1-5的数据容易计 从表6-1-7可以看出,与泊松分布相比,负二项分布的 算出索赔次数的均值为x=0.1011.方差为s2=0.1074。 拟合效果较好。 表6-1-5 索赔次数的观察值 3.泊松一逆高斯分布。泊松一逆高斯分布参数的矩估 计值为 索赔次数 保单数nk f=0.101081,p=0.062979 0 96978 极大似然估计值为7=0.101081,B=0.062698。 1 9240 泊松一逆高斯分布的拟合结果如表6-1-8所示。 2 704 表6-1-8 索赔次数的拟合值:泊松一逆高斯分布 3 43 索赔次数k 观察值d 拟合值(矩估计)拟合值(极大似然估计) 4 9 0 96978 96979.8 96978.5 >4 0 9240 9238.2 9240.4 合计 106974 704 698.4 697.6 下面用各种索赔次数模型对此观察分布进行拟合。 43 53.0 52.9 1.泊松分布。泊松分布参数的矩估计和极大似然估计 9 4.2 4.2 >4 都是观察分布的均值,即无=0.1011。将这一估计值代入泊 0 0 0.4 106974 106974.0 106974.0 松分布的密度函数即得泊松分布的概率P.(k=0,1,2, 合计 ),用此概率乘以样本容量即得索赔次数的拟合值,如表 泊松一逆高斯分布的拟合效果也不错。 6-1-6所示。 4.二元风险模型。二元风险模型参数的矩估计值为
1154第六篇保险实务定量分析 a=0.0888,i,=0.3567 分布,Paretoe分布、对数伽玛分布和Weibull分布。 c2=0.9112,i2=0.0762 指数分布(ludex Distribution)假设某种随机事件在一 上述结果表明,在这一组保单中,有8.88%是高风险的 定时期内发生的次数服从泊松分布,则相邻两次随机事件的 司机,索赔频率为0.3576:有91.12%是低风险的司机,索赔 间隔时间服从指数分布。指数分布的密度函数为 频率为0.0762。 f(x)=Ae x>0 (1) 二元风险模型的拟合结果如表6-1-9所示。 分布函数为 表6-1-9 索赔次数的拟合值:二元风险模型 F(x)=1-e x>0 (2) 指数分布是伽玛分布当x=1,B=A时的特例,因此有关 索赔次数k 观察值k 拟合值(矩估计) 性质可以参见关于伽玛分布。 0 96978 96975.0 伽玛分布(Gamma Distribution)假设某种随机事件在 9240 9252.2 2 704 685.0 一定时期内发生的次数服从泊松分布,则第,次随机事件发 3 43 56.9 生所需的间隔时间服从参数为(T,β)的伽玛分布,密度函 9 4.6 数为 >4 0.3 (3) 合计 106974 106974.0 若将,的取值范围从整数域推广到正实数域即得通常的 从表6-1-9可以看出二元风险模型的拟合效果较好。 伽玛分布,其密度函数为 八x)sEx a>0,B>0 (4) 索赔频率(Claim Frequency) (a)e 索赔频率是指每一危险单位在一定保险期限内(通常 伽玛分布的k阶原点矩为 A- 为1年)发生的期望索赔次数,可以通过索赔次数与危险单 E[X]= +i (5) 位数之比进行估计。假设保险公司承保的某个险种包含N d B 个危险单位,实际发生了次索赔,那么索赔频率的点估计 因此伽玛分布的均值和方差分别为 值则为 E[X]a/B (6) p n/N ar)-合 (7) 例:某保险公司1996年汽车第三者责任保险的有效保 伽玛分布的矩估计量为 单数如表6-1-10所示,假设1996年发生了10820次索赔, 试计算索赔频率的点估计值。 (8) m2-mi 表6-1-10 1996年各季初的有效保单数 B=- m (9) 时 间 有效保单数 m2 -mi 1996年1月1日 106954 对数正态分布(Logrithm Normal Distribution)假设随机 1996年4月1日 106988 变量X取对数后服从正态分布N(μ,2),则X服从对数正态 1996年7月1日 107452 分布,参数为μ和σ。对数正态分布的密度函数为 1996年10月1日 107231 f(x)=- _(lnx-)2 1997年1月1日 107694 一exp{ 2rx 22 x>0(10) 根据表6-1-10的数据,可以首先计算各个季度的平均 分布函数为 有效保单数: )=。) (11) 第一季度: (106954+106988)/2=106971 式中,中(·)一标准正态分布函数。 第二季度: (106988+107452)/2=107220 对数正态分布的k阶原点矩为 第三季度: (107452+107231)/2=107342 E[X exp(uk +0.5) (12) 第四季度: (107231+107694)/2=107463 因此对数正态分布的均值和方差分别为 因此全年平均的有效保单数为 E[X]exp(u +0.52) (13) (106971+107220+107342+107463)/4=107249 Var[X]=exp(2μ)·exp(o2)·[exp(c2)-1](14) 索赔频率的估计值为 对数正态分布的矩估计量为 10820/107249=0.1009 μ=m'1,心=√m'2-m (15) 其中 损失理论分布模型(Loss Theory Distribution Model) 常见的损失分布模型有指数分布、伽玛分布、对数正态 m=(m) n
第1章财产保险业务1155 对数正态分布有一个很好的性质:设a和b是正实数,X k阶原点矩为 是参数为u和2的对数正态分布,则Y=a仍是对数正态 =(-合)B> (31) 分布,参数为u+lna和g2。 Paretoe分布(Paretoe Distribution)Paretoe分布的密度函 由此可见,对数伽玛分布只存在有限阶矩,这是由其密 数为 度函数的厚尾性所决定的。对数伽玛分布的均值和方差分 cB 别为 x)=(B+)丽 x>0 (16) (32) 分布函数为 F(x)=1- B (B+x) (17) a0-(g是广-(6品)》产B>2 (33) k阶原点矩为 α和B的矩估计量为 m'经 a s- m'2-m'月 ELX]-B'k/(a-i) k<& (18) B=- m' (34) 均值和方差分别为 m'2-m' E[X]=B/(a-1),a>1 (19) 其中 aB ar[x=(a-1产(a-2 a>2 (20) m,=i1,2 n Paretoe分布的矩估计量为 2(2-m) 损失分布模型的通货膨胀影响(Inflation Effect of = (21)) m2-2m Loss Distribution Model) m m2 B=- (22) 若令X代表历史损失额的随机变量,Y代表模型应用时 m2-2m 期损失额的随机变量,为前后两期之间的通货膨胀率,即Y 其中 =(1+)X,则X与Y的分布函数之间存在如下关系: m,=立 F(y)=P[Y≤y] 分n =P[(x)X≤y] (1) 可以证明,当均值μ=E[X门保持不变,并令a→时,Pa retoe分布收敛到指数分布,分布参数为l/μ。参数为(a,B) =Px≤+] 的Paretoe分布乘以正实数c之后仍然服从Paretoe分布,相 应的分布参数为(α,B)。 J Weibull分布(Weibull Distribution)Weibull分布的概 如果X为连续型随机变量,则X与Y的密度函数之间有 率密度函数为 如下关系: f(x)=crx"-exp(-ex'),c >0,T >0 x >0 (23) (2) 分布函数为 )=, F(x)1-exp(-cx') (24) =(制 Weibull分布的k阶原点矩为 E[X]=cr(/灯+1)k=1,2,… 根据X与Y之间的上述关系式,容易由X的分布函数求 (25) 得Y的分布函数。事实上,除对数伽玛分布以外Y=(1+r)X 因此均值和方差分别为 具有与X相同的分布形式,只是分布参数有如表6-1-11 E[X]=cT(1/F+1) (26) Vam[X]=c2[r(2/x+1)-r2(1/x+1)](27) 所示的变化。 关于τ的矩估计方程为: 表6-1-11 通货膨胀对理论分布模型的影响 lnT(1+2/r)-2lnT(1+1/x)-nm2+lnm1=0 分 布 X的分布参数 Y=(1+r)X的分布参数 (28) 对数正态 μ,r 4+ln(1+r),c Paretoe c的矩估计为 a,B a,(1+r)B 伽玛 e=[I1+] a,B a,B/(1+r) (29) 对数伽玛 a,B 非对数伽玛 m Weibull c.T c/(1+r)1,T 对数伽玛分布(Logrithm Gamma Distribution)对数伽玛 分布的分布函数为F(x)=T(a:lx),密度函数为 fx)=B(Int)a 复合分布(Compound Distribution) x8"r(a) ,a>0,β>0 (30) 索赔次数与赔付额的合成分布在统计学中称作复合分
1156第六篇保险实务定量分析 布。复合分布的名称通常采用原索赔次数分布的名称,譬如 额由游戏人抛掷骰子确定,骰子出现几点,游戏人即得几元 当索赔次数分布为泊松分布时,相应的复合分布被称作复合 钱。如果游戏人只能抛掷两次硬币,试确定游戏人所得的奖 泊松分布:当索赔次数分布为负二项分布时,相应的复合分 励金额服从什么分布? 布被称作复合负二项分布。分析复合分布的目的是为分析 抛掷两次硬币,正面朝上的次数及其概率分别为 总赔付成本的分布。 正面朝上的次数 0 假设某保险人签发了两份保单A和B,每份保单可能发 1/4 1/2 1/4 生的损失额及相应的概率如表6-1-12所示。 每次奖励的金额服从如下分布: 表6-1-12 个体保单的损失额及其概率 奖励金额 1 2 3 4 5 6 6 概 率 1/6 1/6 1/6 1/6 1/6 1/6 损失额 概率 损失额 概率 0 0.60 0 0.70 游戏人获奖结果的复合分布见表6-1-15。 2000 0.30 200 0.20 表6-1-15 游戏人获奖结果的复合分布 20000 0.10 2000 0.06 获奖金额 正面朝上的次数 20000 0.04 f(x) F(x) 0 1 2 根据表6-1-12可以求出,保险公司对这两份保单的总 0 4 1/4 36/144 赔付成本及其相应的概率如表6-1-13所示。 1/2×1/6 1/12 48/144 表6-1-13 保险公司的总赔付成本及其概率 2 1/2×1/6 1/4×1/36 13/144 61/144 3 1/2×1/6 1/4×2/36 14/144 75/144 总黯付成本 概 率 4 1/2×1/6 1/4×3/36 15/144 90/144 B A+B AxB 1/2×1/6 1/4×4/36 16/144 106/144 0 0 0 0.60 0.70 0.42 6 1/2×1/6 1/4×5/36 17/144 123/144 0 200 200 0.60 0.20 0.12 7 1/4×6/36 6/144 129/144 0 2000 2000 0.60 0.06 0.036 8 1/4×5/36 5/144 134/144 0 20000 20000 0.60 0.04 0.024 1/4×4/36 4/144 138/144 2000 2000 0.30 0.70 0.21 o 1/4×3/36 3/144 141/144 2000 200 2200 0.30 0.20 0.06 11 1/4×2/36 2/144 143/144 12 1/144 2000 2000 4000 0.30 0.06 0.018 1/4×1/36 144/144 2000 20000 22000 0.30 0.04 0.012 当所有个体风险的损失额具有相同的分布函数时,复合 20000 20000 0.10 0.70 0.07 分布的密度函数和分布函数的一般表达式分别为 20000 200 20200 0.10 0.20 0.02 20000 2000 22000 0.10 0.06 0.006 fx)=∑p.f(x) n0 20000 20000 40000 0.10 0.04 0.004 和 将表6-1-13相同的总赔付成本所对应的概率相加即 F)=A.·F() (2) 得总赔付成本的复合分布如表6-1-14所示。 n=0 式中,x一总赔付成本: 表6-1-14 复合分布 f(x)一总赔付成本为x的概率: 总赔付成本 概率 累积概率 F(x)一总赔付成本小于或等于x的概率: 0 0.420 0.420 P。一在一年内发生n次索赔的概率: 200 0.120 0.540 “(x)一在一年内发生n次索赔后总赔付成本为x 2000 0.246 0.786 的概率: 2200 0.060 0.846 F“(x)一在一年内发生n次索赔后总赔付成本小于 4000 0.018 0.864 或等于x的概率。 20000 0.094 0.958 f"(x)和F(x)通常称作f(x)和F(x)的n重卷积,其 20200 0.020 0.978 中x为个体风险的损失额∫(x)为个体风险的损失额等于x 22000 0.018 0.996 的概率:F(x)为个体风险的损失额小于或等于x的概率。 40000 0.004 1.000 复合分布函数(Compound Distribution Function) 如果抛 复合分布的n重卷积(Compound Distribution Mul- 掷一枚质地均匀的硬币,出现正面朝上的概率为0.5。游戏 tiple Rolling Accumulation) 规则是,每出现一次正面朝上,游戏人可得一次奖励,奖励金 关于复合分布,n重卷积可以定义为,首先计算使得n次
第1章财产保险业务1157 索赔的总赔付成本为x的各种可能组合,然后将各种可能组 F“(x)=F*Fa-)(x) (2) 合出现的概率相加。 我们这里以游戏人抛掷三次骰子为例,试计算他的获奖 上述定义既适用于个体风险的损失额为同分布的情形, 金额服从什么分布。 也适用于非同分布的情形,对于两个不同的分布∫(x)和 若记一次抛掷结果的获奖金额服从概率函数为∫(x)的 g(x),它们的卷积可记为f(x)'g(x)。因此n重卷积也可 分布,则三次抛掷的获奖金额服从∫(x)的三重卷积。∫(x) 以分解为 的二重卷积在表6-1-15第4栏已得到,因此f(x)的三重 产“(x)=f*fa-)(x) (1) 卷积可以通过计算f(x)的二重卷积与∫(x)的卷积得到。具 和 体结果如表6-1-16所示。 表6-1-16 f(x)的三重卷积 f(x) 广2(x) f(x)"f2(x) f3(x) 1 1/6 1/6 1/36 3 1/6 2/36 1/6×1/36 1/216 4 1/6 3/36 1/6×2/36+1/6×1/36 3/216 5 1/6 4/36 1/6×3/36+1/6×2/36+1/6×1/36 6/216 6 1/6 5/36 1,/6×4/36+1/6×3/36+1/6×2/36+1/6×1/36 10/216 > 6/36 1/6×5/36+1/6×4/36+1/6×3/36+1/6×2/36+1/6×1/36 15/216 8 5/36 1/6×6/36+1/6×5/36+1/6×4/36+1/6×3/36+1/6×2/36+1/6×1/36 21/216 9 4/36 1/6x×5/36+1/6×6/36+1/6×5/36+1/6×4/36+1/6×3/36+1/6×2/36 25/216 0 3/36 1/6×4/36+1/6×5/36+1/6×6/36+1/6×5/36+1/6×4/36+1/6×3/36 27/216 11 2/36 1/6×3/36+1/6×4/36+1/6×5/36+1/6×6/36+1/6×5/36+1/6×4/36 27/216 12 1/36 1/6×2/36+1/6×3/36+1/6×4/36+1/6×5/36+1/6×6/36+1/6×536 25/216 13 1/6×2/36+1/6×2/36+1/6×3/36+1/6×4/36+1/6×5/36+1/6×6/36 21/216 14 1/6×2/36+1/6×2/36+1/6×3/36+1/6×4/36+1/6×5/36 15/216 的 1/6×2/36+1/6×2/36+1/6×3/36+1/6×4/36 10/216 16 1/6×2/36+1/6×2/36+1/6×3/36 6/216 公 1/6×2/36+1/6×2/36 3/216 18 1/6×1/36 1/216 下面我们给出卷积的数学定义。对于两个离散型的概 xe 率函数f(x)和g(x),它们的卷积厂g(x)被定义为 因此 fg(x)=∑fy)g(x-y) (3) F2(x)=2(y)d山 同样,两个连续型密度函数的卷积可定义为 =[yedy (7) fg(x)=fy)g(x-y)山 (4) =1-(1+x)e 应用Stieltjes积分,上两个卷积公式可表述为 计算复合分布的均值需要应用条件概率的一些结果。 若令N表示索赔次数的随机变量;X(i=1,2,…,N)表示 fg(x)=g(x-y)dF(y) (5) 每次赔付额的随机变量,且X,(i=1,2,…,N)独立同分布, 指数分布的二重卷积(Duplicate Rolling Accumulation of 则关于总赔付成本的随机变量可以表述为 Index Distribution)指数分布的密度函数为f(x)=e, S=X1+X2+…+X。 (8) x>0。由卷积的计算公式(4)式得 若记E[N]=n,E[X[X,]]=m,则有 E[S]=EE[SI N] fr2(x)=f)x-y)d西y =EINE[X, (9) E[mN] feve-(dy (6) nm 复合泊松分布的均值等于其方差,即E[N]=Var[N]= n,同时若令Var[X,]=c2,则有 Var[S]Var E[SI N]+E Var[SI N]