代码改变世界

精算学链梯法的统计模型原理

2015-11-16 09:42  JonesVale  阅读(5721)  评论(0编辑  收藏  举报

【本文的理解难度:中等】

今天整理的主题是关于链梯法的,看上去似乎非常的不屑于一谈,可能有些同仁觉得太基础了,给非精算人员“扫盲”还可以,要是给精算圈内的同仁讲,似乎有点太“小儿科”了。呵呵,还千万别这么主观想象。这个主题是圈内不止一个人问过我的,感觉很有必要说说,似乎很多人对非常基础的链梯法(Chain Ladder)并不是很了解,呵呵
 
这个问题很有意思,一个朋友问我,为什么链梯法的进展因子(LDF)的选择有金额加权平均法、简单加权平均法之分?哪个才是最正确的LDF选择方法?是不是永远都是金额加权平均优于简单加权平均?看到有的人的答复很简单,都是人为主观判断的,这么平均都可以,关键还是人为的主观经验的最后选择。这个答案没错,但是,我觉得针对一些进入行的精算职业新人,还是很有必要深入了解链梯法的统计模型原理。今天主要就是说说这个。
 
链梯法的模型在形式上是很简单的,y=c*x+e,y为下一年的累积赔款,x为上一年的累积赔款,c被称为损失进展因子即LDF,e为随机波动误差。但是,模型背后的概率假设是相当重要的,也正是由于模型背后的概率分布假设,直接影响了c因子即损失进展因子LDF的确定方法。
 
(一)LDF金额加权平均法的概率模型
 
最为常用的LDF金额加权平均方法,实际上是基于上述模型服从Poisson分布的假设。在Poisson分布假设下,y服从于以c*x为均值的Poisson分布,使用极大似然估计法(MLE),可以推导出,在链梯法模型服从Poisson分布的情况下,进展因子c=sum(Yi)/sum(Xi),这个就是LDF的金额加权平均结果。基于Poisson分布的假设对赔款金额来说不是很合理,但是,从链梯法的发展历史上讲,最开始链梯法是用来针对赔款案件数(claim counts)而非赔款金额(claim amount)的,因此,赔款案件数服从Poisson分布还算可以理解,但是如果考虑到每个赔案的赔款金额,显然poisson分布就显得不太合理了。
 
(二)LDF简单平均法的概率模型
 
LDF的简单平均法,一般被人们普遍认为没有金额加权平均法合理,但实际上未必如此,需要我们去如何看待这个问题。
 
一般地,我们通常假设赔款金额的分布是偏态的,这样,一个很常用的概率模型分布是Gamma分布。我们可以推导出,假设链梯法模型y=c*x+e是服从Gamma分布,即Y服从于以c*x为均值的Gamma分布(方差因子没有关系,在MLE推导过程中是可以抵消的),使用极大似然估计法(MLE)可以推导出,进展因子c=sum(Yi/Xi)/n,这个就是LDF的简单平均法结果。可见,LDF简单平均法的结果是将链梯法模型基于Gamma概率分布假设做出的,从某种意义上讲,它同样具有着较强的理论支持。
 
(三)最小二乘法(LSM)下的LDF确定
 
最小二乘法是确定模型参数的一种最常用方法之一,如果将链梯法模型y=c*x+e采用LSM去做的话,得到的结果看上去比较奇快,是c=sum(Xi*Yi)/sum(Xi^2)。这个结果可以变形为c=sum(Xi^2*Yi/Xi)/sum(Xi^2),这也可以看成是一种加权平均方法,但不是简单的金额加权平均,而是金额平方加权平均。这种LDF确定方法在实务中很少被使用,主要是因为在计算上略微复杂一些。另外,诚如前几天一个同仁在部落中评论的,LSM假设了所有的Y都是同一个常数方差,与X的波动性无关,尽管Y的均值还是c*X,在这一点上可能不是很合理。
 
(四)广义线性模型(GLM)的随机残差概率分布
 
普通的线性模型既然不行,广义线性模型GLM用来计提准备金就成为了一种技术发展的方向。实际上,在使用广义线性模型GLM时,你会发现很多有趣的现象。由于GLM假设的随机残差概率分布的不同,结果会非常有意思。一个最经典的结果是,如果假设GLM的随机残差服从Poisson分布,那么模型的结果与采用LDF金额加权平均法的标准链梯法是不谋而合的。其中的道理实际上就是上面所讲的道理。
 
以上为对非常“小儿科”的链梯法技术的一点点解释,供问过此类问题的朋友和有兴趣的同仁参考。
摘自:http://blog.sina.com.cn/s/blog_5d87d79a0100l9xy.html