精算学链梯法的统计模型原理

2015-11-16 09:42 JonesVale 阅读(6480) 评论(0) 收藏举报

【本文的理解难度：中等】

今天整理的主题是关于链梯法的，看上去似乎非常的不屑于一谈，可能有些同仁觉得太基础了，给非精算人员“扫盲”还可以，要是给精算圈内的同仁讲，似乎有点太“小儿科”了。呵呵，还千万别这么主观想象。这个主题是圈内不止一个人问过我的，感觉很有必要说说，似乎很多人对非常基础的链梯法（Chain Ladder）并不是很了解，呵呵

这个问题很有意思，一个朋友问我，为什么链梯法的进展因子（LDF）的选择有金额加权平均法、简单加权平均法之分？哪个才是最正确的LDF选择方法？是不是永远都是金额加权平均优于简单加权平均？看到有的人的答复很简单，都是人为主观判断的，这么平均都可以，关键还是人为的主观经验的最后选择。这个答案没错，但是，我觉得针对一些进入行的精算职业新人，还是很有必要深入了解链梯法的统计模型原理。今天主要就是说说这个。

链梯法的模型在形式上是很简单的，y=c*x+e，y为下一年的累积赔款，x为上一年的累积赔款，c被称为损失进展因子即LDF，e为随机波动误差。但是，模型背后的概率假设是相当重要的，也正是由于模型背后的概率分布假设，直接影响了c因子即损失进展因子LDF的确定方法。

（一）LDF金额加权平均法的概率模型

最为常用的LDF金额加权平均方法，实际上是基于上述模型服从Poisson分布的假设。在Poisson分布假设下，y服从于以c*x为均值的Poisson分布，使用极大似然估计法（MLE），可以推导出，在链梯法模型服从Poisson分布的情况下，进展因子c＝sum(Yi)/sum(Xi)，这个就是LDF的金额加权平均结果。基于Poisson分布的假设对赔款金额来说不是很合理，但是，从链梯法的发展历史上讲，最开始链梯法是用来针对赔款案件数（claim counts）而非赔款金额（claim amount）的，因此，赔款案件数服从Poisson分布还算可以理解，但是如果考虑到每个赔案的赔款金额，显然poisson分布就显得不太合理了。

（二）LDF简单平均法的概率模型

LDF的简单平均法，一般被人们普遍认为没有金额加权平均法合理，但实际上未必如此，需要我们去如何看待这个问题。

一般地，我们通常假设赔款金额的分布是偏态的，这样，一个很常用的概率模型分布是Gamma分布。我们可以推导出，假设链梯法模型y=c*x+e是服从Gamma分布，即Y服从于以c*x为均值的Gamma分布（方差因子没有关系，在MLE推导过程中是可以抵消的），使用极大似然估计法（MLE）可以推导出，进展因子c＝sum(Yi/Xi)/n，这个就是LDF的简单平均法结果。可见，LDF简单平均法的结果是将链梯法模型基于Gamma概率分布假设做出的，从某种意义上讲，它同样具有着较强的理论支持。

（三）最小二乘法（LSM）下的LDF确定

最小二乘法是确定模型参数的一种最常用方法之一，如果将链梯法模型y=c*x+e采用LSM去做的话，得到的结果看上去比较奇快，是c＝sum(Xi*Yi)/sum(Xi^2)。这个结果可以变形为c＝sum(Xi^2*Yi/Xi)/sum(Xi^2)，这也可以看成是一种加权平均方法，但不是简单的金额加权平均，而是金额平方加权平均。这种LDF确定方法在实务中很少被使用，主要是因为在计算上略微复杂一些。另外，诚如前几天一个同仁在部落中评论的，LSM假设了所有的Y都是同一个常数方差，与X的波动性无关，尽管Y的均值还是c*X，在这一点上可能不是很合理。

（四）广义线性模型（GLM）的随机残差概率分布

普通的线性模型既然不行，广义线性模型GLM用来计提准备金就成为了一种技术发展的方向。实际上，在使用广义线性模型GLM时，你会发现很多有趣的现象。由于GLM假设的随机残差概率分布的不同，结果会非常有意思。一个最经典的结果是，如果假设GLM的随机残差服从Poisson分布，那么模型的结果与采用LDF金额加权平均法的标准链梯法是不谋而合的。其中的道理实际上就是上面所讲的道理。

以上为对非常“小儿科”的链梯法技术的一点点解释，供问过此类问题的朋友和有兴趣的同仁参考。

摘自：http://blog.sina.com.cn/s/blog_5d87d79a0100l9xy.html

刷新页面返回顶部

风中的雨

精算学链梯法的统计模型原理

About