基于GB2分布的贝叶斯相依性准备金评估模型.doc

上传人:88****9 文档编号:19556 上传时间:2018-04-21 格式:DOC 页数:14 大小:1.72MB
返回 下载 相关 举报
基于GB2分布的贝叶斯相依性准备金评估模型.doc_第1页
第1页 / 共14页
基于GB2分布的贝叶斯相依性准备金评估模型.doc_第2页
第2页 / 共14页
点击查看更多>>
资源描述

《基于GB2分布的贝叶斯相依性准备金评估模型.doc》由会员分享,可在线阅读,更多相关《基于GB2分布的贝叶斯相依性准备金评估模型.doc(14页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、第 35 卷第 1 期 统计研究 Vol 35, No. 1 2018 年 1 月 Statistical esearch Jan 2018 基 于 GB2 分 布 的 贝 叶 斯 相 依 性 * 准备 金 评 估 模 型 李政宵 孟生旺 估中 内容提要: 非寿险精算的核心问题之一是对未决赔 款准备 金进行准 确评估 。在未决 赔款准 备金评 ,多条业务线的流量三角形数据之间通常存在一定 的相依关 系 。为了 考虑不 同业务 线之间 的相依 关系对未决赔款准备金评估结果的 影响,本文 基于 GB2 分布建 立了一 种相依性 准备金 评估模 型,该模 型首先假设不同业务线的增量赔款服从 GB2

2、分布 并在分布的 期望中引 入事故年和 进展年作为 解释变, 量,引 入日历年随机效应描述各条业务线之间的相依关系 ; 然后 借助贝 叶斯 HMC 方法进 行参数 估计和 未决赔款准备金预测,最后给出了总准备金的预测分布 和评估 结果。本文 将该方 法应 用 到两条业 务线 的流量三角形数据进行实证研究,并与 现有其 他方法 进行了 比较。实证 研究结 果表明 ,基 于 GB2 分布 的相依性准备金评估模型对未决赔款准备金的尾部 风险和不确 定性的 考虑更 加充分 ,更 加适用 于评估 具有厚尾或者长尾特征的准备金数据。 关键词: 风险相依; GB2 分布; 贝叶斯方法 准备金评估; DOI:

3、 10. 19343 / j cnki 11 1302 /c 2018. 01. 010 中图分类号: O212 文献标识码: A 文章编 号: 1002 4565( 2018) 01 0091 13 Bayesian Dependent Loss eserving Distribution Models Based on GB2 Abstract: One of the most Li Zhengxiao Meng Shengwang critical problems in casualty insurance is to determine an appropriate * outsta

4、nding reserve for incurred but unpaid losses Forecasts and risk margins are often based on incremental or cumulative payment data corresponding to different business lines of loss triangles Modeling dependency among multiple loss triangles has important implication for the determination of loss rese

5、rves in property and casualty insurance In fact, owing to diversity of loss reserving data, it is critical to select the appropriate distribution Generalized beta distribution of the second kind ( GB2 distribution) has a flexible probability density function with four parameters, which nests various

6、 distributions with light and heavy tails, to facilitate accurate loss reserving in insurance applications This paper proposes a Bayesian model based on GB2 distribution to capture dependence between two cells of two different runoff triangles First, we use the GB2 distribution to fit the incrementa

7、l paid losses data and introduce accident year and development year as covariates Then, we suppose a dependence between all the observations that belong to the same calendar year ( CY ) for each line of business This model can be done by using the calendar year as common random effect For illustrati

8、on, the model is applied to a dataset from Shi ( 2011) where a Bayesian method is proposed to estimate the distribution 本文获国家社会科学基金重大项目 “巨灾保险的精算统计模型及其应用 研究 ”( 16ZDA052 ) 和 教育部人文社会 科学重点研 “ ”( 16JJD910001) 。 究基地重大项目 基于大数据的精算统计模型与风险管理问题研究 的资助 92 统计研究 2018 年 1 月 of the reserve The result shows that the

9、proposed model is more fully considered for the tail risk and uncertainty of the outstanding reserve than existing models, and is more suitable to model the loss reserving data with long and heavy tails Key words: Dependency; GB2 distribution; Bayesian Approach; Claims eserve 一 、引言 对于财产保险公司而言,主要的负债项

10、目就是各种类型的准备金,包括未到期责任准备金、未 决赔款准备金和理赔费用准备金等。准备金的评估值对保险公司的偿付能力具有决定性影响。未 到期责任准备金和理赔费用准备金的评估方法比较简单,不是本文研究的重点。未决赔款准备金 由于信息有限,评估难度较大,所以,关于未决赔款准备金评估方法的研究文献相对较多,本文也将 主要研究未决赔款准备金的评估方法。 非寿险未决赔款准备金评估通常使用增量赔款 或累积赔款的流量三角形数据,譬如 链梯法通, 常使用累积赔款的流量三角形数据 而泊松回归和伽马回归等广义线性模型通常使用增量赔款的, 流量三角形数据 。 从本质上看,未决赔款准备金是一个随机变量,其损失分布存在

11、一定的多样性。因此,在未决 赔款准备金的评估中选择合适的分布至关重要。当损失数据存在尖峰厚尾特征时,通常可以考虑 广义 t 分 布 ( Chan 等, 2008 ) 、帕 累 托 分 布 ( Zehnwirth, 1994 ) 、 Burr 12 分 布 ( Cummins, 1999) 。 广义 t 分布虽然形状灵活且包含许多常用的损失分布在内 但是应用该分布时需要对原, 始数据进行对数变换,同时对小额索赔的变化较为敏感。通常情况下 损失数据包含大量的小额索, 赔,且具有右偏的特征,此时运用偏态厚尾分布进行拟合较为有效,例如偏 t 分布或者广义贝塔 型分布( 孟生旺,李政宵, 2016) 。

12、 广义贝塔 型分布( Generalized Beta Distribution of the Second Kind,简称为 GB2 分布) 是一种 包含 4 个参数的连续型分布,不仅具有灵活的密度函数 ,许多常见分布还是它的特例 。对于特定 的参数取值, GB2 分布可以简化为许多常见的分布 ,譬如,三参数的对数 t 分布、广义伽马分布和 Burr 分布 二参数的对数柯西分布; 、对数正态分布、威布尔分布、伽马分布、F 分布、 Lomax 分布和对 数逻辑斯特分布; 以及一参数的半正态分布、瑞利分布、指数分布和卡方分布。由此可见, GB2 分 布包含了许多轻尾和厚尾分布,形状更加灵活,适宜

13、处理不同特点的未决赔款流量三角形数据 。 在保险精算实务中,保险公司需要 对多个不同业务 线的未决赔款准备金进行预测。下面用 ( 1 L) 表示不同的业务线, i( 1 i I) 表示事故年, j( 1 j J) 表示进展年, t( t = i + j 1) 表示日历年。假设随机变量 Zij 表示第 个业务的第 i 个事故年在第 j 个进展年的增量赔款。 ij 0。准备金评估模型是根据流量三角形中上三角的赔付数据,对流量三角形中下三角的未决赔款进 行预测。下面用 Z 和 ZP 分别表示第 个业务的流量三角形中上三角和下三角的数据: ij ZP = Zij : i + j I + 1 基于流量三

14、角形数据预测未决赔款时,通常需要将增量赔款数据进行标准化处理。标准化的 增量赔款是增量赔款与风险单位数之比,风险单位数主要用于衡量业务规模,可以是保单数量或者 i Yij = Zij / i ,表示平均每个风险单位的增量赔款。第 t 个日历年的标准化增量赔款记为 Yt 。不 1 2 3 4 5 6 7 8 ( ) ( ) J , = 1, 2, , L j J, Z = ( ) () ( ) () Z = Z : i + j I + 1 ( ) ( ) ( ) 。 i , ( ) ( ) ( ) () 第 35 卷第 1 期 李政宵 孟生旺: 基于 GB2 分布的贝叶斯相依性准 备金评估模型

15、93 失一般性,假设事故年和进展年的期限相同,即 I 1 = J。 表 第 条业务线标准化 增量赔款的流量三角形数据 事故年 1 2 i 1 2 增量赔款的观测值: ij 进展年 j I 1 : I I 1 I 需要预测的增量赔款 YP = Yij : i + j I + 1 表 1 是标准化增量赔款的流量三角形数据结构。 将每 个事故年的增量赔款按照进展年的顺序 逐年累加,即可得到每个事故年的累积赔款数据。第 i 行第 j 列表示第 i 个事故年在第 j 个进展年的 ij P 同的日历年而言, t = 1, 2, 3, , I + 1,增量赔款的观 测值可以表示为 Yt = ( Yt j+1

16、, j, , Y1, t ) j =1, 2, , t。 为了更加直观地显示数据 表, 1 通过不同灰度区分了不同日历年的观测数据,相同的灰度表示观测 值具有相同的日历年。 在未决赔款准备金评估中,多条业务线之间的赔款通常存在一定的相依关系。相依关系可能 包括下述三种类型: 同一事故年在不同进展年的赔款之间存在的相依性; 同一进展年在不同事 故年的赔款之间存在的相依性; 同一日历年的赔款之间存在的相依性。赔款之间的相依性对总 准备金的评估结果具有重要影响,在相依 性条件下,保险公司的总准备金不等于各条业务线的准备 金之和,因此,保险公司不仅需要预测不同业务线的未决赔款准备金,还需要预测所有业务

17、线的总 准备金及其预测分布。 在相依性准备金评估方法的现有文献中 比较关注如何求解准备金预测值的均方误差表达式, , 譬如, Braun ( 2004 ) 在 多元 链梯 法的基 础上 推导 了准 备金 预测 值的 均方 误差; Merz ( 2008, 2009) 分别基于多 元链梯法 多元可加准备金评估方法以及两种方法的混合模型推导了准备、 金预测的均方误差。在本文的研究中,我们将重点关注未决赔款准备金的预测值及其分布,其中预 测值的分布可以运用蒙特卡洛模拟或者 Bootstrap 重抽样得到。譬如, Taylor ( 2007) 在广义线性模 型的框架下,运用 Bootstrap 方法验

18、证了预测误差 ; Brehm ( 2002) 运用对数正态分布拟合未决 赔款准备金数据,并用高斯 Copula 来构建不同业务线之间的相依关系。 Shi( 2011) 认为不同业 务线之间的相依性是由于相同的事故年和进展年引起的,并在模型引入高斯 Copula 和阿基米德 Copula 结构,运用蒙特卡洛随机模拟和 Bootstrap 重抽样的方法求解准备金的预测分布,该方法同 时考虑了待估计参数的不确定性和损失预测的不确定性,有效地减少了未决赔款准备金的预测误 差; Anas ( 2015) 用分层阿基米德 Copula 描述不同业务线之间的关系,同时考虑了相同的事故 年、进展年和日历年引起

19、的相依性; Dong( 2015) 运用贝叶斯方法在分位回归的基础上直接得到 了 未决赔款准备金的预测分布和风险边际; Zhang( 2014 ) 在贝叶斯框架下运用增长曲线来描述 赔款数据在不同业务线下的相依关系。 Baumgartner( 2015) 运用贝叶斯方法在模型的线性预测 项中引入相同的随机效应来构建损失数据之间的相依关系。应用贝叶斯方法的优点是,当模型参 数较多,而样本量较小时 可以运用先验信息进行补充 从而提高准备金预测的合理性, , 。 在现有研究基础上,本 文构建了一种基于 GB2 分布的准备金评估模型,同时考虑了不同业务 线之间存在的相依关系。该方法对 Baumgart

20、ner( 2015) 和 Dong ( 2013) 的模型进行了重组与 完善,并对 Shi( 2011) 的准备金评估结果进行了改进。本文的主要创新与贡献可以概括如下: ( ) ( ) ( ) ( ) ( ) ( ) () Y 。 Y , Y 。 ( ) ( ) () 9 10 13 14 15 16 17 18 19 20 19 8 15 94 统计研究 2018 年 1 月 第一,运用 GB2 分布代替常用的对数正态分布和伽马分布,直接在 GB2 分布的均值中引入事 故年和进展年作为解释变量,更加适合描述增量赔款数据的不同分布特征。 第二,在 GB2 分布的均值中引入日历年作为随机效应,通

21、过共同的日历年效应来描述多条业 务线之间存在的相依关系。 第三,应用贝叶斯 HMC 方法估计模型参数,可以同时考虑待估计参数的不确定性和损失预测 的不确定性,并直接得到准备金的预测分布。 第四,基于两条业务线的赔款数据进行实证研究, 将本文的方法与现有方法进行比较,检验了 本文方法的优势和实际应用价值。 二、广义贝塔 型分布( GB2 分布) 由于流量三角形的赔付数据样本量有限 所以在准备金评估过程中通常运用参数回归模型, ,如 泊松分布、对数正态分布或者伽马分布假设下的回归模型。当赔款数据存在厚尾特征时,可以使用 GB2 分布来改进对增量赔款数据的拟合效果。 GB2 分布定义在非负实数上,其

22、密度函数为: ( ) ( ) y 1 + ( y / ) 其中, 0,为尺度参数; ,为形状参数; 和 分别为偏度参数与峰度参数,且满足 0、 0。当参数 , 和 分别满足 1 / 和 2 / 时, GB2 分布的均值和方差存在, 分别为: B( , ) B( + 1 / , 1 / ) ( x + y) GB2 分布的分位数( 即风险度量值 Va) 可以通过贝塔分布求得 。因此, GB2 分布的分位 数( 即 Va 风险度量 值) 表示为: Beta , 当 GB2 分布的峰度参数 时, GB2 分布将退化为广义伽马分布。进一步令形状参数 = 1, 广义伽马分布就退化为常见的伽马分布。由此可

23、见,伽马分布和广义伽马分布都属于 GB2 分布的 特殊形式,这使得 GB2 分布在准备金评估中的适用范围更广。 三、相依性准备金评估模型 ( 一) 模型结构 ij GB2 分布的参数不完全相同。在每一个 GB2 分布的期望中引入解释变量,可以建立基于 GB2 分布 的均值回归模型如下: ( y/ ) f ( y ) = ( 1) B( + 1 / , 1 / ) E(Y) = ( 2) B( ,) B( + 2 / , 2 / ) Var( Y) = E( Y) 1 (3) ( x) ( y) 其中, B( x, y) 为贝塔函数,定义为: B( x,y) = 17 1 , , 0 1 F (

24、 u ) Beta Q( u) = (4) 1 , Beta , 0 ( ) ( ) ( ) ( ) ( ) Y ( , , , ) GB2 , 第 35 卷第 1 期 E Yij = exp ( ) 0 李政宵 + k =1 孟生旺: 基于 GB2 分布的贝叶斯相依性准备金评估模型 k xijk ( ) ( ) 95 ( 5) ( ) , x =( x , x , , x ) , ; , , , 其中 系数。 ij ij1 ij2 ijm 为解释变量 主要包括事故年和进展年 0 1 m 为回归 如果在上述回归模型中引入日历年 作为共同随机效应,即可构建相依条件下的 GB2 回归模型 如下:

25、m ij 0 k ijk t = i+j 1 k =1 m E Yij = exp 0 + k xijk + h t = i+j 1 , = 2, , L ( 7) k =1 其中, t = i+j 1 为随机截距项,随着日历年的变化而变化。随机截距项在不同的日历年之间相互 t = i+j 1 引起的不同业务线之间的相依关系。 h 为相依性调节系数,用于调节日历年效应对不同业务线的 不同影响。为了增强模型的可识别性,第一条业务线的相依性调节系数设定为 1。如果两条业务 线的相依性调节系数符号相同,表明这两条业务线的增量赔款之间存在正相依关系; 若符号相反, 则表示存在负相依关系。 ( 二) 贝

26、叶斯参数估计 应用贝叶斯方法估计模型参数 首先需要设定模型参数的先验分布, 。由于 GB2 分布的偏度参 数 0 和峰度参数 0,所以假设 GB2 的偏度参数 和峰度参数 都服从伽马分布 伽马分布, 的形状参数为 2,比率参数为 1 / c,即: v GA( 2, 1 / c ) , GA ( 2, 1 /c ) 。其中,当 c 的取值较大时( 如 c = 10) , v 和 的先验分布为无信息先验分布 。 GB2 分布的形状参数 在实数域上取值,所以假设其先验分布服从均值为 0,标准差为 10 的 正态分布,即 N( 0, 10 ) 。 2、比率参数为 4 的伽马分布,即: t = i+j

27、1 N( 0, ) , i i d for i = 1, 2, , I; j = 1, 2, , J GA( 2, 4) 假设式( 6) 和式( 7) 中回归系数的先验分布服从均值为 0、方差为常数的正态分布。在实际应 用中,回归系数通常选择无信息的先验分布 ,因此,可以将正态分布的方差设置为较大的值,使 得参数估计几乎完全取决于数据本身提供的信息,譬如,假设回归系数服从均值为 0、标准差为 5 的正态分布。 假设相 依性调节系数的先验分布为标准正态分布,即: k h N ( 0, 1) , = 2, , L 若将 GB2 回归模型中的参数分别记为 , , , ,其中 表示第 条业务线对应的参

28、数, 即 = ( 1 , , m , , , , h ) ,则模型参数 , , , 、随机效应 和超参数 的 联合先验分布可以表示为 f( , , , , , ) 。 相应地,模型参数的联合后验分布可以表示为: L I I +1 i i =1 j=1 ( 8) ( ) m () ( 1) ( 1) (1) E Y = exp + x + ( 6) ( ) ( ) ( ) () 2 2 0、 , N( 0, ) 。 21 ( ) 2 2 0、 , 2 22 ( ) 2 N( 0, 5 ) , k = 0, 1, 2, , m, = 1,2, , L ( ) 1 2 L ( ) ( ) ( ) (

29、 ) ( ) ( ) ( ) ( ) 1 2 L 1 2 L ( 1) ( L) 1 2 L ( ) ( ) ( ) ( ) 1 2 L () , , , , y 96 上式中,参数 ( ) ( ) () ( ) ij ( ) 统计研究 与 GB2 期望值之间的关系由式( 2) 确定,而 GB2 期望值与参数 ( ) 2018 年 1 月 = ( 1 , , m , , , , h ) 之间的关系 由式( 6) 和式( 7) 确定。运用 HMC 算法从式( 8) 的后验分 , 、 、 。 HMC 布中模拟生成参数的随机样本 即可求得相应参数的均值 中位数 可信区间以及预测分布 是贝叶斯 MCM

30、C 的一种特殊算法,与传统的 Gibbs 抽样和 MH 算法相比,收敛速度较快,可以通过 软件中的 stan 程序包实现 。 ( 三) 未决赔款准备金预测 未决赔款准备金评估的核心工作就是用流量三角形中上三角的已付增 量赔款数据来预测下三 角的未付增量赔款。为了简化表述,下面用 表示式( 8) 中的所有参数,即: 1 m = 1, 2, L 在给定模型参数 的情况下,不同业务线是互相独立的,因此,可以分别对不同业务线的未决 赔款准备金进行预 测并求得其预测分布 。运用贝叶斯方法进行未决赔款准备金预测 的步骤 如下: t =i +j 1 t = i+j 1 ( 2) 根据抽样得到的参数 1 ,

31、, m , h , , , ,分别计算不同业务线在 GB2 分布 ij k =1 B( + 1 / , 1 / ) k =1 B( + 1/ , 1 / ) ( 3) 根据 GB2 分布的参数 ( ij , , , ) ,应用式( 4) 可以模拟生成流量三角形中下三 ij 机模拟值 ,以及所有业务线未决赔款准备金之和的一个随机模拟值 ,即: I I = i Y ij , = 1, 2, , L i = 1 j = I i +1 L = =1 i ( 4) 将前述三个步骤重复多次( 如 10000 次) ,即可得到各条业务线未决赔款准备金的预测分 布,以及所有业务线未决赔款准备金之和的预测分布。

32、 在已知未决赔款准备金预测分布的条件下,很容易求得未决赔款准备金的均值、中位数和可信 区间,以及 Va 和 TVa 等风险度量值。 四、实 际数据分析 ( 一) 数据描述 本文的数据来自 Shi( 2011) ,数据集给出了每条业务线的 55 个已付增量赔款,以及每条业务 线在各个事故年的已收保费。在准备金评估之前 需要对增量赔款进行标准化处理, ,即用增量赔款 除以已收保费得到标准化增量赔款。 图 1 给出了两条业务线在不同事故年和进展年的增量赔款及其变化趋势。不难发现,对于同 一个事故年而言,当进展年较小时,两条业务线的增量赔款呈现出较为明显的差异,随着进展年的 增加,两条业务线的增量 赔

33、款趋于一致。另外,从两条业务线的陡峭程度可以发现,商业车业务线 ( ) () 23 1 2 L 2 ( ) ( ) ( ) ( ) ( ) ( ) 2 = ( , , , , ) = ( , , , , , , h , ) 19 2 2 ( 1) , N( 0, ) 。 ( ) ( ) ( ) ( ) () ( ) ( ) , : m B( , ) = exp + x + , = 1 ij 0 k ijk t=i +j 1 ( ) ( ) ( ) ( ) m B( , ) = exp + x + h , = 2, , L ij 0 k ijk t = i+j 1 ( ) ( ) ( ) ()

34、( ) Y : i + j I +1, = 1, 2, , L, ( ) ( ) ( ) () ( ) ( ) , i 。 第 35 卷第 1 期 李政宵 孟生旺: 基于 GB2 分布的贝叶斯相依性准备金评估模型 97 的增量赔款波动性较大。当进展到第 10 年时,两条业务线的增量赔款趋近于 0,这就表明两条业 务线在 10 年之内能够完全赔付完成。图 1 也给出了两条业务线增量赔款的散点图。散点图表明, 两条业务线的增量赔 款存在较为明显的非线性正相依关系。两条业务线增量赔款的皮尔逊相关系 数、 Kendall 秩相关系数和 Spearman 等级相关系数分别为 0. 73、 0. 65 和

35、 0. 84,相关性检验的 P 值都 显著不为 0。两条业务线增量赔款在相同事故年和相同进展年下的正相依关系可能来自于保险公 司理赔政策或市场环境的变化,譬如,如果保险公司加快理赔进度,就会使得所有业务在各个进展 年的增量赔款同时受到影响。 ( 二) 模型 构建 图 1 两条业务线标准化增量赔款的趋势和散点图 , 。 在建立未决赔款准备金评估模型之前 Shi( 2011) 首先需要根据增量赔款数据的特点选择合适的分布 分别运用对数正态分布和伽马分布拟合了私家车业务线和商业车业务线的增量赔款数 据。本文运用 GB2 分布代替伽马分布和对数正态分布,在 GB2 分布的尺度参数中引 入事故年和进 展

36、年作为解释变量,分别建立基于 GB2 分布假设下的回归模型,并与伽马分布和对数正态分布假 设的回归模型进行比较。 表 2 给出了运用贝叶斯方法得到不同分布假设下回归模型的 WAIC 统计量、 P _WAIC 统计量 以及 LPPD 值。 WAIC 称为广泛适用的信息准则,是对模型拟合效果和复杂程度进行综合评价的统 计指标,该统计量的值越小,表示相应的模型越好 。 P _WAIC 是对模型有效参数个数的估计结 果,反映模型的复杂 程度; LPPD 是对 数似然函 数的值,反映 模型的 拟合效 果 。 WAIC 可以通 过 2 ( LPPD P_WAIC) 计算得到。关于 WAIC、 P_WAIC 和 LPPD 的定义及其统计性质,可参见文 献 Ve

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 期刊短文 > 期刊

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com