原文链接:http://tecdat.cn/?p=13885
代码语言:javascript复制本文目标是使用一些协变量(例如,驾驶员的年龄和汽车的年龄)来预测保险索赔的平均成本(请注意,此处的损失为责任损失)。通过对数链接从广义线性模型获得的预测。
> reg1=glm(cout~ageconducteur agevehicule,data=base,family=Gamma(link="log"))
可视化预测平均成本的代码如下:首先,我们必须计算特定值的预测,
代码语言:javascript复制> pred=function(x,y){
predict(reg,newdata=data.frame(ageconducteur=x,
agevehicule=y),type="response")
然后,我们使用此函数来计算网格上的值,
如果我们使用因子,而不是连续变量(这两个变量的简化版本),我们可以使用glm函数
(我们考虑的是笛卡尔乘积,因此将针对乘积,驾驶员年龄和汽车年龄的每个乘积计算值)
显然,我们在这里缺少了一些东西,让我们使用样条曲线平滑这两个变量,
使用加法平滑函数,我们获得了一个对称图(由于加法特性)
而带有二元样条回归gam
我不能在广义线性模型中使用双变量样条,但是考虑到广义可加模型(现在绝对不是可加模型),它确实可以工作。更准确地说,投资组合的分布是这两个协变量的函数,如下所示
因此,驾驶一辆新车的年轻驾驶员的比例和驾驶一辆非常旧的汽车的老年驾驶员的比例相当小,如果目标是找到合适的位置,则应更仔细地看一下预测,但如果目标是为了使每个人都能获得保险,也许我们应该允许某些司机的价格被低估(尤其是在投资组合中很少见的情况下)。并且应该记住,平均成本对巨额亏损极为敏感。
点击标题查阅往期内容
R语言预测人口死亡率:用李·卡特(Lee-Carter)模型、非线性模型进行平滑估计
R语言再保险合同定价案例研究
R语言模拟保险模型中分类器的ROC曲线不良表现
R语言分析负利率下金融市场:负利率和年金价值的变化
NBA体育决策中的数据挖掘分析:线性模型和蒙特卡罗模拟
基于R语言的lmer混合线性回归模型
Python用PyMC3实现贝叶斯线性回归模型
python用线性回归预测股票价格
R语言中Gibbs抽样的Bayesian简单线性回归
R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
SPSS中的等级线性模型Multilevel linear models研究整容手术数据
用R语言用Nelson Siegel和线性插值模型对债券价格和收益率建模
R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归
R语言用线性模型进行预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM
更多内容,请点击左下角“阅读原文”查看报告全文