美文网首页统计方法
【点】模型选择标准:AIC与BIC

【点】模型选择标准:AIC与BIC

作者: JamesMori | 来源:发表于2021-07-26 09:22 被阅读0次

数据少,模型复杂,过拟合

数据多,训练得好,过拟合

需要标准来平衡,除了常见的正则化,还有其他标准。

1、赤池信息准则(Akaike Information Criterion,AIC)
AIC由日本统计学家赤池弘次在1974年提出,它建立在熵的概念上,提供了权衡估计模型复杂度和拟合数据优良性的标准。

通常情况下,AIC = 2k-2ln(L)
一组模型中选择最佳模型时,通常选择AIC最小的模型。

k是模型参数个数,L是似然函数。当两个模型之间存在较大差异时,模型差异主要体现在L;当模型相近时,模型差异主要体现在参数个数上。

一般而言,当模型复杂度提高(k增大)时,似然函数L也会增大,从而使AIC变小,但是k过大时,似然函数增速减缓,导致AIC增大,模型过于复杂容易造成过拟合现象。即模型参数为惩罚项,控制模型复杂程度在合理范围内。


2、贝叶斯信息准则(Bayesian Information Criterion,BIC)

通常情况下,BIC = k*ln(n) -2ln(L)

k为模型参数个数,n为样本数量,L为似然函数。BIC的惩罚项比AIC的大,考虑了样本数量,可以有效防止因样本量大而导致的过拟合。其次,BIC能够防止n较少时,k过高。

R的实现:

AIC:

packages:My.stepwise、AICcmodavg

第二个包比较复杂,可以自定义模型。

第一个包比较简单,但内置了生存分析:My.stepwise.coxph(Time,Status,variable.list,data)

相关文章

  • 【点】模型选择标准:AIC与BIC

    数据少,模型复杂,过拟合 数据多,训练得好,过拟合 需要标准来平衡,除了常见的正则化,还有其他标准。 1、赤池信息...

  • 模型选择之AIC与BIC

    此处模型选择我们只考虑模型参数数量,不涉及模型结构的选择。 很多参数估计问题均采用似然函数作为目标函数,当训练数据...

  • 模型选择方法:AIC和BIC

    推荐看一下参考文献【4】 引入【3】 经常地,对一堆数据进行建模的时候,特别是分类和回归模型,我们有很多的变量可供...

  • Sklearn--Lasso模型选择

    使用赤池信息量准则(AIC),贝叶斯信息准则(BIC)和交叉验证(CV)来选择Lasso模型的最优正则化参数alp...

  • jModelTest的使用

    jModelTest 是用来计算最优核苷酸替代模型,依据的方法有5个,包括最常见的AIC和BIC jModelTe...

  • 多元回归分析(未完成)

    AIC原则(Akaike Information Criterion) AIC是衡量统计模型拟合优良性的一种标准,...

  • 模型选择准则:利用IQtree结果计算AIC&BIC

    赤池信息准则(Akaike Information Criterion,AIC)贝叶斯信息准则(Bayesian ...

  • 深度学习与神经网络:AIC,BIC,L1,L2

    在学习深度学习时,我们经常会听到AIC, BIC 还有l1, lasso 等regularization 的知识。...

  • 2022-05-02

    Akaike information criterion,AIC是什么?一个用来筛选模型的指标。AIC越小模型越好...

  • Stata: AIC / BIC / MSE / MAE 等信息

      作者: 贺旭 (中央财经大学)Stata 连享会: 知乎 | 简书 | 码云 | CSDN   Stata连享...

网友评论

    本文标题:【点】模型选择标准:AIC与BIC

    本文链接:https://www.haomeiwen.com/subject/xfpwmltx.html