1、如果线性回归模型中的随机误差存在异方差性,那么参数的OLS估计量是(无偏的,非有效的)
OLS即普通最小二乘法,由高斯-马尔可夫定理,在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。根据证明过程可知,随机误差中存在异方差性不会影响其无偏性,而有效性证明中涉及同方差性,即异方差性会影响参数OLS估计量的有效性
得到的参数估计量不是有效估计量
2、在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题()
A、SVM算法中使用高斯核/RBF核替代
B、增加训练集数量
C、减少神经网络隐藏节层节点数
D、删除稀疏的特征
解析
答案A
机器学习中发生过拟合的主要原因:
(1)使用过于复杂的模型
(2)数据噪声较大
(3)训练数据少
由此对应的降低过拟合的方法有:
(1)简化模型假设,或者使用惩罚项限制模型复杂度
(2)进行数据清洗,减少噪声
(3)收集更多训练数据
网友评论