p <- nlme::Oxboys %>% ggplot(aes(age,height,group=Subject))+geom_line()
data:image/s3,"s3://crabby-images/e9b68/e9b68ba3a614c55b52616a3356951d5ddf4ac222" alt=""
1. 建模
model <- lme(height~age,data = nlme::Oxboys,random = ~ 1 + age|Subject)
2. 如何判断模型好坏
2.1 自建测试数据集,根据模型用预测的x~y关系绘图,在图上比较
age_grid <- seq(-1,1,length=10)
sample <- unique(nlme::Oxboys$Subject)
preds <- expand.grid(age=age_grid,Subject=sample)
expand.grid()扩充为数据框
先对第二列排序,再对第一列排序
preds$height <- predict(model,preds)
predict()提供模型和input,做预测,并返回一列y值;
input可以是数据框,包含与建模时同名(age)的x变量;
input可选,如果不提供,则用建模时的x变量。
p+geom_line(data=preds,color="lightblue")
运用到的图层语法:在不同的图层改变图形属性和数据集
data:image/s3,"s3://crabby-images/7f666/7f666fd19b34ca45507083c9414a77ac9374bc69" alt=""
看上去还可以?!
2.2 观察残差
Oxboys$fitted <- predict(model)
Oxboys$resid <- with(Oxboys, fitted - height)
p %+% Oxboys+aes(y=resid)+geom_smooth(aes(group=1))
#%+%表示更新,更新了数据集、图形属性的映射、几何对象
data:image/s3,"s3://crabby-images/bb750/bb7504bce7f850f9c7645ffd63abbc2e8281c043" alt=""
图形反映出残差跟x即age有明显的关系(先增后减),因此该模型不合适。正常情况下,应无规律地分散在y=0的两侧。
3. 改善模型
model2 <- update(model, height ~ age + I(age ^ 2))
Oxboys$fitted2 <- predict(model2)
Oxboys$resid2 <- with(Oxboys, fitted2 - height)
p %+% Oxboys+aes(y=resid2)+geom_smooth(aes(group=1))
data:image/s3,"s3://crabby-images/0a61d/0a61dbf9420ae32f9e0fac98f24859277f83fa31" alt=""
网友评论