美文网首页
Kaggle 教程1 -- 模型是什么?

Kaggle 教程1 -- 模型是什么?

作者: TwinIsland | 来源:发表于2019-02-22 23:15 被阅读0次

翻译自 Kaggle

翻译 by Wyatt Huang

转载请著名

简介

我们首先概述机器学习模型如何工作以及如何使用它们。如果你以前做过统计建模或机器学习,这可能对你来说会很简单。别担心,我们很快就会建立强大的模型。

本课程将为您构建以下场景的模型:

你的堂兄已经花了数百万美元推测房地产。由于您对数据科学的兴趣,他愿意与您成为业务合作伙伴。他会提供资金,你则会提供预测各种房屋价值的模型。

你问你的堂兄他过去如何预测房地产价值。他说这只是直觉。但是实际上,他通过对房价市场的观测而总结出了一系列的商业模式,而他则利用这些模式对他正在考虑的新房进行预测。

机器学习的工作方式相同。我们将从一个名为决策树的模型开始。虽然有更高级的模型可以提供更准确的预测。但决策树很容易理解,它们是数据科学中一些最佳模型的基本构建块

这是一个简单的决策树

在上面的这个决策树模型中呢,将房屋分为两类。预测的价格是根据已知的同类型房子的价格来估计的。

在上面的那个模型中,我们先是使用数据来决定如何将房屋分成两组,然后再次确定每组的预测价格。从数据捕获模式的这一步骤称为拟合训练模型。用于拟合模型的数据称为训练数据。当我们用数据训练好一个模型后,我们就能用这个训练好的模型去对其他的房子进行价格预测了。

模型是如何训练的是一个很复杂的问题,我们将会在以后讨论它。

优化我们的模型

通过拟合房地产培训数据,更有可能产生以下两个决策树中的哪一个?

情况一↓

这是一个简单的决策树

情况二↓

80475-mewdxf7k07.png

我们都知道,情况一的模型显然更具有说服力,因为它更接近于现实情况:拥有更多卧室的房屋往往以比卧室更少的房屋更高的价格出售。

对于我们上面的模型,它最大缺点是它不能捕捉影响房价的大多数因素,如浴室数量,位置等。您可以使用具有更多“分支”的决策树(splits)来捕获更多因素。这些被称为“更深”的树木 (deeper tree)。下面是一个例子:

24369-46lmyvyojc6.png

当我们有一个比较具体的决策树模型后,您就可以通过在决策树中进行追踪来预测任何房屋的价格,房子的预测价格位于树的最后面。树的最后一层我们称它为为叶子(leaf)。

树上的分支以及和叶子将都由数据确定,下面提供了数据的例子,大家可以看一看来熟悉它,因为以后你将会和这些数据打交道。


关键词:

  • 决策树模型

数据:

相关文章

  • Kaggle 教程1 -- 模型是什么?

    翻译自 Kaggle 翻译 by Wyatt Huang 转载请著名 简介 我们首先概述机器学习模型如何工作以及如...

  • Pandas——索引和筛选

    kaggle网站上的教程https://www.kaggle.com/sohier/tutorial-access...

  • 模型融合 - 第二课

    kaggle比赛中,单个模型,基本上已经不能取得好成绩,需要多个模型集合。本文是一个非常基本和简单的入门教程,来介...

  • Kaggle 教程4 -- 验证你的模型

    翻译自 Kaggle翻译 by Wyatt Huang转载请著名 你已经建立了一个模型。 但它的准确度怎么样?在本...

  • xgboost 库使用入门

    本文 github 地址:1-1 基本模型调用. ipynb,里面会记录自己kaggle大赛中的内容,欢迎star...

  • 模型融合stacking

    kaggle比赛利器stacking 模型叠加 我们以二层叠加为例子理解它 我们有模型model1(可以是GBDT...

  • 代办事项

    项目 失陷主机检测(多示例学习) (1) kaggle:M5预测 槽位提取 (2) Mindspore模型实现 ...

  • 【比赛-kaggle】Titanic

    https://www.kaggle.com/c/titanic/overview 0 模型准备 explorat...

  • Kaggle机器学习入门教程一

    模型是如何工作的 原文链接:https://www.kaggle.com/... 这门课程将从机器学习模型如何工作...

  • 如何用Alteryx解决Kaggle的Titanic问题

    Q:我想参加kaggle但是我不会写代码?A:可以的! 前言 kaggle现在俨然成为了数据分析师,模型师,数据挖...

网友评论

      本文标题:Kaggle 教程1 -- 模型是什么?

      本文链接:https://www.haomeiwen.com/subject/ehzyyqtx.html