美文网首页IT课程分享玩转大数据大数据
IT人告诉你【泰坦尼克号】上哪类人更易活下来?

IT人告诉你【泰坦尼克号】上哪类人更易活下来?

作者: 蓝桥云课 | 来源:发表于2018-01-09 13:28 被阅读64次

    《泰坦尼克号》都知道,杰克和露丝的爱情,既美好又悲伤,在看电影的时候,不知你是否想过这样一个问题:在【泰坦尼克号】沉船事故中,什么样的人更容易生存下来呢?

    作为一名程序员,我们可以通过数据来预测船员和乘客的生还状况。

    实验楼上有一门课程:【利用随机森林算法预测 Titanic 乘客生还概率】,就是教你利用机器学习的方法来预测泰坦尼克号上的乘客生还概率。

    如果你对机器学习感兴趣,那么推荐这个项目课程,该课程将解决分类中的 2 分类任务,即类别只有正反两类(生还或死亡)。课程包括数据清洗及可视化、模型训练及评估,以及随机森林分类器调参等内容。

    课程内容:

    该课程共分为3个实验,具体如下:

    1、数据清洗及可视化

    实验内容:

    数据清洗是数据分析中非常重要的一部分,也最繁琐,做好这一步需要大量的经验和耐心。这门课程中,我将和大家一起,一步步完成这项工作。该实验学习数据清洗的基本思路以及具体操作,同时,练习使用 Pandas 数据分析工具、Seaborn 统计分析可视化工具。

    实验知识点:

    • 离群点分析
    • 缺失值处理
    • 偏态分布数据处理

    2、分类模型训练及评价

    实验内容:

    实验将评估不同模型的测试精度以及过拟合问题。学习器没有最好,只有适不适合,模型评估和性能度量的重要性可想而知。该实验的重点在模型评估的实现过程,对分类算法不了解的不用担心,在下一个实验中,我们将对算法以及进行深入学习。

    实验知识点:

    • 交叉验证法
    • 过拟合
    • 学习曲线

    3、随机森林分类器参数调节

    实验内容:

    该实验学习集成学习的随机森林算法,参数调节,并解决上一节实验当中遇到的过拟合问题。我们将继续使用 Python sklean 机器学习工具。

    实验知识点:

    • 决策树
    • 集成学习
    • 随机森林算法
    • 参数调节

    最后

    如果你想知道【泰坦尼克号】上哪类人更易活下来,亦或者对机器学习感兴趣,那么点击【利用随机森林算法预测 Titanic 乘客生还概率】即可开始学习,通过自己的学习,通过数据来评估出哪类人更容易生存下来。

    • 如果你对机器学习感兴趣,你也可以点击【机器学习工程师】学习路径,带你通过大量的实战操作掌握机器学习。

    相关文章

      网友评论

        本文标题:IT人告诉你【泰坦尼克号】上哪类人更易活下来?

        本文链接:https://www.haomeiwen.com/subject/toswnxtx.html