美文网首页
2023年数学建模美赛春季赛Y题—思路程序总结分享(完整版)

2023年数学建模美赛春季赛Y题—思路程序总结分享(完整版)

作者: AdamDaitu | 来源:发表于2023-03-31 16:30 被阅读0次

    2023年数学建模美赛春季赛Y题—分析二手帆船价格——思路程序总结分享

    使用的程序、中间数据、分析结果等资源的获取方式:https://mbd.pub/o/bread/ZJeUl59s

    1: 问题描述与要求

    与许多奢侈品一样,帆船的价值会随着年龄和市场条件的变化而变化。随附的 “2023_MCM_Problem_Y_Boats.xlsx” 文件包含约3500艘36至56英尺长的帆船的数据,这些帆船于 2020 年 12 月在欧洲、加勒比海地区和美国进行了广告销售。一位划船爱好者向 COMAP 提供了这些数据。 与大多数真实世界的数据集一样,它可能存在数据缺失或其他问题,需要在分析之前进行一些数据清理。

    帆船经常通过经纪人出售。 为了更好地了解帆船市场,中国香港 (SAR) 的一位帆船经纪人委托您的团队准备一份关于二手帆船定价的报告。 经纪人希望您:

    (1) 开发一个数学模型来解释所提供电子表格中每艘帆船的标价。 包括您认为有用的任何预测因素。 您可以利用其他来源来了解给定帆船的其他特征(例如横梁、吃水、排水量、索具、帆面积、船体材料、发动机小时数、睡眠能力、净空高度、电子设备等)以及按年份的经济数据和地区。识别并描述所有使用的数据来源。 包括对每种帆船型号价格的估算精度的讨论。

    (2) 使用您的模型来解释区域对上市价格的影响(如果有的话)。讨论在所有帆船变体中是否有任何区域效应是一致的。解决所指出的任何区域影响的实际和统计意义。

    (3) 讨论您对给定地理区域的建模如何在香港 (SAR) 市场中发挥作用。 从提供的电子表格中选择一个信息丰富的帆船子集,分为单体船和双体船。 从香港 (SAR) 市场中查找该子集的可比上市价格数据。 模拟香港 (SAR) 对您子集中帆船的每艘帆船价格的区域影响(如果有的话)。 双体船和单体帆船的效果是否相同?

    (4) 确定并讨论您的团队从数据中得出的任何其他有趣且信息丰富的推论或结论。

    (5) 为香港 (SAR) 帆船经纪人准备一份一到两页的报告。 包括一些精心挑选的图形,以帮助经纪人理解您的结论。

    2: 解题思路和分析结果(详解版)

    针对问题1

    思路:该问题主要是预测价格的回归模型预测问题。而且可以使用的预测算法有很多种,例如:多元回归分析、Lasso回归、决策树回归、随机森林回归、GBDT回归、支持习那里感激回归等模型。但是使用这些模型时和结合数据的特点进行分析,并且还需要对原始的数据进行很多的预处理与变换操作,提取更有用的特征,方可建立较准确的回归预测模型。如果能够收集到更多的相关数据集,可以增强预测精度。

    所以该问题的解决路径应该为:数据清洗——>数据可视化探索性分析——>数据特征工程(筛选与变换)——>建立回归分析模型——>对结果进行分析.

    经过我对数据集的相关探索和分析,得出使用随机森林回归预测模型的预测效果较准确。相关数据集的预测效果如下图:

    monohulled sailboats价格预测效果 catamarans价格预测效果

    针对问题2

    该问题主要是要结合问题1的分析结果,进行进一步的分析。分析一些分类变量(例如区域、制造商、年份等)与价格之间的的关系。可以使用定量分析与可视化分析相结合的方式,主要可参考的方法有:方差分析、卡方检验等。经过我对数据的探索和分析,一些可参考的结果如下图:

    地区和价格的多重检验结果 不同区域的价格分布情况

    针对问题3

    该问题属于一个数据相似性对比,然后建立回归模型进行预测的问题。例如:根据收集的而外GDP数据,找到和香港GDP情况相似的地区,然后根据区域找到数据子集,然后对自己进行建模与分析从而作为香港的售价参考模型。如果数据样本较多,可使用聚类分析,将找到的子集划分为更细的子集,对数据进行详细分组和分析。因为最终还是需要建立价格预测模型,所以可以尝试一些回归模型的算法,对数据进行预测,然后作为香港的预测结果。经过我的一些数据真理与分析,一些可参考的结果示例如下所示:

    经济数据变化趋势的相似性分析 定价模型的预测值和真实值的对比效果图

    针对问题4

    讨论您的团队从数据中得出的任何其他有趣且信息丰富的推论或结论。该问题是一个开放性的问题,可以进行一些数据可视化分析等,便于发现数据的关系。并且可以结合前面的结果进行分析。下面真实一些发现的数据规律:

    不同地区GDP和价格高低之间的相关性 不同地区下长度和价格之间的关系

    总结

    前面的一些分析,都是本人使用Python,对数据一步步分析得出的一些经验,供大家参考。数学建模本身就是开放性问题,这里只是抛砖引玉。

    使用的程序、中间数据、分析结果等资源的获取方式: https://mbd.pub/o/bread/ZJeUl59s

    文章首发与:https://mp.weixin.qq.com/s?__biz=Mzg3MTM4NjI2MA==&mid=2247484826&idx=1&sn=5f49f4c3be56e01e4cb123e62c7e8cbe&chksm=cefe1861f9899177ebaacc490ec5102c56974f6f27fad215b870ca7908be2acf5db78d140564&token=957805254&lang=zh_CN#rd

    今天的分享就到这里了,敬请期待下一篇!

    最后欢迎大家分享转发,您的点赞是对我的鼓励和肯定!

    相关文章

      网友评论

          本文标题:2023年数学建模美赛春季赛Y题—思路程序总结分享(完整版)

          本文链接:https://www.haomeiwen.com/subject/eaphddtx.html