来到了这里,说明你可能对C题比较感兴趣。下面弈笙将带大家快速浏览近三年美赛的C题,妄图揣摩一下美赛C题的特点及命题趋势以及如何备战该类型的题目以取得更好的成绩。
2016 C 题
题目回顾
Goodgrant基金会就是要帮助提高本科生参加在美国学院和大学教育表现的慈善组织。
要做到这一点,该基金会拟共$100,000,000(US100万美元)捐给每年学校提供适当的小组,已经运行五年了,从2016年7月开始这样做,他们不希望重复投资和其他重点大型授予组织如盖茨基金会和Lumina的基础。
您的团队已要求由Goodgrant基金会建立一个模型,以确定最佳的投资策略,确定了学校,每所学校的投资金额,对投资回报率,以及持续时间,该组织的资金应提供有最高可能产生对学生的表现有很强的正效应。
该战略应包括学校,你是根据每个候选学校的证明潜力有效地利用私人资金,建议投资适当的方式定义的1到N优化并优先候选名单,和投资回报(ROI)的预计收益慈善组织如Goodgrant基金会。
为了帮助你的努力,附加的数据文件(ProblemCDATA.zip)包含来自美国国家中心教育统计,它在几乎所有的后拥有大量的调查信息数据库中提取信息二级学院和大学在美国,与大学记分卡的数据集,其中包括各种机构的性能数据。
注意:当您提交最终的电子解决方案不包含任何数据库文件。应提交的唯一的事情就是你的电子(Word或PDF)的解决方案。
分析解读
题目不算长,简单总结如下:
本题是关于美国大学的慈善捐赠问题。捐给学校钱当然不是白给,也是需要有回报的。这里的回报不止是金钱上的,而有各种割让的度量方式:学术成就,学校排名,科研成果,学生就业,社会地位等等。
我们的目标是通过数据挖掘方法设计一个基于大量数据的投资-回报度量系统。为了解决这个问题,我们可以使用投资组合理论,线性规划,灰色理论和其他一些方法来确定慈善捐赠最佳策略。
问题求解
1. 对数据进行操作
根据信息的完整性和冗余度进行数据筛选,删除信息小于阈值的数据。
使用线性拟合和PCA合并不同的属性。对于保留的属性和学校,进行数据插补以基于K-means聚类填充缺失的数据。
然后将所有数据标准化,以使它们在以下分析中具有可比性。
2. 构建ROI评估标准
即输出和输入的比率乘以调整系数。该比率反映了与成本相关的收益,而紧迫性反映了对货币的需求,这是慈善组织应该考虑的一个重要因素。
可以使用PCA来选择属性,让工资,教育质量和其他一些代表产出,学费代表投入和联邦贷款,债务和其他一些代表紧迫性。然后,AHP用于衡量不同因素之间的重要性并分配权重。
3. 构建投资-收益模型
构建自己的投资收益模型,并结合时间序列/MILP/灰色预测来确定长期投资策略。将选择出的学校,不同的学习时间和不同的金额带入模型,求解最佳的投资策略
可能用到的模型及算法
- 层次分析
- 主成分分析
- 模糊综合评判
- K均值
- 时间序列
- 神经网络
- 灰色预测
2017 C 题
题目回顾
美国许多地区由于道路的数量限制,交通容量有限。例如,在大西雅图地区,由于交通量超过道路网络的设计容量,司机在交通高峰时段经历长时间的延误。这在5号,90号和405号州际公路以及520号国道在这个问题上显得尤为明显。
自动驾驶车己经作为增加公路能力而不用拓宽车道的方案提出,但是在这一点上,人们并未很好的理解自动驾驶车与现有交通工具的关系。
华盛顿州州长要求就自动驾驶车对于Thurston, Pierce和Snohomish等地交通的影响。(详情请参见提供的地图和Excel表格)。
重点是当这种自动驾驶车的数量占比从10%增加到50%后,效果会有什么变化?到90%呢?其中是否存在均衡点?是否有明显的变化临界点?假设条件满足,是否应该为这些车设立专用车道?你的模型分析是否提出了改善政策的建议?
你需要构建一个模型,包括对车道流量,峰值、(和/或)平均交通量,以及自动驾驶车所占的比例 的协作系统。你的模型分析应该含有对自动驾驶车和非自动驾驶车之间的关系分析。你的模型分析应该满足附件中Excel提供的指定道路数据。
你的MCM文件应该包括:1页摘要表,1-2页的州长回信,以及你的解决方案(不超过20页),整份文件最多23页,注:附录和参考文献不计入23页的限制当中。
分析解读
题目很好理解,求解自动驾驶汽车的数量对两个地区交通状况的影响,这里不再赘述,看不懂的再多读几遍题目。
问题求解
初步看来,此问题是网络流,交通流方面的问题,会涉及网络最大流算法知识。
宏观方法:不关心单个车辆的特性,利用流体力学的方法研究 道路上所有车辆的集体平均行为–流体力学连续模型。
微观方法:从单个车辆的动力学行为入手,通过考察单个车辆之间的相互作用,推导出整个系统的统计性质–车辆跟驰模型、元胞自动机模型。
介观方法:将交通流中的车辆看成具有相互作用的粒子,然后利用分子动理论对交通进行来研究–气体分子动理论模型
我们需要考虑以下几点。
- 车道流量,峰值,平均交通量,以及自动驾驶车所占的比例对协作系统的影响
- 自动驾驶车和非自动驾驶车之间的关系分析
这里我简要分析下4篇O奖论文他们是怎么做的。
-
55261
队伍的解决方案由三个主要部分组成。首先,他们提出了交通流、密度和平均速度之间关系的宏观(连续)模型。除了改进传统经验模型的合理性外,他们还允许进行直接调整,以反映自动驾驶/合作车辆的比例。其次,建立了一个离散模型来描述不同交通水平下的车道变化动力学,以及传统的自动驾驶/非相互作用和自动驾驶的性能。 最后,他们对问题中提供的真实世界数据进行了流密度-平均速度关系模型的检验。 -
55278
队伍提出了一种基于元胞自动机的创新模型,分析了自驾车合作车辆对公路通行能力的影响。为了提高模型的灵活性,他们扩展了传统的用于交通分析的元胞自动机,使其能够处理复杂的自动驾驶车辆动力学问题。基于扩展的元胞自动机,他们首先利用泊松分布对汽车的生成过程进行了建模。该模型在公路路段上生成指定的车辆体积。并区分了高峰时间和非高峰时段的交通量。在此基础上,对车辆跟随和换车道行为进行了建模。最后,提出了一个分析高速公路交通流行为的概率模型。通过各种仿真,验证了模型的可行性。然后,他们将大西雅图地区四条高速公路的数据应用于模型。结果表明,随着自动驾驶合作车辆比例的增加,车辆的通行能力也随之增加。最后,分析了自驱动系统潜在误差的影响. 并对车辆动力学中的各种参数(包括换车道概率和车辆动力学参数)进行了灵敏度分析,验证了模型的鲁棒性。 -
55583
队伍在元胞自动机的基础上,构建了一个混合协作模型,独立地模拟了交通网络的各个部分。首先,在我们的基本模型中,我们假定交通量在一天内满足均匀分布。在知道交通网络每一段的交通量和行车线后,他们就可以在一段时间内得到每个路段的交通密度,并继续使用不同的自动驾驶比率。减少交通流量。其次他们考虑了时间模型,假设交通密度函数随时间的变化与一天内的双高斯分布相同,即存在两个交通高峰周期。此外,在基于时间的模型基础上,他们构造了一个专用车道模型,考虑了自动驾驶车辆的专用车道,并继续与基于时间的模型进行类似的模拟。最后,利用每段路段车辆的平均速度来评价车辆的性能和通行能力。他们的模型给出了自动驾驶对交通运输影响的结果。 -
55585
队伍在仔细研究和比较了过去几十年来各种交通流模型之后,选择了元胞自动机(CA)模型来评价这一问题。为了考虑SDVS和NSDVS之间的关系,通过对这两个因素的重新设计,他们对传统的CA模型进行了改进,该模型强调状态和变化规律。在建立CA模型之前,首先要进行离散化。通过了解公路上行驶车辆的平均长度、速度、加速度和人的反应时间,确定了一个单元的大小和转弯的时间长度。在对问题进行假设和简化的基础上,采用了两个相关的CA模型来模拟可变交通。一个模型是用来模拟一辆车在单车道上跟随另一辆车的方式。另一个是多车道交通模型。在该模型中他们还试图找出车辆何时以及如何改变车道。该模型涉及两个主要参数:换车道动机(LCM)和换车道安全(LCS). 针对该模型,设计了一种与实际情况相适应的两步车削方法。在模型建立和改进之后,他们编写程序来模拟它并获得大量的数据。利用Matlab对数据进行了分析和可视化,显示了平均速度、交通流量和道路上运行的SDVS百分比三个参数之间存在着很强的相关性。在分析得到的相关性的基础上,通过比较实际数据和模拟得到的数据,将我们的模型应用于大西雅图地区。他们发现这个地区的交通能力不足是很严重的。虽然在街上加入SDVS可以减少这种不足,但这并不是一种治疗方法。他们认为应该采用一种全面的方法来解决这一问题。包括在一些特别狭窄的地方设置一条SDV车道和拓宽公路等。
可能用到的模型及算法
- 元胞自动机
2018 C 题
题目回顾
背景:
能源生产和使用是任何经济结构的主要部分。在美国,能源政策的许多方面分散到国家层面。此外,不同国家的不同地区和行业也影响能源使用和生产。
1970 年,美国西部的 12 个州组成了西部州际能源协定,其任务重点是促进这些州在发展和管理核能技术方面的合作。
州际契约是两个或两个以上的州之间的合同安排,在这两个州之间,这些州在一个具体的政策问题达成一致,并采取一套标准或就某一地区或国家事务相互合作。
问题:
沿着美国与墨西哥的边界,有四个州——加利福尼亚(CA)、亚利桑那州(AZ)、新墨西哥州(NM)和德克萨斯州(TX)——希望形成一个现实的新能源契约,重点是增加清洁能源和可再生能源的使用。这些州的四位州长要求您的团队执行数据分析和建模,以便为他们的州际能源契约制定一套目标。
第一部分:
- 使用所提供的数据,为这四个州分别创建一个能量概况
- 建立一个模型来描述从1960到2009年这四个州的能量是如何演化的。分析和解释模型的结果,以解决四个州使用清洁和可再生能源的问题
- 确定在2009年这四个州中哪一个州有“最佳”使用清洁和可再生能源的概况。解释你的标准和选择。
- 基于这些州使用能源的历史演变,以及你对所建立的州概况之间差异的理解,如你所定义的那样,在每个州长办公室没有任何政策改变的情况下,分别预测2025和2050年每个州的能源概况。
第二部分
- 基于你对这四个州的比较,用你的“最佳”概况的标准和你的预测,来确定2025和2050年的可再生能源使用的目标,并将它们作为新的四州能量契约的目标
- 确定并讨论四个州可能采取的至少三项行动,以实现他们能源紧缩契约目标。
问题求解
对于数据类题目,一般的处理方式如下。
- 预处理,包括缺失值的处理和数据的规范化;
- PCA,AHP来整合不同指标的影响权重;
- 构建核心模型 ;
- 采用ARIMA等预测模型今后的表现。
这里我简要分析下4篇O奖论文他们是怎么做的。
-
73767
队伍预了处理提供的数据,运用去耦理论来描述经济发展与能源利用之间的动态关系,此反映了能源概况的演变。他们联立方程构建模型分析了各州的优势。然后,他们建立一个多维评估系统,以识别整体上具有“最佳”能量分布的状态。最后,他们构建BP神经网络来预测能量分布。 -
78577
队伍预处理了数据,包括缺失值的处理和数据的规范化。在缺失值处理的过程中,通过三次样条插值处理缺少少量数据的指标。基于处理得到的指标,他们提出了MAUA模型来计算总体得分,使用了PCA来整合三个指标的不同方面,然后我们使用组合加权方法(AHP和PCA)来加权这三个指标。之后使用ARIMA模型来预测每个州的指标。最后通过建立的模型来预测比例。 -
80560
队伍对数据进行处理,使用协整和多维尺度(MDS)基于属性的独立性和代表性来选择和合并不同的变量。接着构建了一个EROI评估系统,这是对投资回报率(ROI)的改进。最初采用线性模型对数据进行回归,但结果表明其精度有限,无法适应短期波动或长期趋势。因此,他们采用动态的新凯恩斯主义IS-LM模型,并在模型中包含前瞻性预期,这样可以更准确地预测未来的能源消耗和结构。最后,添加灵敏度分析以测试和验证他们的模型。 -
82150
队伍首先从四个方面探索能源概况 - 总能源产量,总能耗,能源价格和能源结构。开发EM-TOPSISPROMETHEE评估模型,并用矢量自回归模型用于预测每个州的能量分布。第二部分结合博弈论,通过遗传算法得到四种状态的最优能量分配。
可能用到的模型及算法
- 主成分分析
- 层次分析
- K均值
- 三次样条插值
- 时间序列
- 神经网络
- 灰色预测
- 遗传算法
2019 C 题
那么2019年的C题呢?我们知道,C题是大数据问题,通过三年真题,果然名副其实,这里简单分析一下。大数据类型的题目其实做法比较单一,有统一的处理方式,我在上面已经大致列举过了。
对于数据类题目,一般的处理方式如下。
- 预处理,包括缺失值的处理和数据的规范化;
- PCA,AHP来整合不同指标的影响权重;
- 构建核心模型 ;
- 采用时间序列等预测模型预测今后的表现。
从近三年的题目来看,连续三年都运用了数据处理的一些常规方法,不难预测,19年C题肯定如此。
大家可以练习例如:层次分析,主成分分析,模糊综合评判等常规的数据处理方式,同时也要熟悉例如:遗传算法,模拟退火等常见的寻优算法及预测算法。
最后,祝 2019 年选择 C题的同学们都获得理想成绩!
另外,听说点右下角好看的同学都变好看了哟!
![](https://img.haomeiwen.com/i7365169/99372725ff29ecc4.jpg)
网友评论