步骤:
1.Python采集深圳政府公开数据平台的共享单车数据(最大可采集上亿2017-2021数据),并用百度逆地理编码服务解析经纬度获取位置信息。并将数据上传hdfs;
2.可使用sklearn、卷积神经网络等算法对数据进行分析,对共享单车的订单量进行有效预测;
3.使用PyHive、Hadoop等技术对hdfs中的共线单车数据进行离线分析(有需要的话后期可以改造成PySpark Scala Spark Flink PyFlink分析);
4.对3中的分析指标使用sqoop导入到mysql数据库;
5.使用flask+echarts+layui搭建可视化系统、hive数据查询系统;
6.大屏端直接查询Mysql指标表的数据完成可视化。hive数据仓库查询系统连接虚拟机中的hive进行多条件数据检索;
网友评论