美文网首页
计算机毕业设计hadoop+spark+hive新能源汽车推荐系

计算机毕业设计hadoop+spark+hive新能源汽车推荐系

作者: 计算机毕业设计大全 | 来源:发表于2024-09-22 18:50 被阅读0次

流程:

1.Python爬虫采集懂车帝汽车评分数据、汽车评论数据、车评人数据等存入mysql和.csv文件;

2.使用pandas+numpy或者MapReduce对上面的数据集进行数据清洗生成最终上传到hdfs;

3.使用hive数据仓库完成建库建表导入.csv数据集;

4.使用hive之hive_sql进行离线计算,使用spark之scala进行实时计算;

5.将计算指标使用sqoop工具导入mysql;

6.使用Flask+echarts进行可视化大屏实现;

创新点:nlp文本分类情感分析、装杯大屏幕、Python爬虫采集海量(10万+数据)、hive离线计算+spark实时计算双实现

注意:如果你还觉得系统工作量不够或者太low可以选装推荐算法、预测算法、知识图谱、后台管理等

1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png 11.png 12.png 13.png 14.png

相关文章

网友评论

      本文标题:计算机毕业设计hadoop+spark+hive新能源汽车推荐系

      本文链接:https://www.haomeiwen.com/subject/helxrjtx.html