最近,看了很多关于中国软件杯的知识,受益匪浅!我有了解到今年课工场作为专注于企业IT岗位的人才培养的教育机构,深度参与本届赛事,成为赛事支持单位和出题方,有本科生和高职两道赛题入选题库。今天,小编针对高职组的同学做一下赛题解析,希望能够帮助到大家!
赛题名称:基于互联网大数据的招聘数据智能分析平台
组类: B 高职组
问题1:
项目的大致技术路线图是什么样?
回答:
暂时没有具体的流程图,可以确定的是分为几个阶段。首先数据收集,将数据导入到大数据平台中,待使用。在这之前要准备好大数据环境,之后通过hive进行数据处理,和数据分析。最后将处理好的数据放入hbase或其他数据库待使用。通过应用去访问数据,进行数据展示,应用可以是web界面或者其他的数据展示手段。
问题2:
分析是否需要用MapReduce啊?
回答:
建议直接使用hive
问题3:
分析是否需要用MapReduce?
回答:
建议直接使用hive
问题4:
web除了要用图表展示出来,还有其他要求吗?
回答:
没有其他要求
问题5:
是否用做爬虫去抓取数据,直接对EXCEL里面数据表经行处理,然后导入到数据库中
回答:
对,可以不用做爬虫,可以先对数据做处理,然后导入到大数据环境中,也可以导入数据之后再做处理。
问题6:
未处理的数据必须要放入hbase然后用Hive处理吗 ,这个数据库可以是MySQL吗,然后用其他编程语言处理,例如PHP、Node.js、Java操作数据库处理呢
回答:
大数据环境不限于hbase,可以放到hdfs中,数据分析必须使用大数据技术,这是我们主要考核之一,推荐用hive,当然你写map reduce 也可以,可以用java。
问题7:
那个linux机器能用3台以上不?
回答:
可以,但是一般搭三个节点就够了,因为hadoop集群横向扩展比较简单
问题8:
搭建hadoop环境,对linux选择系统有限制吗?乌邦图或Centos都行?
回答:都可以;
以上就是课工场为各位同学整理的基于互联网大数据的招聘数据智能分析平台相关问题,希望能够帮助到大家!
网友评论