官网:http://strom-project.net/
源码:https://github.com/nathanmarz/strorm
面试:读过源码,简历上可以写
业务比技术重要
work,线程,task的数量搞清楚(面试说出来好厉害)
批处理用Hadoop,实时处理用storm
storm的老大nimbus(灵魂),storm的小弟supervisor(管理员)
2:安装storm前先安装zeromq,是一个c++消息队列号称史上最快
安装难点:jcmq,zeromq 缺少包的时候可以通过源文件,RPM包两种方式安装
3.ui管理界面的进程名字叫core
4先启动zookeeper,然后启动nimbus(把启动信息,标准信息,错误消息都输入到logs,后台进程方式启动)
./storm nimbus > ../logs/info 2>&1 &
启动的时候需要一个config_value作配置的检查
2)启动子节点./storm supervisor >/dec/null 2>&1 &
启动的时候也需要一个config_value作配置的检查
3)zookeeper,nimbus,supervisor这些都启动了之后,启动core(ui管理的进程)
./storm ui > /dev/null 2>&1 &
通过浏览器8080访问
supervisor工作占用槽(slots)槽监听端口
5topology类似mapreduce中的job,一个Topology是Spouts和Bolts组成的图状结构, 而链接Spouts和Bolts的则是Stream groupings(数据分发方式)。
消息源spout会从外部读数据并向topology发消息:tuple(组件)
网友评论