前言
本文主要讲解Elasticsearch及其套件Kibana、Logstash的安装及启动,还讲解如何导入数据用于后续的实验。
说明:Elasticsearch是基于Java开发的,所以如果是下载Elasticsearch 6.x及之前的版本,需要自己安装Java环境;如果是7.x版本,会自带Java环境,无需额外安装,本次我们安装的版本是7.11.1。其他套件的安装,也需要根据相应的版本进行安装。
Elasticsearch
windows 环境,下载后加压即可。https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.11.1-windows-x86_64.zip
mac环境,下载后解压即可。
curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.11.1-darwin-x86_64.tar.gz
tar -xzvf elasticsearch-7.11.1-darwin-x86_64.tar.gz
启动
bin/elasticsearch
单机启动多实例
elasticsearch -E node.name=node1 -E cluster.name=zxy -E path.data=/data/logs/es/node1_data -d
elasticsearch -E node.name=node2 -E cluster.name=zxy -E path.data=/data/logs/es/node2_data -d
elasticsearch -E node.name=node3 -E cluster.name=zxy -E path.data=/data/logs/es/node3_data -d
访问
http://localhost:9200/
查看插件
bin/elasticsearch-plugin list
安装插件analysis-icu,后续用于中文分词
bin/elasticsearch-plugin install analysis-icu
Kibana
Kibana 是一个免费且开放的用户界面,能够让我们对 Elasticsearch 数据进行可视化,并让我们在 Elastic Stack 中进行导航。我们可以进行各种操作,从跟踪查询负载,到理解请求如何流经整个应用,都能轻松完成。
Kibanawindows环境的下载包:https://artifacts.elastic.co/downloads/kibana/kibana-7.11.1-windows-x86_64.zip
mac环境
curl -L -O https://artifacts.elastic.co/downloads/kibana/kibana-7.11.1-darwin-x86_64.tar.gz
tar xzvf kibana-7.11.1-darwin-x86_64.tar.gz
改为中文
修改配置文件 kibana.yml,在最后添加配置如下
i18n.locale: "zh-CN"
启动
./bin/kibana
访问
http://127.0.0.1:5601/
Logstash
Logstash 是免费且开放的服务器端数据处理管道,能够从多个来源采集数据,转换数据,然后将数据发送到我们最喜欢的“存储库”中。
windows环境的下载包:https://artifacts.elastic.co/downloads/logstash/logstash-7.11.1-windows-x86_64.zip
mac
curl -L -O https://artifacts.elastic.co/downloads/logstash/logstash-7.11.1-darwin-x86_64.tar.gz
tar xzvf logstash-7.11.1-darwin-x86_64.tar.gz
启动
sudo ./bin/logstash -f ./config/logstash.conf
Movielens
MovieLens 是一个推荐系统。它由美国 Minnesota 大学计算机科学与工程学院的 GroupLens 项目组创办,是一个非商业性质的、以研究为目的的实验性站点。
下载实验用的csv数据文件:http://files.grouplens.org/datasets/movielens/ml-25m.zip
解压后把数据通过Kinana进行导入,后续做实验的时候会用到,解压后的文件主要有links.csv,movies.csv,ratings.csv,tags.csv。
操作路径:Machine Learning->DataVisualizer 点击UPLOAD。
注意表头没法自动识别,可能变成了“column1,column2,column3”等等,需要自行修改。
网友评论