美文网首页
第1章 ClickHouse概述

第1章 ClickHouse概述

作者: 码农GG | 来源:发表于2021-07-27 18:39 被阅读0次

    1.1 什么是ClickHouse

    ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。

    1.2 什么是列式存储

    以下面的表为例:


    image.png

    采用行式存储时,数据在磁盘上的组织结构为:

    image.png

    好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。
    而采用列式存储时,数据在磁盘上的组织结构为:

    image.png

    这时想查所有人的年龄只需把年龄那一列拿出来就可以了

    1.3 安装前的准备

    1.3.1 CentOS取消打开文件数限制

    在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入一下内容:

    [root@hadoop102 software]# vim /etc/security/limits.conf
    在文件末尾添加:
    最大文件数
    * soft nofile 65536 
    * hard nofile 65536 
    最大进程数
    * soft nproc 131072 
    * hard nproc 131072
    
    [root@hadoop102 software]# vim /etc/security/limits.d/90-nproc.conf
    在文件末尾添加:
    * soft nofile 65536 
    * hard nofile 65536 
    * soft nproc 131072 
    * hard nproc 131072
    

    重启服务器之后生效,用ulimit -n 或者ulimit -a查看设置结果

    [root@hadoop102 ~]# ulimit -n
    65536
    

    1.3.2 CentOS取消SELINUX

    修改/etc/selinux/config中的SELINUX=disabled后重启
    [root@hadoop102 ~]# vim /etc/selinux/config
    SELINUX=disabled

    1.3.3 关闭防火墙

    [root@hadoop102 ~]# service iptables stop 
    [root@hadoop102 ~]# service ip6tables stop
    ip6tables:将 chains 设置为 ACCEPT 策略:filter            [确定]
    ip6tables:清除防火墙规则:                                [确定]
    :正在卸载模块:                                           [确定]
    

    1.3.4 安装依赖

    [root@hadoop102 ~]# yum install -y libtool
    [root@hadoop102 ~]# yum install -y *unixODBC*
    

    相关文章

      网友评论

          本文标题:第1章 ClickHouse概述

          本文链接:https://www.haomeiwen.com/subject/axeudktx.html