美文网首页我爱编程
5月14日第九次早课

5月14日第九次早课

作者: ly稻草 | 来源:发表于2018-05-15 17:28 被阅读0次

    1.排序语法,默认是降序吗

        默认 asc  升序

     2.限制多少行语法

     limit  

    3.分组函数有哪些

    GROUP BY 是分组查询, 一般 GROUP BY 是和聚合函数配合使用

    分组函数:(五个)   

     1···max(expr):求expr的最大值 }\     

     2···min(expr):求expr的最小值 }-- 数据类型是有规定的     

    3···sum(expr):求expr的总和   }-- 必须是字符型或数字    

    4···avg(expr):求expr的平均值 }/   

     5···count(expr):求expr的个数         

    expr的类型不能是空,如果是空,则不计入其中,        因此需要用到nvl()来进行转换

    4.分组语法是什么

      group by expr1,expr2,...的用法:

            group by 的后面跟的是炫耀分组的条件,

            例如用 department_id 进行分组,可以写成 group by department_id

            如果需要多重分组,只需要在后面急需添加筛选条件即可;

            Tips:select 语句中不包含分组函数的列,如果用group by 语句,

                 那么就需要全部出现在group by的语句中;

    5.分组语法的注意点是什么

    6.join有哪几种

    left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录

    right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录

    inner join(等值连接) 只返回两个表中联结字段相等的行

    7.left join是哪个表数据全

    a  left join b  ; a最全

    8.union 和union all 区别是什么

    union   会去重

    union all  不会

    9.谈谈你们觉得什么是子表

    任何一个查询结果都可以是子表,相当于临时表,或者缓存

    10.模糊查询名称ename的有s字符的名称有哪些?

    查询姓名以S开头的\以S结尾\包含S字符\第二个字母为L __

    SELECT emp.ename FROM emp WHERE emp.ename LIKE 'S%';

    SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S';

    SELECT emp.ename FROM emp WHERE emp.ename LIKE '%S%';

    SELECT emp.ename FROM emp WHERE emp.ename LIKE '_L%';

    11.like查询语法,比如是第三个字符是s,那么前面是不是要用两个占位符?

    是的    LIKE '_s%';

    12.谈谈你们对hadoop的理解

    13.hadoop包含哪三大组件,分别是做什么的

    hdfs 存储

    mapreduce 计算

    yarn资源和作业调度

    HDFS:

        HDFS 是Hadoop上分布式文件系统

        HDFS采用主从模式,其架构主要包含

    NameNode   DataNode   Client三个部分

     NameNode : 用于存储生成文件系统的元数据。运行一个实列,因此需要解决单点故障问题

     DataNode :用于存储实际的数据,并将自己管理的数据块信息上报给NameNode,运行多个实例。一个数据默认存储3个副本

                          分布在3个不同的DataNode以保证可用性。

    Client: 支持使用者读写HDFS,从NameNode获取元数据或实际数据返回给使用者。可以有多个实例,和业务一起运行。

    MapReduce是Google提出的一种并行计算框架:

         Map:映射,对一些独立元素组成的列表的每一个元素进行指定的操作。每个元素都是被独立操作的,而

                    原始列表没有被更改。Map操作是可以高度并行的,这对高性能应用以及并行计算领域的需求非常有用。

        Reduce:      化简,对一个列表的元素进行适当的合并,虽然它不如Map那么并行,但是因为化简总是一个简单的答案,

                           大规模的运算相对独立,所以化简函数在高度并行环境下也很有用。

    适合:大规模数据集的离线批处理计算;任务分而治之,子任务相对独立

    不适合:实时的交互式计算,要求快速响应和低延迟,比如BI;流失计算,实时分析,比如广告点击计算;子任务之间相互依赖的迭代计算。

    Yarn: 

          是Hadoop2.0后的资源管理系统,它是一个通用的资源管理模块,可为各类应用程序进行资源管理和调度

          yarn是轻量级弹性计算平台,除了MapReduce框架,还可以支持其他框架,比如Spark,Storm等

          多种框架统计管理,共享集群资源:

          *资源利用率高

          *运维成本低

    14.hadoop官网地址是什么

    hadoop.apache.org

    15.maven编译是不是需要pom.xml

    需要

    16.maven的默认仓库文件夹在哪

    可改变默认的 .m2 目录下的默认本地存储库文件夹

    通过修改${user.home}/.m2/settings.xml 配置本地仓库路径 ,没有settings这个xml文件就新建,或者如下复制个;具体看图:

    17.我们进行hadoop部署是什么模式?有进程吗

    单机部署             进程没有

    伪分布式部署      进程存在+1节点  开发

    集群部署             进程存在+n节点  开发/生产

    18.hdfs的存储也是从 根目录 开始的吗

    是的 

    19.伪分布式部署时要配置jdk和ssh,那么请问你们 配置ssh无密码的访问,这个流程会吗

    哈哈  会

    20.tar解压时,特别要留意一个东西是什么

    用户用户组

    ·

    相关文章

      网友评论

        本文标题:5月14日第九次早课

        本文链接:https://www.haomeiwen.com/subject/klcjdftx.html