美文网首页
大数据面试题目汇总(预计3020年有空总结......)

大数据面试题目汇总(预计3020年有空总结......)

作者: 大数据ZRL | 来源:发表于2020-03-12 19:35 被阅读0次

面试题

  • Java:

    • Java散列表,树对应的容器类,hashmap如何解决冲突
    • Java实现生产者和消费者的三种方法
    • init方法与clinit方法的区别
    • Java中的引用
    • Java对象的创建过程
    • Java中创建子类实例时会创建父类实例?
    • Java的类加载机制 为什么会出现锁机制?
    • 抽象类和接口的区别
    • 双亲委派模型:启动加载器、扩展加载器、应用程序加载器
    • 重载与重写
    • Java的类型擦除
    • 简述Java Object类中的方法有哪些
    • char可以存储汉字嘛?
    • 抽象类和接口的区别
    • 静态分派与动态分派
    • HashMap与HashTable的区别
    • 什么时候使用HashMap?它有什么特点?
    • HashMap的基本原理及内部数据结构
    • HashMap的put和get操作
    • 简述Java中的深拷贝与浅拷贝,C++中的浅拷贝和深拷贝
    • 解释一下static块和static变量的执行顺序
    • equals()的重写规则
    • Java中如何创建线程?
    • JDK1.8新特性
  • JVM:

    • JVM内存布局
    • JVM垃圾回收机制
    • JVM垃圾回收算法
    • 哪些对象在老年代?
    • 从年轻代到老年代执行的时间以及发生转移的场景
    • 为什么存在GC?
    • 简单可达性分析
    • Minor GC安全检查
    • 垃圾回收器
    • 引用记数法和可达性算法
    • 类加载机制过程
    • 双亲委派模型
    • 双亲委派机制
  • Java集合:

    • 排序算法比较
    • Hashmap是线程安全的吗?为什么?
    • ArrayList与LinkedList区别
    • HashMap、LinkedHashMap和TreeMap
    • 冒泡排序的优化以及快排过程及优化
    • 红黑树
    • JDK7与JDK8中hashmap的区别
    • hashmap的初始容量为什么设置为16?
    • 平衡二叉树的插入删除操作
  • 并发编程:

    • 锁分段技术、ConcurrentHashMap、扩容
    • Java同步线程有哪些方式?
    • volatile 和 synchronized的区别
    • 讲一下同步异步(进程和IO)
    • synchronized和volatile的区别?
    • 线程安全
    • 对象的内存布局
    • 哪些是线程安全的容器?
    • ConcurrentHashMap介绍
    • 线程启动start和run
    • HashMap为什么线程不安全?
    • 简述Java内存模型的happen before原则
    • volatile的原理和实现机制 || volatile到底如何保证可见性和禁止指令重排序的?
    • volatile关键字的两层语义 || 可见性
    • volatile保证原子性吗?
    • volatile能保证有序性吗?
  • Zookeeper:

    • Dubbo简介及以Zookeeper为注册中心
    • Zookeeper的leader选举过程
    • 2PC and 3PC
    • 简述Zookeeper。。。watcher
    • 简介ZAB
    • 简述paxos算法
    • Zookeeper如何保证数据的一致性?
    • 叙述ZAB集群数据同步的过程
    • Zookeeper中的ACL
    • Zookeeper底层实现数据一致性
    • Zookeeper在yarn框架中如何实现避免脑裂的?
  • Kylin:

    • 简介Kylin
    • Kylin的工作原理
    • Kylin的技术框架
    • Cube、Cuboid 和 Cube Segment
    • Kylin 对维度表的的要求
    • Cube的构建过程
    • 全量构建和增量构建的区别
    • 流式构建原理
  • Hive:

    • Hive内部表与外部表的区别
    • Hive与传统数据库的区别
    • Hiverc文件
    • Hive分区
    • Hive分区过多有何坏处以及分区时的注意事项
    • Hive中复杂数据类型的使用好处与坏处
    • hive分桶?
    • Hive元数据库是用来做什么的,存储哪些信息?
    • 为何不使用Derby作为元数据库?
    • Hive什么情况下可以避免进行mapreduce?
    • Hive连接?
    • Hive MapJoin?
    • Hive的sort by, order by, distribute by, cluster by区别?
    • Hadoop计算框架特性
    • Hive优化常用手段
    • 数据倾斜整理(转)
    • 使用Hive如何进行抽样查询?
  • Storm:

    • Storm的可靠性如何实现?包括spout和bolt两部分
    • 怎么提高Storm的并发度?
    • Storm如何处理反压机制?
    • Storm中的Stream grouping有哪几种方式?
    • Storm的组件介绍
    • Storm怎么完成对单词的计数?
    • 简述Strom的计算结构
  • Spark:

    • Spark的运行模式
    • RDD是如何容错的?
    • Spark和MapReduce的区别
    • 说一下Spark的RDD
    • 自己实现一个RDD,需要实现哪些函数或者部分?
    • MapReduce和Spark的区别
    • Spark的Stage是怎么划分的?如何优化?
    • 宽依赖与窄依赖区别
    • Spark性能调优
    • Flink、Storm与Spark Stream的区别(未)
    • 说下spark中的transform和action
    • RDD、DataFrame和DataSet的区别
    • Spark执行任务流程(standalone、yarn)
    • Spark的数据容错机制
    • Spark技术栈有哪些组件,每个组件都有什么功能,适合什么应用场景?
    • Spark master使用zookeeper进行HA的,有哪些元数据保存在Zookeeper?以及要注意的地方
    • driver的功能是什么?
    • spark端口
    • RDD有哪几种创建方式
    • map和flatmap的区别
    • Spark的基本工作流程
  • Hadoop:

    • MR的Shuffle过程
    • Yarn的工作机制,以及MR Job提交运行过程
    • MapReduce1的工作机制和过程
    • HDFS写入过程
    • Fsimage 与 EditLog定义及合并过程
    • HDFS读过程
    • HDFS简介
    • 在向HDFS中写数据的时候,当写某一副本时出错怎么处理?
    • namenode的HA实现
    • 简述联邦HDFS
    • HDFS源码解读--create()
    • NameNode高可用中editlog同步的过程
    • HDFS写入过程客户端奔溃怎么处理?(租约恢复)
  • kafka:

    • kafka介绍
    • Kafka与传统消息队列的区别?
    • kafka的零拷贝
    • kafka消息持久化和顺序读写?
  • 网络:

    • 简述TCP和UDP的区别
    • 七层协议每一层的任务及作用
    • 简述http状态码
    • 简述http协议与https协议
    • 简述SSL协议
    • 解析DNS过程
    • 三次握手,四次挥手的过程??为什么三握??

相关文章

  • 大数据面试题目汇总(预计3020年有空总结......)

    面试题 Java:Java散列表,树对应的容器类,hashmap如何解决冲突Java实现生产者和消费者的三种方法i...

  • 4道面试题,带你走上做图高手之路

    这份面试题,有4道题目,文末给出完整的数据下载。先来看看你会做几道题目? 【问题1】使用以下数据,汇总产品名称与还...

  • sql做题笔记

    自己的日志记录后续慢慢更新 原帖:数据分析SQL面试题目9套汇总https://www.jianshu.com/p...

  • 面试题目汇总

    1.TCP的连接过程 三次握手 序号: seq序号,32位,发起方发送数据时对此进行标记 ack序号,确认序号,3...

  • 面试题目汇总

    计算机网络 tcp和udp的区别? tcp是面向连接的,udp是无连接的。 tcp是可靠的,udp是尽最大努力的。...

  • 基本算法

    题目汇总 面试中常用到机试题[https://cloud.tencent.com/developer/articl...

  • 操作系统面试题汇总

    Linux 面试题目汇总 参考链接: https://blog.csdn.net/ThinkWon/article...

  • 预计写作题目

    文学思想类 1.《人生不是自定义》(中长篇小说) 2.《吃不了现在的苦,就得吃将来的苦》(长篇小说) 3.《你不努...

  • Java基础面试总结

    【面试汇总】Java面试题-1Java面试题-2 【集合】Java集合及concurrent并发包总结(转)Jav...

  • 【面试题】说说ContentProvider、ContentRe

    参考:"ContentProvider和数据库"的区别和联系专题-面试必问点大总结

网友评论

      本文标题:大数据面试题目汇总(预计3020年有空总结......)

      本文链接:https://www.haomeiwen.com/subject/znpijhtx.html