美文网首页
2020-03-15

2020-03-15

作者: 梦境中_i | 来源:发表于2020-03-15 17:07 被阅读0次

首先处理大数据的面试题,有些基本概念要清楚:

(1)1Gb = 109bytes(1Gb = 10亿字节):1Gb = 1024Mb,1Mb = 1024Kb,1Kb = 1024bytes;

(2)基本流程是,分解大问题,解决小问题,从局部最优中选择全局最优;(当然,如果直接放内存里就能解决的话,那就直接想办法求解,不需要分解了。)

(3)分解过程常用方法:hash(x)%m。其中x为字符串/url/ip,m为小问题的数目,比如把一个大文件分解为1000份,m=1000;

(4)解决问题辅助数据结构:hash_map,Trie树,bit map,二叉排序树(AVL,SBT,红黑树);

(5)top K问题:最大K个用最小堆,最小K个用最大堆。(至于为什么?自己在纸上写个小栗子,试一下就知道了。)

(6)处理大数据常用排序:快速排序/堆排序/归并排序/桶排序

相关文章

  • python复习第8天:文件读写

    title: python复习100天--第8天date: 2020-03-15 21:00:24tags:- p...

  • 【周总结】第八期第10周07号-醒

    2020-03-15 【本周计划/总结】 一、职业发展 英语单词拉了点,要快速补上!! 二、财务状况 无 三、健康...

  • 赞美

    中原焦点团队 高艳峰 信阳 网络中级九期 坚持分享第711天 2020-03-15 赞美:要使当事人能解...

  • #成长进阶#Day4 2020-03-15

    #成长进阶#Day4 2020-03-15 认知加强: 1,我们总是听见,看见,接触,接受,我们比较熟悉的事务。不...

  • 泛读《这才是心理学》5/5

    2020-03-15 / 星期日 1 今日学习(*输入*) 泛读【第2章、可证伪性】 书摘: 更多电子书平台的《这...

  • 又是一年春来早(1)

    2020-03-15 早晨出去埋肥,移栽杏树,发现虽尚无花香,但已有鸟语,春天的气息越来越浓郁。 2020-03-...

  • 梦,该醒了

    梦,该醒了 ————— 2020-03-15 ————— 你曾尝试着每天躺在床上耍手机,连续好几个月吗? 你曾尝试...

  • 原来有人可以让我的星空暗淡

    2020-03-15 会让你难过的人, 终究还会再让你难过。 一个活在星空中的梦女孩, 也不曾想会有, 星空暗淡,...

  • 2020-03-27

    明•冯梦龙《醒世恒言》经典语录,每读一遍都是对自己境界的提升 我是摆渡人 2020-03-15 09:41:43 ...

  • 讲课NO.110

    2020-03-15 星期日 晴 讲课NO.110 今天我讲了一个很搞笑的课,它的名字叫青蛙和蟾蜍《讲故事》...

网友评论

      本文标题:2020-03-15

      本文链接:https://www.haomeiwen.com/subject/cdqyehtx.html