大数据启蒙

作者: 大白乐了 | 来源:发表于2019-06-21 15:52 被阅读0次

如何学习数据结构与算法
大数据启蒙
《1》数学启蒙（一）孙路弘
我只花了不到400元，陪孩子看完了100多本廖彩杏英文绘本
我只花了400元，陪孩子看完了100多本廖彩杏英文绘本推荐全书
培养孩子的英文阅读能力，请收了这份书单
中国宪政启蒙与英国大宪章
读《当下的启蒙》
【区块链启蒙19/100】大数据的大救星
“不合群”的日子里，一个人也是一个英雄

1.分治思想

需求：我有一万个元素，期望时间复杂度是O(4)
解法1:1万个元素线性查找，时间复杂度为O(n)
解法2:1万个元素二分法查找,nlog(n)
解法3:1万个元素 hashcode()%2500 相当于2500个桶，每个桶装4个元素,实现是时间复杂度O(4)

2.分治思想的应用场景

2.1 Redis集群
2.2 ElasticSearch集群
2.3 postgresql集群
2.4 Hadoop生态

3.单机处理大数据问题

需求：有一个非常大的文本文件，里面有很多很多行，只有两行一样，他们出现在未知的位置，需要查找他们；而且单机可用的内存很少，也就100M以内
假设io速度是500M/s
1T文件读取一遍需要30min
思考:如何让时间变为分钟、秒级？
解法: 30min=1800s
1T readline()%1800 分桶
读取时间为 1s（io时间）,内存寻址时间比io寻址时间快10w倍，总时间为1.xxs