今天在我的程序猿Q群里无意间讨论了这个问题,扎一想,这不太可能吧。理由是
****使用腾讯QQ的人非常之多,几乎人手一个吧。在线聊天,斗图,视频,每秒得多少数据啊。这数据量太大了,因此不可能的。****
因为本人也是IT人士,还有目前有一些大数据方面的积累,开始判断是有可能的。下面咱们让数据说话,以下一些数据来自于互联网,精准与否暂不在本次讨论范围内。以下分析我尽量让非专业人士看懂,但你必须有加减乘除的能力。
腾讯号称拥有9亿注册用户,我就当做真的了!腾讯自1998年11月11日创立,我们为了计算方便取整吧,且认为腾讯距今已经创立20年了。且假设这9亿用户从创建至今一直没有人数变化,且每天活跃,注册用户等于活跃用户,一切为了计算简单。每个人每天聊天5千字,一年365天不停歇。这个相当厉害了,韩寒说过一天写500字一年后都可以出20万字的小说了。那么我们就可以算出来,所有用户这20年里,聊天字数。
公式: 9亿用户x 一天5千字 x 365天 x 20年 = 总聊天字数
9亿x5000x365x20 = 328500000亿个字
好了,我说明一点,在计算机中,文字存储占用空间是非常小的。但是图片和视频的数据量一般很大,我们暂时不考虑图片和视频这些,只考虑聊天文字记录。那么在计算机中我们常常听到的内存卡64G的,这个G就是GB 。下面有个数据
1G的硬盘空间 大约存储汉字字数为 5亿个
这里没有考虑文件压缩算法,咱们为了方便计算。对了,我要说明一点腾讯开通会员,才可以手机,电脑同步聊天记录,所以证明聊天记录在服务端存储着呢。但是会员也不是能无限制的看20年前的聊天记录,目前支持的是能看到1个月内的囧 。所以这些数据不是以文件存储在离线硬盘上的。 这些估计是存储在在线硬盘里的囧(好想用专业术语比如Hadoop,NOSQL,集群)
我们假设聊天记录出现之后,会在当天合适的时间,比如凌晨三点变成文本存储在离线硬盘里,每天都这个操作,操作了20年。那么现在的硬盘空间至少多少呢。上面2个数据就算出来了。
328500000亿字 ÷ 5亿字/GB = 65700000GB
我们再普及一下硬盘存储的单位换算
1024GB = 1TB
1024TB = 1PB
1024PB = 1EB
因此可以用PB或者EB来表示需要的空间大小是
65700000 / 1024 = 64160TB
64160 / 1024 = 63PB
63 / 1024 = 0.06EB
目前据我所知,使用PB做为存储是主流,当然想谷歌,脸书,腾讯,百度,阿里,估计用上EB级别的存储。
好了,我们接着算,一共是63PB,就可以存储20年9亿活跃用户的聊天文字记录了。
那么存储设备多少钱呢,我们知道一般1TB硬盘400人民币。但是服务器的存储硬盘盒我们平常使用的不一样呢,会贵一些,所以1PB的存储设备市场价是50万美元,按人民币当天汇率 6.8算。
63 x 50 = 3150 万美元
3150 x 6.8 = 21420万人民币 ~ 2.2亿人民币
所以单算存储设备的钱,不加上电费,人工成本,场地费,维护费,税等等 最终结论是
存储腾讯QQ从1998年到现在9亿人每天5千字的文字聊天记录需要63PB硬盘存储空间,越等于2.2亿人民币。
对于腾讯这个市值26425亿港元(约3389亿美元)的庞然大物来讲,这些设备钱只是九牛一毛了。所以今后再有人问你,腾讯会保存所有聊天记录吗? 会,一定会,必须会。
网友评论