首先声明不是我的体验,我还未加入Google。:)
作者是Matt Welsh,现在Chrome Cloud Team的负责人,2010年6月加入Google,加入Google之前是哈佛大学的计算机教授,在他加入Google 4个月后,他写下了他的感受,对你没理解错,那是2010年10月,7年前...
sticker体验一,真TM酷比了~!和你接触的同事电脑上都贴着“my other computer is a data center”的贴纸,这种体验就好像你开车看到前方一辆车后面贴着“我家还有一辆劳斯莱斯”,这种排山倒海全马路我最屌的气势扑面而来。想想我经历过的贴纸 --- “Think Twice”;XX红线;尼玛赶紧撕了~!
体验二,分分钟学会做人。虽然说作者是个学院派(当过教授啊),也好歹是搞过分布式系统顶层设计的,来了google才明白“做人的道理”,用作者的话说就是在学校用200个节点实践的理论项目在Google那就是苍白二字~经过这四个月的学做人,作者已经确信他能够开发一个在上千台服务器上稳定运行的任务,有适当的控制模块,并且能优雅的访问分布式存储。令作者折服的是这上千台机器分别分布在地球的各个地区,而且这么广的分布对任务开销影响却少的可怜。心疼咱们的研发同学,写个程序跨个机房得突破重重关卡,考虑各种流量因素。
作者随后分享了他在Google四个月明白的做人道理:
一、云是真的啊!作者在大学里为了做实验放几台机器真是操碎心啊,到底是去校外找个第三方机房还是在把校内的办公室改造改造变成机房?搞个项目又是拉赞助又是当民工,扛机器做网线搭集群建算法十八般武艺那是样样精通。到了Google不得了,作者所有要关心的是如何连上那台他也不知道在哪个机房,跑在哪里的Linux虚拟机,只要ssh连上了,那么他想做的所有事情基本都可以在那里面搞定了,什么写代码、构建、测试、发布,几乎所有事情,作者泪流满面的说,TM哥用猫拨号上的网,TM延迟也这么低,TM google毁了我对网络延迟的所有理解。
Cry二、工具真是逆天了!作者从来没有想到可以这么简单的去可以开发并运行一个读取大量数据集的并行超大任务,这酸爽的体验都不用去关心啥共享内存,作业相互通信,跑MPI万一挂了一台机器,这...这...作者一度怀疑其前半生。
三、先打日志,再提问~作者体会到在这么庞大环境里调试任务的不可能性!找谁复现去啊?咱们连机器登陆的权限都没有,别指望我还能登陆个机器调试个啥,TM只能把日志打清楚先!靠日志来调查问题,同时作者还再次提到测试的重要性,在提交任务满世界运行之前,我必须先看到所有的测试Case都亮起了绿灯,否则要想发布门都没有!(PS:看看人家这四个月的觉悟...)
是的,这是作者2010年加入google 4个月的体验,7年后的我看来也是感慨万千, 想想最近强调的客户体验,前不久大会提出X年赶超Google的目标,我不是一个悲观主义者,但我们要改变的事情还有太多太多,脚踏实地看清楚差距可能才有机会换道超车。。。
作者原文:http://matt-welsh.blogspot.com/2010/10/computing-at-scale-or-how-google-has.html
网友评论