美文网首页
2015_ICSE_An Empirical Study on

2015_ICSE_An Empirical Study on

作者: zouxiaoyu | 来源:发表于2015-07-22 14:03 被阅读0次

好,先说下,感觉这篇文章很不错,现在看了些icse的文章,觉得top conference的papers就是不一样啊,内容和写作上很多都值得学习。这篇文章,我觉得在这2方面做得都很好。

从研究内容的意义上,探究的big data computing platform的service 的quality如何的问题。

从写作上,思路清晰,图表使用合理,结构安排恰当,条理清晰,重点加粗显示,结论方框框出等等,语言流利。反观自己COMPSAC的文章,觉得单内容的饱满型就很薄弱。。。都不好意思拿出手了。

好回来,讲这篇文章的主要研究内容:

我们都知道,现在都是大数据计算,云计算。本文从Microsoft的提供big data computing的platform着手,研究该平台在给用户提供数据计算服务时的质量问题,即我们通常关心的这个平台服务质量如何呀,会不会经常让task跑的失败啊,失败的原因又是啥子嘞,处理的方法通常又是怎样的,其故障发生后,issues的处理时间如何等。本文就依次用各种表格文字对以上问题进行了回答。其操作就是,随机抽取了210个用户跑任务出现问题时提交issue records及其对应的讨论解决方案的emails,找几个公司的员工人为去读它们。。然后通过相关统计分析对以上问题得出结论:

1)issues的分类大概有5类,分别是job失败,job结果错误,job slowdown,连接失败,service unavailable。

2)大多数issues的优先级在medium和high级别,very high的不多。这里issues一般按照business impact和severity排优先级。这个优先级好像是用户给出的,我觉得这个结果可能会与真实情况有偏差,因为,人们在自己的任务失败时,均希望自己的job fail能尽快得到解决而可能将其优先级设置的偏高,之前在百度实习的时候就经历过这样的。。好几个人都将自己的job priority设置的很高,不过我想这个在系统里应该比较容易控制。大家都高的话往往就相当于都不高了。。

3)导致issues出现的原因分为3类:硬件本身的问题,platform本身系统的问题,用户使用不当,具体每一类又有子类,这里就不列举相关结论了。。

4)issues出现后,开始相应的时间大部分1.5h内都能相应,几天内都能彻底解决。

5)最后还对platform的容错性进行了讨论,这里就不说了。。打字打累了。。

以上!

好好学习,天天向上!

zou@NanChang

2015-07-22 14:06

相关文章

网友评论

      本文标题:2015_ICSE_An Empirical Study on

      本文链接:https://www.haomeiwen.com/subject/jbwpqttx.html