一个问题 我们使用如下的参数提交了Flink on YARN作业(per-job模式)。 该作业启动了10个Tas...[作者空间]
优化spark代码的有一条是避免使用会产生shuffle 的算法,比如 join。对于习惯了写sql的人来说,使用...[作者空间]
做大数据&&算法 其实最重要的三件事 ,就是 管理数据 和集群运维 模型训练,一旦 远离这三个主题,大数据都无法...[作者空间]