hadoop 排错

作者: 阳明AI | 来源:发表于2018-11-23 12:33 被阅读32次

hadoop文件map排序的过程导致摸一个文件数据很大。达到1.7g， 9千多万行。导致内存超限，
解决：过滤userid为0的数据，或者判断len个数小于三个，因为userid=0的数据太多

图片.png

查看文件

cat part-00079 |more

查看文件（最大的前十个的）

ll -Sh |head

图片.png

查看文件行数

cat part-00079 |wc -l

hadoop 排错
hadoop文件map排序的过程导致摸一个文件数据很大。达到1.7g， 9千多万行。导致内存超限，解决：过滤use...
排错
ping 出现 dup! 解决方案： udev 详解如果你使用Linux比较长时间了，那你就知道，在对待设备文件...
排错
1.ERROR 2002 (HY000): Can't connect to local MySQL server...
排错
1、java.lang.OutOfMemory, unable to create new native thre...
记Hadoop3.1.3安装排错之ERROR: but ther
问题： ERROR: but there is no YARN_RESOURCEMANAGER_USER defi...
记Hadoop3.1.3安装排错之ERROR: Cannot s
错误： ERROR: Cannot set priority of datanode process xxx 修复...
SSH连接失败排错经验
SSH连接失败排错经验
Day09-Binlog日志配置与备份恢复
1. 日志管理日志作用：排错、数据恢复、优化 1.1 排错错误日志（默认开启）默认错误日志查看配置方式： ...
排错日记
（1）如果工具条打不开，可能是python版本的问题 Local 局部（2）Normal.mxt模板问题这个...
问题排错
总结一下项目上线之后出现问题怎么排错一下几种问题出现的比较多，其他的问题也会有不过我不知道进程退出 Outo...