美文网首页
等待hive表某个分区有数据再执行任务

等待hive表某个分区有数据再执行任务

作者: 马尔克ov | 来源:发表于2019-06-20 10:13 被阅读0次

有时上游任务不好串到同一个DAG(比如azkaban任务)中,这时需要轮询指定分区是否有数据,如果有则执行下一个任务。这时可以利用"hadoop fs -test"命令,shell脚本如下

flag=1
echo "init flag:${flag}"
while (( flag == 1 ))
do
    hadoop fs -test -s /user/antifraud/hive/warehouse/af_pro/ql_user_range/ymd=${dt_1day}/000000_0
    flag=$?
    echo "flag:${flag}"
    sleep 5m
done

echo "run"

相关文章

  • 等待hive表某个分区有数据再执行任务

    有时上游任务不好串到同一个DAG(比如azkaban任务)中,这时需要轮询指定分区是否有数据,如果有则执行下一个任...

  • hive的严格模式和分区

    相比mysql,hive有严格模式存在,为了不错误扫描整个数据,hive的分区表会将数据分成几个分区。查询分区表中...

  • Hive系列之分区表和桶

    为提升hive数据的查询和写入性能, hive提供了分区表机制。hive每个表格可以指定多个分区key, 这些分区...

  • 大数据知识点总结

    Hive: 分区表有哪几类 Hive中追加导入数据的4种方式是什么? Hive中到处数据有几种方式?如何导出数据 ...

  • HiveSQL分区-DML

    分区 创建分区表 以性别分区;分区字段不可与表列名重复! 载入分区表数据 介绍load-data:Hive-DML...

  • 大数据开发之Hive篇19-Hive分区表详解

    备注:Hive 版本 2.1.1 一.Hive分区表概述 数据分区的概念以及存在很久了,通常使用分区来水平分散压力...

  • 好程序员大数据培训教程分享hive分区和分桶

    好程序员大数据培训教程分享hive分区和分桶,hive 分区 1.为什么要分区?? 当单个表数据量越来越大的时候,...

  • Impala分区表

    摘要:Impala,分区表,hdfs 分区表 分区表就是将某个分区的数据的单独存放,当使用where语句是针对某个...

  • hive桶表

    hive桶表 1 桶表的概念 在hive中,数据库、表、分区都是对应到hdfs上的路径,当往表中上传数据的时候,数...

  • hive执行select count(*) 返回0,但是sele

    首先说一下,会以下的情况有以上的结果hive表分区,数据正好在hive分区目录里面,然后执行下面语句 下面列举4种...

网友评论

      本文标题:等待hive表某个分区有数据再执行任务

      本文链接:https://www.haomeiwen.com/subject/uvxdqctx.html