美文网首页
sqlldr--数据加载工具

sqlldr--数据加载工具

作者: 运维随记 | 来源:发表于2023-02-12 11:38 被阅读0次

    1.sqlldr简介

          sqlldr即SQL*Loader,SQL*Loader是Oracle的高速批量的数据加载工具,通常用来将操作系统文件(数据)迁移到Oracle数据库中,是大型数据仓库选择使用的加载方法。

    其可用于多种平面文件格式向Oralce数据库中加载数据,sqlldr可以在极短的时间内加载数量庞大的数据,其有两种操作模式:

    1)传统路径(conventional path):sqlldr会利用SQL插入为我们加载数据

    2)直接路径(direct path):采用这种模式,sqlldr不使用SQL,而是直接格式化数据库块

        利用直接路径加载,可以从一个平面文件读数据,并将其直接写至格式化的数据库块,而绕过整个SQL引擎和undo生成,同时还可能避开redo生成。若要在一个没有任何数据的数据库中充分加载数据,最快的方法就是采用并行直接路径加载。

        在使用sqlldr时,需要有一个控制文件(control file),控制文件中包含描述输入数据的信息(如输入数据的布局、数据类型等),另外还包含有关目标表的信息,控制文件甚至还可以包含要加载的数据。

    2.sqlldr特点

    基本特点

    1)能装入不同数据类型文件及多个数据文件的数据

    2)可装入固定格式,自由定界以及可度长格式的数据

    3)可以装入二进制,压缩十进制数据

    4)一次可对多个表装入数据

    5)连接多个物理记录装到一个记录中

    6)对一单记录分解再装入到表中

    7)可以用 数对制定列生成唯一的KEY

    8)可对磁盘或 磁带数据文件装入制表中

    9)提供装入错误报告

    10)可以将文件中的整型字符串,自动转成压缩十进制并装入列表中

    3.sqllldr命令行参数

            sqlldr命令行参数可以直接放在命令行中,也可以写在控制文件中,还可以写在参数文件PARFILE(parameter file)里。

    PS:在重复指定的参数里面,命令行的参数优先级大于写在参数文件与控制文件中的参数

    [oracle@database01 ~]$ sqlldr

    SQL*Loader: Release 11.2.0.4.0 - Production on Tue Jan 10 17:06:51 2023

    Copyright (c) 1982, 2011, Oracle and/or its affiliates.  All rights reserved.

    Usage: SQLLDR keyword=value [,keyword=value,...]

    Valid Keywords:

                  userid -- ORACLE username/password         

                  control -- control file name                 

                      log -- log file name                     

                      bad -- bad file name                     

                    data -- data file name                   

                  discard -- discard file name                 

              discardmax -- number of discards to allow          (Default all)

                    skip -- number of logical records to skip    (Default 0)

                    load -- number of logical records to load    (Default all)

                  errors -- number of errors to allow            (Default 50)

                    rows -- number of rows in conventional path bind array or between direct path data saves

                            (Default: Conventional path 64, Direct path all)

                  bindsize -- size of conventional path bind array in bytes  (Default 256000)

                    silent -- suppress messages during run (header,feedback,errors,discards,partitions)

                    direct -- use direct path                      (Default FALSE)

                  parfile -- parameter file: name of file that contains parameter specifications

                  parallel -- do parallel load                    (Default FALSE)

                      file -- file to allocate extents from     

    skip_unusable_indexes -- disallow/allow unusable indexes or index partitions  (Default FALSE)

    skip_index_maintenance -- do not maintain indexes, mark affected indexes as unusable  (Default FALSE)

      commit_discontinued -- commit loaded rows when load is discontinued  (Default FALSE)

                  readsize -- size of read buffer                  (Default 1048576)

            external_table -- use external table for load; NOT_USED, GENERATE_ONLY, EXECUTE  (Default NOT_USED)

          columnarrayrows -- number of rows for direct path column array  (Default 5000)

                streamsize -- size of direct path stream buffer in bytes  (Default 256000)

            multithreading -- use multithreading in direct path 

                resumable -- enable or disable resumable for current session  (Default FALSE)

            resumable_name -- text string to help identify resumable statement

        resumable_timeout -- wait time (in seconds) for RESUMABLE  (Default 7200)

                date_cache -- size (in entries) of date conversion cache  (Default 1000)

          no_index_errors -- abort load on any index errors  (Default FALSE)

    PLEASE NOTE: Command-line parameters may be specified either by

    position or by keywords.  An example of the former case is 'sqlldr

    scott/tiger foo'; an example of the latter is 'sqlldr control=foo

    userid=scott/tiger'.  One may specify parameters by position before

    but not after parameters specified by keywords.  For example,

    'sqlldr scott/tiger control=foo logfile=log' is allowed, but

    'sqlldr scott/tiger control=foo log' is not, even though the

    position of the parameter 'log' is correct.

    4.控制文件

    ###命令行

    sqlldr userid=用户名/密码@实例  control=loid.ctl data=/export/home/oracle/liang/hx.txt bad=/export/home/oracle/liang/log/loid.bad

    ###控制文件

    OPTIONS(direct=TRUE,parallel=TRUE,multithreading=TRUE,readsize=3072000,BINDSIZE=8388608,READSIZE=8388608,ERRORS=10000,ROWS=1000000)

    load data

    infile '/export/home/oracle/liang/hx.txt'

    truncate into table tablequerymanager.tmp_optical_bpp_loid

    fields terminated by ','

    optionally enclosed by '"'

    trailing nullcols

    (      code_name

    )

    ###OPTIONS说明

    OPTIONS ([SKIP=integer],[LOAD = integer],[ERRORS = integer],[ROWS=integer],[BINDSIZE=integer],[SILENT=(ALL|FEEDBACK|ERROR|DISCARD)]

    ###OPTIONS说明

    skip=1                #表示跳过第一行,从第二行开始导入

    load=200000            #表示并不导入所有的数据,只导入跳过skip参数后的200000条数据

    rows=1000              #表示一次加载的行数,默认值为64,此处设置为1000

    errors=100            #表示出错100次后,停止加载

    bindsize=33554432      #表示每次提交记录缓冲区的大小,默认256k

    ###控制文件说明

    load data

    infile '/export/home/oracle/liang/hx.txt'                            #指定数据文件绝对路径               

    truncate into table tablequerymanager.tmp_optical_bpp_loid          #指定导入库表

    fields terminated by ','                                            #指定分隔符

    optionally enclosed by '"'

                                              #指定界定符

    trailing nullcols

    (      code_name "replace(:username,chr(13),'')"

    )

    相关文章

      网友评论

          本文标题:sqlldr--数据加载工具

          本文链接:https://www.haomeiwen.com/subject/kskdkdtx.html