简述sqlldr的使用

     我的项目有一张表,始终是手动导入数据。我接手之前的同事总是喜欢用pl/sql developer,但是我觉得还是黑框框看着有技术含量。

     这里顺便就写一下有关sqlldr的简单用法。

     有关sqlldr资料比较全面的应该就是帮助了,打出来看一下。

    

SQL*Loader: Release 11.2.0.1.0 - Production on 星期六 8月 4 12:54:31 2012

Copyright (c) 1982, 2009, Oracle and/or its affiliates.  All rights reserved.


用法: SQLLDR keyword=value [,keyword=value,...]

有效的关键字: 

    userid -- ORACLE 用户名/口令        
   control -- 控制文件名                
       log -- 日志文件名                    
       bad -- 错误文件名                   
      data -- 数据文件名                  
   discard -- 废弃文件名
discardmax -- 允许废弃的文件的数目         (全部默认)
      skip -- 要跳过的逻辑记录的数目  (默认 0)
      load -- 要加载的逻辑记录的数目  (全部默认)
    errors -- 允许的错误的数目         (默认 50)
      rows -- 常规路径绑定数组中或直接路径保存数据间的行数
               (默认: 常规路径 64, 所有直接路径)
  bindsize -- 常规路径绑定数组的大小 (以字节计)  (默认 256000)
    silent -- 运行过程中隐藏消息 (标题,反馈,错误,废弃,分区)
    direct -- 使用直接路径                     (默认 FALSE)
   parfile -- 参数文件: 包含参数说明的文件的名称
  parallel -- 执行并行加载                    (默认 FALSE)
      file -- 要从以下对象中分配区的文件     
skip_unusable_indexes -- 不允许/允许使用无用的索引或索引分区  (默认 FALSE)
skip_index_maintenance -- 没有维护索引, 将受到影响的索引标记为无用  (默认 FALSE)
commit_discontinued -- 提交加载中断时已加载的行  (默认 FALSE)
  readsize -- 读取缓冲区的大小               (默认 1048576)
external_table -- 使用外部表进行加载; NOT_USED, GENERATE_ONLY, EXECUTE  (默认 NOT_USED)
columnarrayrows -- 直接路径列数组的行数  (默认 5000)
streamsize -- 直接路径流缓冲区的大小 (以字节计)  (默认 256000)
multithreading -- 在直接路径中使用多线程
 resumable -- 启用或禁用当前的可恢复会话  (默认 FALSE)
resumable_name -- 有助于标识可恢复语句的文本字符串
resumable_timeout -- RESUMABLE 的等待时间 (以秒计)  (默认 7200)
date_cache -- 日期转换高速缓存的大小 (以条目计)  (默认 1000)
no_index_errors -- 出现任何索引错误时中止加载  (默认 FALSE)

PLEASE NOTE: 命令行参数可以由位置或关键字指定
。前者的例子是 'sqlldr
scott/tiger foo'; 后一种情况的一个示例是 'sqlldr control=foo
userid=scott/tiger'。位置指定参数的时间必须早于
但不可迟于由关键字指定的参数。例如,
允许 'sqlldr scott/tiger control=foo logfile=log', 但是
不允许 'sqlldr scott/tiger control=foo log', 即使
参数 'log' 的位置正确。

  好在我是中文版的oracle,看起来很明了。我的目的是把文本文件导入到数据库中,因此我只需要几个很简单的参数。下面是我的数据文件的格式:

      xa0010011,88721,201207

      xa0010012,88722,201207

      ......

      下面是我的数据表的结构:

      create table sqlldr_test

      (

          user_no varchar2(100),

          user_rate number,

          month_id varchar2(6)

       )。

      那么,sqlldr的控制文件应该这样写:

     

load data
infile 'E:\Script\data.txt'
append
into table sqlldr_test
fields terminated by ','
trailing nullcols
(
    user_no,
    user_rate,
    month_id
)

      其中,append代表直接插入到队尾。append什么原理,可以参考网络资料。这个我个人认为可以提高导入的速度,因为数据直接插到了数据表的队尾。另外还有参数:truncate,replace,insert,他们分别和truncate table,delete from table和insert into table对应,前两个是要删除数据的慎用。

      我的文本文件中,数据是用逗号“,”分割的,所以这里写上了,这句一定要写。

      trailing nullcols,代表表的字段没有值时,允许为空。

      到此为止,控制文件的写作就算完成了,已经可以满足我的应用了。

      接下来就要用了。不管是在linux里,还是windows里,都是用命令行来控制的,当然了也可以写一个程序控制,但是我不会。命令行的命令如下:

     

sqlldr wings/wings@OBAMA control=control.ctl log=log.log bad=bad.log errors=5000 rows=500

      这里面的所有参数在文章最开始的地方已经解释过了,这里便不再赘述。下面点一下回车就执行了。
      我觉得需要说的应该就是rows了,因为从最开始接触oracle就有人告诉我,每次插入数据的时候,最好每多少多少行提交一次,因为undo空间是有限的。至于每次使用sqlldr的时候多少行提交一次,我想应该根据自己的文件大小决定。

      记得记日志,不然错了你都不知道错到哪里了。

posted @ 2012-08-04 13:19  wingsless  阅读(30440)  评论(2编辑  收藏  举报