将文件导入到数据库中的方法小结

发表于:2007-07-04来源:作者:点击数: 标签:
大型的 数据库 开发 中常常遇到数据源是平面文件的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理 本文介绍几种常见的数据导入的方法,希望能够给读者以启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类

大型的数据库开发中常常遇到数据源是平面文件的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理   本文介绍几种常见的数据导入的方法,希望能够给读者以启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类似。

一、 Sql*:Loader

该方法是Oracle数据库下数据导入的最重要的方法之一,该工具由Oracle客户端提供,其基本工作原理是:首先要针对数据源文件制作一个控制文件,控制文件是用来解释如何对源文件进行解析,其中需要包含源文件的数据格式、目标数据库的字段等信息,一个典型的控制文件为如下形式:

     LOAD DATA   INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'   TRUNCATE   INTO TABLE fj_ipa_agentdetail   fields terminated ","   trailing nullcols   ( AGENT_NO char,   AGENT_NAME char,   AGENT_ADDRESS char,   AGENT_LINKNUM char,   AGENT_LINKMAN char   )

  

其中,INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'指明所要导入的源文件,其实源文件也可以直接通过命令行来输入获得,fj_ipa_agentdetail为目标表的名字,fields terminated ","是指源文件的各个字段是以逗号分隔,trailing nullcols表示遇到空字段依然写入到数据库表中,最后这5个字段是目标数据库表的字段结构。通过上面这个典型的控制文件的格式分析可知,控制文件需要与源文件的格式信息一致,否则导入数据会出现异常。

除了控制以外,sql*loader的还需要数据文件,即源文件。根据格式的不同,源文件可以分为固定字段长度和有分隔符这两大类,这里将分别说明这两种情况:

固定字段长度的文本文件

就是每个字段拥有固定的字段长度,比如:

     602530005922 1012   602538023138 1012   602536920355 1012   602531777166 1012   602533626494 1012   602535700601 1012

  

有分隔符的文本文件

就是每个字段都有相同的分隔符分隔,比如:

1001,上海长途电信综合开发公司,南京东路34号140室

1002,上海桦奇通讯科技有限公司,武宁路19号1902室

1003,上海邦正科技发展有限公司,南京东路61号903室

对于上述两种文件格式sql*loader均可以做处理,下面就前面那个固定长度的文本来举例说明:

由于该文本只有两个字段,一个为设备号,一个是区局编号,两者的长度分别为20和5,那么可以编制控制文件如下:

     LOAD DATA   INFILE '/ora9i/fengjie/agent/data/ipaagent200410.txt'   TRUNCATE   INTO TABLE fj_ipa_agent   ( DEVNO POSITION(1:20) CHAR,   BRANCH_NO POSITION(21:25) CHAR   )

  

其中,'/ora9i/fengjie/agent/data/ipaagent200410.txt'为该文件的完全路径,POSITION(M:N)表示该字段是从位置M到位置N。

对于有分隔符的数据文件,前面已经有一个例子,这里就不再赘述了。总之,使用Sql*Loader能够轻松将数据文件导入到数据库中,这种方法也是最常用的方法。

原文转自:http://www.ltesting.net