首页/技术开发/内容

用C++产生SQL*Loader各类文件

技术开发2022-06-10 阅读()
目 前, 我 国 许 多 单 位MIS 系 统 建 立 在 微 机PC 或 基 于 Novell NetWare 局 域 网 环 境 中, 数 据 库 和 开 发 工 具 采 用 Foxpro 2.5 for DOS 或 Foxpro 2.5 for Windows, 以dbf 文 件 为 数 据 组 织 管 理 手 段, 随 着 系 统 的 不 断 扩 大 和 实 际 应 用 的 需 要, 不 少 单 位 已 开 始 采 用 大 型 数 据 库Oracle。 在MIS 从Foxpro 升 级 到 大 型 数 据 库Oracle 过 程 中, 将Foxpro 的dbf 文 件 通 过Oracle 工 具SQL*Loader 加 载 到Oracle 数 据 库 中 是 一 项 非 常 重 要 的 工 作。 一 般 用SQL*Loader 加 载 的 具 体 实 施 步 骤 是:

---- * 运 行Foxpro, 打 开 数 据 库, 将dbf 文 件 拷 贝 为SDF 格 式 的 文 本 文 件

---- * 根 据dbf 文 件 结 构, 产 生 建 立Oracle 表(CREATE TABLE) 的SQL 语 句

---- * 登 录Oracle, 运 行 产 生Oracle 表(CREATE TABLE) 的SQL 语 句

---- * 根 据dbf 文 件 结 构, 产 生SQL*Loader 的 控 制 文 件

---- * 运 行SQL*Loader , 加 载 数 据

---- 用 手 工 方 法 产 生CREATE TABLE 的SQL 语 句, 特 别 是 产 生SQL*Loader 控 制 文 件 时,POSITION 起 始、 结 束 位 置 经 常 弄 错, 当 需 要 加 载 大 量 的 数 据 时, 不 但 烦 琐, 而 且 效 率 比 较 低。 我 们 在 实 践 中 利 用Borland C++ 5.0 编 制 了 一 个C++ 实 用 程 序load.cpp, 自 动 产 生SQL*Loader 的 数 据 文 件、 控 制 文 件 和 产 生CREATE TABLE 的SQL 语 句。 运 用load, 我 们 只 需:

---- * load < 数 据 库 名 >

---- * 登 录Oracle, 运 行 产 生Oracle 表(CREATE TABLE) 的SQL 语 句

---- * 运 行SQL*Loader , 加 载 数 据

---- 在 实 践 中, 我 们 通 过 这 种 方 法, 在 实 现 从Foxpro 到Oracle for Digital UNIX + 中 文Windows 95 的client/server 平 台 的 数 据 加 载 过 程 中 提 高 了 效 率。

---- 2.Foxpro 中dbf 文 件 结 构

---- dbf 文 件 由 文 件 头 和 文 件 记 录 组 成, 其 中 文 件 头 又 由 数 据 库 说 明 和 字 段 说 明 组 成。 数 据 库 说 明 由32 个 字 节 组 成, 各 字 节 含 义 见 表 一:

字 节
含 义
0
数 据 库 文 件 标 志 有 无 备 注 型 字 段(03H 无)
1-3
最 后 一 次 修 改 日 期
4-7
文 件 记 录 数
8-9
文 件 头 长 度
10-11
记 录 长 度
12-31
未 用

---- 表 一

---- 字 段 说 明 由 若 干 个32 字 节 组 成, 每32 字 节 说 明 一 个 字 段, 各 字 节 含 义 见 表 二:

字 节
含 义
0-10
字 段 名
11
字 段 类 型
12-15
该 字 段 在 文 件 首 记 录 中 的 地 址
16
字 段 长 度
17
小 数 位 数
18-31
未 用

---- 表 二

---- 文 件 记 录 以ASCII 形 式 存 储, 每 条 记 录 以 空 格(20H) 开 头, 该 空 格 用 来 作 删 除 标 志 用。

---- 3. 建 立 对 应Foxpro 的Oracle 表 的SQL 语 句

---- Foxpro 和Oracle 对 应 的 数 据 类 型 的 描 述 见 表 三:

Foxpro
Oracle
Character(n)
char(n) varchar2(n)
Number(n,m)
number(n-1,m) m< >0
number(n,m) m=0
Float(n,m)

Logical
char(1)
DATE
DATE

---- 三

---- 【 注】:

---- * 不 考 虑 完 整 性 约 束, 同 时 对 于TABLESPACE 及STORAGE 存 储 参 数 取 缺 省 值。

---- * 对 于 数 字 型 字 段,n 表 示 数 字 的 宽 度, 在Foxpro 中 包 含 小 数 点 位 置, 而 在Oracle 中 不 包 含。

---- * 对 于Foxpro logical 型 字 段 类 型, 由 于Oracle 中 没 有 相 应 的 逻 辑 型 变 量, 故 将 其 转 换 为 字 符 类 型。

---- * 暂 且 不 考 虑memo、general、picture 字 段 的 转 换。

---- 4. SQL*Loader 控 制 文 件 的 建 立

---- 控 制 文 件 为SQL*Loader 的 核 心 文 件, 与Foxpro 字 段 对 应 关 系 为 表 四: Foxpro 数 据 类 型

---- 控 制 文 件 语 句 对 应 的 格 式

Character(n)
CHAR
Number(n,m)
Float(n,m)
DECIMAL EXTERNAL NULLIF < field > = BLANKS (m< >0)

INTEGER EXTERNAL NULLIF < field > = BLANKS ( m=0)
Logical
CHAR
DATE
DATE "YYYYMMDD" NULLIF < field > = BLANKS

---- 四

---- 以 下 是 用Borland C++ 5.0 在 中 文Windows 95 下 编 制 的 产 生CREATE TABLE SQL 语 句 和 产 生SQL*Loader 数 据 文 件、 控 制 文 件 的 源 程 序load.cpp。

#include < stdio.h >
#include < stdlib.h >
#include < iostream.h >
#include < fstream.h >
#include < string.h >
#include < math.h >
#define MAX_ROW_LENGTH 1200
#define MAX_FIELD_NUMBER 30
typedef struct head // dbf头文件结构
{ unsigned char mask ;
unsigned char date[3] ;
unsigned long record_num;
unsigned short int head_length;
unsigned short int field_length ;
} HEAD ;

typedef struct field // dbf字段结构
{ unsigned char name[11];
unsigned char type ;
unsigned long add;
unsigned char length;
unsigned char dec ;
} FIELD ;

int main(int argc,char **argv)
{ char buf[MAX_ROW_LENGTH],dbf[40],*sqlload;
unsigned int i,field_num;
HEAD *dbfhead ;
FIELD dbffield[MAX_FIELD_NUMBER];
FILE *fout, *fp;

if (argc!=2)
{ cout < < "Usage : load dbfile" < < endl ;
return -1;
}

sqlload = new char(40);
dbfhead = new HEAD;
strcpy(buf,"");

strcpy(dbf,argv[1]);
strcat(dbf,".dbf");
if ((fp=fopen(dbf,"rb")) == NULL)
{ cout < < "Cannot open file " < < dbf < < endl;
return -1 ;
}
fseek(fp,0,SEEK_SET);
fread(dbfhead,sizeof(HEAD),1,fp); // 读dbf头文件信息

field_num = (dbfhead- >head_length-1)/32 -1 ; //字段个数

for( i=0; i< field_num; i++)
{ fseek(fp,32*(i+1),SEEK_SET);
fread(&dbffield[i],sizeof(FIELD),1,fp); // 读dbf结构信息
}
// 产 生SQL*Loader 控 制 文 件
strcpy(sqlload,argv[1]);
strcat(sqlload,".ctl");
if ((fout=fopen(sqlload,"w")) == NULL)
{ cout < < "Cannot open file " < < sqlload < < endl;
return -1 ;
}
fprintf(fout,"LOAD DATA\n");
fprintf(fout,"INFILE '%s.txt'\n", argv[1]);
fprintf(fout,"INTO TABLE %s (\n", argv[1]);

for(i=0;i< field_num;++i)
{ fprintf(fout, "%11s POSITION(%d:%d)", dbffield[i].name,
dbffield[i].add, dbffield[i].add + dbffield[i].length -1 );
switch (dbffield[i].type)
{ case 'C':
case 'L': // 字符型/ 逻辑型
fprintf(fout, " CHAR");
break ;
case 'N':
if (dbffield[i].dec == 0 ) //整数型
fprintf(fout, "INTEGER EXTERNAL NULLIF %s = BLANKS",
dbffield[i].name);
else //实数型
fprintf(fout, " DECIMAL EXTERNAL NULLIF %s =BLANKS",
dbffield[i].name );
break;
case 'D': //日期型
fprintf(fout, " DATE 'YYYYMMDD' NULLIF %s = BLANKS",
dbffield[i].name);
break;
default:
break;
}
if(i< field_num -1)
fprintf(fout, ",\n") ;
}
fprintf(fout, ")\n");
fclose(fout);

// 产 生CREATE TABEL. 的SQL 语 句
strcpy(sqlload,argv[1]);
strcat(sqlload,".sql");
if ((fout=fopen(sqlload,"w")) == NULL)
{ cout < < "Cannot open file " < < sqlload < < endl;
return -1 ;
}
fprintf(fout, "create table %s (\n", argv[1]);
for(i=0;i< field_num;i++)
{ fprintf(fout,"%11s",dbffield[i].name);
switch (dbffield[i].type)
{ case 'C': //字符型
fprintf(fout, " CHAR(%d)",dbffield[i].length);
break;
case 'L': //逻辑型
fprintf(fout, " CHAR(1)");
break;
case 'N': //数字型
if (dbffield[i].dec==0)
fprintf(fout," NUMBER(%d)", dbffield[i].length) ;
else
fprintf(fout, " NUMBER(%d,%d)",
dbffield[i].length-1, dbffield[i].dec);
break;
case 'D': // 日 期 型
fprintf(fout, " DATE");;
break;
default:
break;
}
if (i< field_num - 1)
fprintf(fout, ",\n");
}
fprintf(fout, ")\n");
fclose(fout);

// 产生SQL*Loader数据文件
strcpy(sqlload,argv[1]);
strcat(sqlload,".txt");
if((fout=fopen(sqlload,"w")) == NULL)
{ cout < < "Cannot open file " < < sqlload < < endl;
return -1 ;
}
fseek(fp,dbfhead- >head_length,SEEK_SET);

for(i=0;i< dbfhead- >record_num;i++)
{ fread(buf,dbfhead- >field_length,1,fp);
buf[dbfhead- >field_length] ='\0';
fprintf(fout,"%s\n", buf+1); //skip记录首字节(删除标志)
}
fclose(fout);
fclose(fp);

delete sqlload;
return 0 ;


……

相关阅读