UNIX操作系统tar命令之隐患及解决方法

发表于:2007-07-01来源:作者:点击数: 标签:
一、 引言 目前,UNIX操作系统在我国 金融 界被广泛地采用,UNIX以其强大的功能(分时、多任务、多用户、 网络 互连、图形接口等),倍受金融企业青睐。中国农业 银行 现应用的SCO UNIX OPENSERVER5?0更是功能强劲。 各家银行的储蓄、会计、信用卡等计算机业


一、 引言
   目前,UNIX操作系统在我国金融界被广泛地采用,UNIX以其强大的功能(分时、多任务、多用户、网络互连、图形接口等),倍受金融企业青睐。中国农业银行现应用的SCO UNIX OPENSERVER5?0更是功能强劲。
   各家银行的储蓄、会计、信用卡等计算机业务处理系统均运行在UNIX操作系统平台上。电子化的发展拓展了银行的业务领域,提高了工作效率,加强了业务的准确性、保密性、安全性,树立了银行的社会形象,产生间接的经济效益。电子化银行的发展对计算机数据的可靠性提出了更高的要求。
   据笔者调查,在UNIX操作系统上备份和恢复数据的控制程序决大多数是用tar命令实现的。tar命令具有使用简单好学易用的特点。但笔者在使用tar命令的过程中,发现tar命令对于中国用户具有一个严重的隐患:对文件名为汉字且较长的文件能够归档打包,但不能解开该档案包。
   例如:
   1?先创立一个长汉字文件名文件:
   # cd /tmp
   # cat /etc/passwd>长长长长长长长长长长长长长长长长长长
   2?将该文件归档至abc文件包:
   # mtar cvf abc *
   3?解开或查看abc档案包:
   # tar xvf abc 或atr tvf abc
   abc档案包将不能解开或查看。

二、 剖析
   UNIX的tar命令产生的归档文件称tar格式档案文件,具有以下格式:
   1?每个文件被加上了一个512字节的文件属性头,然后以512字节为单位块在包中连续存放,占有整数个块。最后一个块不能写满,其后用0x00填写。
   2?如文件长度为零字节或是链接文件,则只有512字节的文件属性头。
   3?用1024字节的0x00作为档案文件尾。
   4?文件属性头结构:
union hblock {
   char dummy [512];    512字节文件属性头
   struct header {
     char name[100];   100字节以内文件名
     char mode [8];    八进制文件权限
     char uid[8];     八进制文件主人号
     char gid[8];     八进制文件组号
     char size[12];    八进制文件长度
     char mtime[12];   八进制文件修改时间
     char chksum[8];   八进制属性头校验和
     char 1inkf1ag;    文件连接状态
     char 1inkname[100]; 连接文件名
     char extno[4];    连续卷分卷号
     char extota1[4];   分卷个数
     char efsize[12];   八进制续分卷文件长度
     char compid;    文件压缩状态
    }dbuf;
   }dblock;
   文件属性头结构中字节校验和chksum是(头结构除chksum部分的字节和)加(八进制数400)加(文件压缩状态值)后转换为八进制得到的。文件压缩状态为‘1@#时表示文件内容处于压缩状态,在解包时,tar命令将自动调用compress把文件内容解压缩,而不改变文件名。
   笔者在分析一个含有长汉字文件名的tar档案文件时发现:长汉字文件名的属性头中chksum值是错误的。经分析发现造成这种错误的原因是:一个汉字的字节和是负整数,长汉字文件名的属性头的字节和有可能为负整数,tar命令源程序由于为西文而设计未能判断属性头字节和为负的情况。在创立档案文件时,tar命令用sprintf()函数转换属性头字节和为八进制输出到chksum,这时破坏了chksum正常格式。在打开档案文件时,tar命令用sscanf()函数从属性头按八进制格式化读取chksum时,不能得到正确数据,tar命令将中止展开档案文件。

三、 解决方法
   从上面分析我们得出以下结论:(1)要解决问题必须修改tar源程序,充分考虑汉化UNIX产生的tar档案包文件属性头中字节校验和为负的情况。(2)编写修补程序,将出错的tar档案文件属性头中字节校验和chksum修复。
   第一种方法需得到UNIX公司源程序级的技术支持或由UNIX公司技术人员解决,这也是笔者对UNIX公司的建议,我们只能期待。
   第二种方法笔者进行了有效的尝试,并用c编写了一个修补程序mtar.c,经编译成mtar运行程序,本程序具有以下功能:
   A?mtar -v tarfi1e 修补任何原因造成的tar档案包中文件的chksum错误(包括本程序的-c功能)。
   B?mtar -t tarfi1e 查考tar档案包中文件信息。
   C? mtar -c tarfi1e 加密tar档案包,使tar命令不能打开该包。
   D? mtar -p tarfi1e 将包中的所有文件置压缩状态标志。
   E? mtar -u tarfi1e 将包中所有文件置非压缩状态标志。

四、 实际应用
   本程序使用5个选项 -t -c -v -p -u,每次只能用一个参数,每个参数对应一个功能。
   例如:mtar -v abc 既可修复上面提到的abc包打不开问题。
   mtar -v /dev/fd0135ds18可修复tar格式3″软盘。
   mtar -c /dev/fd0135ds18可加密tar格式3″软盘。
   mtar -v /dev/fd0135ds18可解密tar格式3″软盘。
   mtar -t abc可详细列出abc包中文件信息,sum_v=0表示文件属性头校验正常,compress=[1]表示文件抽取时自动解压缩。
   本程序从编写至今笔者进行了十四次改版,使该程序适合含任何文件类型的tar档案包。并在SCO UNIX 3?2?4?2和SCO OPENSERVER 5?0下多次进行编译和全面功能测试。现将该程序整理出来,敬请同行多加指教。源程序附后。
   Mtar.c内容如下:
   #include″stdio.h″
   #include″string.h″
   #include″unistd.h″
   #include″sys/types.h″
   #include″sys/stat.h″
   #include″fcntl.h″

   #define TBLOCK 512
   #define NBLOCK 20
   #define NAMSIZ 100
    union hblock {
       char dummy[TBLOCK];
       struct header {
        char name[NAMSIZ];
        char mode[8];
        char uid[8];
        char gid[8];
        char size[12];
        char mtime[12];
        char chksum[8];
        char linkflag;
        char linkname[NAMSIZ];
        char extno[4];
        char extotal[4];
        char efsize[12];
        char compid;
      } dbuf,
    } dblock;
   main(argc,argv)
   int argc;
   char *argv[];
   {
     char compress;
     int i,seekip=0,ip,compc;
     long sum,sum_v,filesize=0,mvblock=0,total;
     FILE*fp;
   ip=0;
   if(strncmp(argv[1],″-c″,2)==0) ip=1;
   if(strncmp(argv[1],″-v″,2)==0) ip=1;
   if(strncmp(argv[1],″-t″,2)==0) ip=1;
   if(strncmp(argv[1],″-p″,2)==0) ip=1;
   if(strncmp(argv[1],″-u″,2)==0) ip=1;

   if(argc !=3||ip !=1)
     {
     printf(″Usage:mtar-[c,v,t,p,u]tarfile\n″);
     exit(1);
     }
   if((fp=fopen(argv[2],″r+″))==NULL)
     {
     printf(″Can not open the %s\n″,argv[2]);
     exit(1);
     }
   while(seekip==0)
   {
     if(fread((dblock.dummy),TBLOCK,1,fp)!=1)
      {
      printf(″Can not read the%s !\n″,argv[2]);
      break;
      }
   sum=0;
   compc=0;
   for(i=0;i< TBLOCK;i++) sum=sum+dblock.dumm
y[i];
   for(i=0;i< 8,i++)sum=sum-dblock.dbuf.chksum[i];
   if(sum==0)break;

   ip=0;
   if(strncmp(argv[1],″-c″,2)==0)
      compress=dblock.dbuf.compid;
      sum_v=270*0xff+0400; ip=1;
      }
   if(strncmp(argv[1],″-v″,2)==0)
      compress=dblock.dbuf.compid;
      sum_v=sum+0400; ip=1
      }
   if(strncmp(argv[1],″-p″,2)==0)
      compc=dblock.dbuf.compid;
      compc=0x31-compc;
      sum_v=sum+0400+compc;
      compress=0x31; ip=1;
      }
   if(strncmp(argv[1],″-u″,2)==0)
      compc=dblock.dbuf.compid;
      compc=0x00-compc;
      sum_v=sum+0400+compc;
      compress=0x00; ip=1;
   }
if(ip==1)
   {
   if(sum-v >=0)sprintf (dblock.dbuf.
chksum,″%60″,sum_v);
   else
   {
   dblock.dbuf.chksum[0]=′-′;
   dblock.dbuf.chksum[6]=0x00;
   dblock.dbuf.chksum[7]=0x00;
   sum_v=sum_v-dblock.dbuf.linkflag;
   sum=sum-dblock.dbuf.linkflag;
   dblock.dbuf.linkflag=0x00;
   for(i=0;i<NAMSIZ;i++){
      sum_v=sum_v-dblock.dbuf.linkname[i];
      sum=sum-dblock.dbuf.linkname[i];
      dblock.dbuf.linkname[i]=0x00;
      }
   sprintf(dblock.dbuf.chksum+1,″%-50″,-sum_v);
   }
   sprintf(&dblock.dbuf.compid,″%c″,compress);
   seekip=fseek(fp,-TBLOCK,SEEK_CUR);
   if(seekip==0)
     {
     if(fwrite((dblock.dummy),TBLOCK,1,fp)!=1)
       {
     printf(″Can not read the %s!\n″,argv[2]);
       break;
       }
     fflush(fp);
     }
   }
   sscanf(dblock.dbuf.size,″%12o″,&filesize);
   sscanf(dblock,dbuf.chksum,″%6o″,&sum_v);
   sum_v=sum_v-sum-0400-compc;
   if(filesize>0&&(dblock.dbuf.linkflag==0x00|| dbloc
k.dbuf.chksum[0]==0x33))
     {
     mvblock=(filesize-1)/TBLOCK+1;
    seekip=fseek(fp,(long)mvblock*TBLOCK,SEEK
_CUR);
     }
     seekip=fseek(fp,0L,SEEK_CUR);
   if(dblock.dbuf.linkflag==″1″)
    printf(″%s\n\t\tnormal linked to %s\t\tcompress=[%c]\tsum_v=%o\n″,
   dblock.dbuf.name,dblock.dbuf.linkname,dblock.dbuf.
compid,sum-v);
   else if (dblock.dbuf.linkflag==″2″)
   printf(″%s\n\t\tsymbolic linked to %s\tcompress=[%c]\tsum_v=%o\n,
   ″dblock.dbuf.name,dblock.dbuf.linkname,dblock.dbuf.
compid,sum_v);
   else
   printf(″%s\n\t %8d byte-->%6d tape_blocks\tcompress=[%c]\tsum_v=%o\n″,dblock.dbuf.name,filesize,mvblock,dblock.dbuf.cmpid,sum_v);

   }
   printf(″Total=%dK\n″,ftell(fp)/1024);
   fclose(fp);
   }

原文转自:http://www.ltesting.net