UNIX中的文件切割

发表于:2007-07-01来源:作者:点击数: 标签:
UNIX中的文件切割 前几日,为了将一台安装SCO UNIX 5.0.5主机上的TAR打包文件备份, 需要将其通过 网络 传送到另外一台配有磁带机的UNIX主机上。两台主机通过TX530网卡相连,用FTP传送的时候,前几个文件分别在10M、20M字节大小,都能够顺利传送。但其中有一
UNIX中的文件切割

前几日,为了将一台安装SCO UNIX 5.0.5主机上的TAR打包文件备份, 需要将其通过网络传送到另外一台配有磁带机的UNIX主机上。两台主机通过TX530网卡相连,用FTP传送的时候,前几个文件分别在10M、20M字节大小,都能够顺利传送。但其中有一个文件压缩后体积已达98M之巨,传送了几次,要么只能传40M, 要么只能传20M左右就导致网络崩溃,换画面PING对方主机,本应为零的速率延迟降为2400多毫秒,而且误码率极高,只有重新启动两台主机才能恢复网络通讯。

UNIX的SHELL功能强大,非WINDOWS可比,从上面使用的TAR、FTP已可管窥。同样,UNIX已经提供了文件切割功能,不需要费力气去寻找第三方的文件切割程序。能完成这个功能的UNIX命令就是DD。

要切割的大文件为DGJD,共98336321字节,则:

dd if=dgjd of=zz1 bs=1 count=20000000
dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000
dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000
dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000
dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000

其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后的子文件名,BS是指明以多少字节作为一个切割记录单位,COUNT是要切割的单位记录数,SKIP是说明切割时的起点,单位同样以BS设定值为准。通过上述五条指令就将DGJD大文件切割成为4个2千万字节、1个18336321字节的子文件。要注意的是SKIP的值不能错。 由此也不难看出,DD切割是“非损耗”式的切割,并且支持从任意位置开始的任意大小的切割。

要将生成的ZZ1、ZZ2、ZZ3、ZZ4四个子文件组装为XDGJD,则:

dd if=zz1 of=xdgjd bs=1 count=20000000
dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000
dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000
dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000
dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000

其中SKIP参数改为SEEK参数,指明组装的新大文件XDGJD每次的开始位置是从文件头开始多少字节。如果缺省,则组装从文件头开始,显然这不是我们每次都希望的, 所以需用SEEK参数明确指出开始位置。通过以上5个指令,即可将5个子文件重新组装为一个大文件。

将切割后生成的子文件重新用FTP传送,结果有的能够顺利传送, 有的仍然导致网络瘫痪,不怕,继续切割,切成每个一千万字节,再传,OK!成功传送!

测试表明,每次传送的文件最好小于12M字节,否则可能导致网络故障。另外,DD这个命令最初是为了进行编码转换而设计的,用于在大型机中将EBCDIC字符代码转换为ASCII代码,但此功能已不常用,现在DD成了文件系统备份的工具,以及做一些类似文件切割的“另类业务”,正所谓“有心栽花花不开,无心插柳柳成荫”,不过对于用户来说,重要的是软件能否完成自己需要的功能,它的“本职工作”是什么并不重要,“不管白猫黑猫,捉住老鼠就是好猫”!实用为本,软件的生命力就在于实用。

原文转自:http://www.ltesting.net