• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

UNIX中的文件切割

发布: 2007-6-08 22:43 | 作者: seanhe | 来源: | 查看: 41次 | 进入软件测试论坛讨论

领测软件测试网
[color=red:f163fa8829][size=18:f163fa8829]

作者:陈嘉洲


    前几日,为了将一台安装SCO UNIX 5.0.5主机上的TAR打包文件备份, 需要将其通
过网络传送到另外一台配有磁带机的UNIX主机上。两台主机通过TX530网卡相连,用FTP
传送的时候,前几个文件分别在10M、20M字节大小,都能够顺利传送。但其中有一个文
件压缩后体积已达98M之巨,传送了几次,要么只能传40M, 要么只能传20M左右就导致
网络崩溃,换画面PING对方主机,本应为零的速率延迟降为2400多毫秒,而且误码率极
高,只有重新启动两台主机才能恢复网络通讯。

    UNIX的SHELL功能强大,非WINDOWS可比,从上面使用的TAR、FTP已可管窥。同样,
UNIX已经提供了文件切割功能,不需要费力气去寻找第三方的文件切割程序。能完成
这个功能的UNIX命令就是DD。
    要切割的大文件为DGJD,共98336321字节,则:
    dd if=dgjd of=zz1 bs=1 count=20000000 
    dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000
    dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000
    dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000
    dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000

    其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后
的子文件名,BS是指明以多少字节作为一个切割记录单位,COUNT是要切割的单位记录数,
SKIP是说明切割时的起点,单位同样以BS设定值为准。通过上述五条指令就将DGJD大文件
切割成为4个2千万字节、1个18336321字节的子文件。要注意的是SKIP的值不能错。 由此
也不难看出,DD切割是“非损耗”式的切割,并且支持从任意位置开始的任意大小的切割。

    要将生成的ZZ1、ZZ2、ZZ3、ZZ4四个子文件组装为XDGJD,则:
    dd if=zz1 of=xdgjd bs=1 count=20000000
    dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000
    dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000
    dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000
    dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000

    其中SKIP参数改为SEEK参数,指明组装的新大文件XDGJD每次的开始位置是从文件头开
始多少字节。如果缺省,则组装从文件头开始,显然这不是我们每次都希望的, 所以需用
SEEK参数明确指出开始位置。通过以上5个指令,即可将5个子文件重新组装为一个大文件。
将切割后生成的子文件重新用FTP传送,结果有的能够顺利传送, 有的仍然导致网络瘫痪,
不怕,继续切割,切成每个一千万字节,再传,OK!成功传送!

    测试表明,每次传送的文件最好小于12M字节,否则可能导致网络故障。另外,DD这个
命令最初是为了进行编码转换而设计的,用于在大型机中将EBCDIC字符代码转换为ASCII代
码,但此功能已不常用,现在DD成了文件系统备份的工具,以及做一些类似文件切割的“另
类业务”,正所谓“有心栽花花不开,无心插柳柳成荫”,不过对于用户来说,重要的是软
件能否完成自己需要的功能,它的“本职工作”是什么并不重要,“不管白猫黑猫,捉住老
鼠就是好猫”!实用为本,软件的生命力就在于实用。
 
[/color:f163fa8829][/size:f163fa8829]

 Nestle 回复于:2003-02-20 09:18:41
不错,不过我用split命令,这个命令原本就是用来分割文件的。组合的时候按字母顺序拷到一块就可以了。

 luxr 回复于:2003-02-20 11:41:18
[quote:a742325a51="Nestle"]不错,不过我用split命令,这个命令原本就是用来分割文件的。组合的时候按字母顺序拷到一块就可以了。[/quote:a742325a51]

      请详细介绍split命令的用法

 hongliny 回复于:2003-02-20 11:49:12
对,应将split的用法写出来,向陈嘉洲兄一样,搞一个示例!

 muzx 回复于:2003-02-20 13:09:02
各有各的用处嘛!
split 计量单位是行(line),只能对行式文件进行操作;
而dd 的计量单位是字节(byte),可以方便的对二进制文件进行操作。

 陈君涛 回复于:2003-02-21 14:15:29
谢谢陈嘉洲兄的例子.

 bzzyg 回复于:2003-02-21 15:38:47
[quote:e28a0cf99a="luxr"]

      请详细介绍split命令的用法[/quote:e28a0cf99a]
介绍是可以,不过太多了.还是在你的unix机器上用man split看吧.

 午夜聆听 回复于:2003-02-21 16:22:46
收下

 zoukunhong 回复于:2003-03-12 17:15:11
可能陈嘉洲兄的网络配置有问题,我的网络并不是很快,但一二百M文件10分钟搞掂

 saintdragon 回复于:2003-03-13 10:35:05
不错,DD和SPLIT用的场合不同。DD其实比SPLIT要强大

 sd-feng 回复于:2003-03-13 14:14:31


 answer 回复于:2003-03-13 16:52:09
要试一下。

 快乐羔羊 回复于:2003-03-20 11:13:09
本人试了一下 split:

#split -l 100 inputfile outfile

 xiechq 回复于:2003-03-22 19:22:11
split也可以按容量来分割文件的。

 海德 回复于:2003-03-27 06:54:24
:lol:

 小跑 回复于:2003-03-29 22:27:40
弓虽!!

 maidx 回复于:2003-12-21 21:11:30
好像530tx有bug.

延伸阅读

文章来源于领测软件测试网 https://www.ltesting.net/


关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备2023014753号-2
技术支持和业务联系:info@testage.com.cn 电话:010-51297073

软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网