XML中二进制数据的处理方法

发表于:2007-07-01来源:作者:点击数: 标签:
在xml中,所有的数据都是以文本的形式来显示,但是二进制数据不能直接以文本格式来表示,那xml又是怎么处理二进制数据的呢?下面就来探讨一下。 为了简单和通用性,xml被设计成了以文本的格式来表示数据。在xml中,所有的数据都是以文本的格式来存储,二进制
在xml中,所有的数据都是以文本的形式来显示,但是二进制数据不能直接以文本格式来表示,那xml又是怎么处理二进制数据的呢?下面就来探讨一下。
为了简单和通用性,xml被设计成了以文本的格式来表示数据。在xml中,所有的数据都是以文本的格式来存储,二进制数据也不例外。在xml中,二进制数据也要被编码成文本的格式,发送到目的方。目的方接收到这个文本二进制数据以后,再以相同的解码程序解成相应的二进制数据,当然数据原来的格式,名称等辅助信息一定要当作相关信息一起发送。一般二进制数据编码成BASE64格式,它的优点是容易易于编码和解码,缺点是比纯的二进制多占用33%的存储空间。

下面是具体的程序实现:

<%@ page contentType="text/html; charset=gb2312" %>

<%@ page import="java.io.*" %>

<%

String ret=new String();

try{

InputStream in=new FileInputStream("c:\aaa.doc");

byte[] bytes=new byte[in.available()];

in.read(bytes);

ret=new sun.misc.BASE64Encoder().encode(bytes); //具体的编码方法

in.close();

}

catch(FileNotFoundException e) {

e.printStackTrace();

}

catch(java.io.IOException ex) {

ex.printStackTrace();

}

%>

ret就是最后的结果,编码以后就可以用标准的xml方式发送了。发送到目的方以后,还要对数据进行相应的解码,才能得到原来的二进制文件,解码的代码如下:

<%@ page contentType="text/html; charset=gb2312" %>

<%@ page import="java.io.*" %>

<%

byte[] bytes = new sun.misc.BASE64Decoder().decodeBuffer(ret);

java.io.ByteArrayInputStream inStream=new java.io.ByteArrayInputStream(bytes);

byte[] buffer =new byte[1444];

FileOutputStream fs=new FileOutputStream( "d:\aaa.doc");

int bytesum=0;

int byteread=0;

while ((byteread=inStream.read(buffer))!=-1) {

bytesum+=byteread;

fs.write(buffer,0,byteread);

}

%>

BASE64可以处理不太大的数据,如果要移动大量的数据,且要考虑空间/时间效率时,要采用其他的替代方法。



原文转自:http://www.ltesting.net