• 软件测试技术
  • 软件测试博客
  • 软件测试视频
  • 开源软件测试技术
  • 软件测试论坛
  • 软件测试沙龙
  • 软件测试资料下载
  • 软件测试杂志
  • 软件测试人才招聘
    暂时没有公告

字号: | 推荐给好友 上一篇 | 下一篇

IIS如何接收ServerXMLHTTP传过来的编码字符?

发布: 2007-7-01 20:40 | 作者: admin | 来源: | 查看: 15次 | 进入软件测试论坛讨论

领测软件测试网

IIS如何接收ServerXMLHTTP传过来的编码字符?

一. 事情的起因:

从我的组件中企图向服务器端的ASP页面发送一个QueryString,它的值为邮件的URL。希望ASP页面接收之后,直接将该字符串交给Exchange的OWA。

由于OWA只认UTF8编码的URL字符串,所以我们希望组件里用MSXML2::ServerXMLHTTP将这个邮件URL的UTF8编码字符串发送至服务器的ASP页面。然后ASP页面接收之后,也就不用转码,直接交给OWA即可。

但是这么做,在ASP页面中一开始拿到的字符串就是乱码,原来的“收件箱”的UTF8码是“%E6%94%B6%E4%BB%B6%E7%AE%B1”,IIS接收时却是“鏀朵欢绠”!

于是在组件中直接发送汉字的“收件箱”,但是IIS接收时依然是“鏀朵欢绠”!

二. 测试的代码:

(1). 客户端用SXH对象POST操作提交一个Form请求的页面:

<%@ Language=vbScript%>

<%

       DataToSend = "%E6%94%B6%E4%BB%B6%E7%AE%B1"   ´ 收件箱的UTF8编码

DataToSend = "id=" & DataToSend

      

       Dim xmlhttp

       Set xmlhttp = Server.CreateObject("MSXML2.ServerXMLHTTP")

      

‘ 这相当于提交一个Form,具体可参见微软文档:

‘  HOWTO Submit Form Data by Using XMLHTTP or ServerXMLHTTP Object (Q290591)

       xmlhttp.Open "POST","http://localhost/tester/Receiver.asp",false

       xmlhttp.setRequestHeader "Content-Type", "application/x-www-form-urlencoded"

       xmlhttp.send DataToSend

      

       Response.ContentType = "text/xml"

       Response.Write xmlhttp.responseXMl.xml

    Set xmlhttp = nothing

%>

(2). 服务器端用Request.Form来接收提交的值的页面:

<%

       Dim objTrace

       set objTrace = Server.CreateObject("pipetrace.tracer")

       objTrace.trace "Start OK"

 

       value = Request.Form("id")

       Response.ContentType = "text/xml"

      

       objTrace.trace CStr("IIS接收:  ") & CStr(Value)

       value = server.URLEncode(value)

       objTrace.trace Cstr("把IIS的Unicode码==>UTF8后的结果: ") & CStr(Value)

      

       response.write "<?xml version=""1.0"" encoding= ""utf-8""?><ReturnValue>" & value & "</ReturnValue>"

   

       objTrace.trace "End OK!"     

%>

 

三. 测试结果:

网络探测器跟踪表明,如果SXH对象传递中文字符,一定会被它事先转为UTF8编码的字符串,然后再发给对方服务器。这个是差不多可以确定的。

关键是,IIS接到这个UTF8编码后,是如何处理的?

我们作了以下试验:

测试

序号

     Client

Server

客户端提交的Form的字符串

ASP页面通过Request.Form(“id”)得到的字符串

Server.URLEncode(value)转码之后的结果

1

%E6%94%B6%E4%BB%B6%E7%AE%B1

 

(收件箱的UTF8编码)

鏀朵欢绠

%E6%94%B6%E4%BB%B6%E7%AE

(缺少了最后的”%B1”)

2

收件箱

鏀朵欢绠

%E6%94%B6%E4%BB%B6%E7%AE

(缺少了最后的”%B1”)

3

%E8%8D%89%E7%A8%BF

 

(草稿的UTF8编码)

鑽夌ǹ

%E8%8D%89%E7%A8%BF

 

(这回是正确的编码了)

4

%CA%D5%BC%FE%CF%E4

 

(收件箱的Unicode编码)

收件箱

%CA%D5%BC%FE%CF%E4

 

(还是正确的Unicode编码)

5

%E5%B7%B2%E5%88%A0%E9%99%A4%E9%82%AE%E4%BB%B6

 

(已删除邮件的UTF8编码)

宸插垹闄ら偖浠

%E5%B7%B2%E5%88%A0%E9%99%A4%E9%82%AE%E4%BB

 

(缺少了最后的”%B6”)

6

%25E6%2594%25B6%25E4%25BB

%25B6%25E7%25AE%25B1

 

(就是将收件箱的UTF8编码再用

Server.URLEncode()转一遍码)

%E6%94%B6%E4%BB%B6%E7%AE%B1

 

(这就是正确的收件箱的UTF8编码,直接扔给OWA即可)

%25E6%2594%25B6%25E4%25BB%25B6%25E7%25AE%25B1

四. 你认为这说明了什么:

对于试验1和2,IIS接收之前是UTF8编码,但是注意是奇数个字符!

UTF8编码实际上是真实内存中字符串存放的数据的明码,%号相当于只是一个分割符,E是高8位,6是低8位(?)。

IIS接收之后,就会将其转换为Unicode编码,但不是明码,所以%号不见了,由于这时的UTF8编码是奇数个字符,IIS就错误地将其最后一个字符“%B1”截去。

如果拿这个”鏀朵欢绠”放在XML中,让IE解释的话,就会显示为“收件?”。这说明”鏀朵欢绠”确实是正确的Unicode字符串,只是”箱”汉字少了一个字符。

 

对于试验3,”草稿”的UTF8编码是偶数个字符,所以IIS就能够正确地转码,这个“鑽夌ǹ”实际上就是”草稿”的Unicode编码格式。

 

对于试验4,你传给IIS的已经是Unicode编码了,所以它会自动将其再转换为Ansi编码,这样就是正常的”收件箱”了。

 

对于试验6,将中文字符的UTF8编码再进行一次UTF8转码!将这个结果传给IIS,IIS接到之后,可能只是将%25简单地转义为%号,然后就不管了。于是这就是正确的UTF8编码了。


延伸阅读

文章来源于领测软件测试网 https://www.ltesting.net/


关于领测软件测试网 | 领测软件测试网合作伙伴 | 广告服务 | 投稿指南 | 联系我们 | 网站地图 | 友情链接
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备10010545号-5
技术支持和业务联系:info@testage.com.cn 电话:010-51297073

软件测试 | 领测国际ISTQBISTQB官网TMMiTMMi认证国际软件测试工程师认证领测软件测试网