ASP中的Server.URLEncode在VC中的实现
从我的VC组件中试图用ServerXMLHTTP对象向服务器端的ASP页面发送一个QueryString,它的值为联系人的名字,这是中文字符,如:“http://localhost/tester/test.asp?username=郑昀”。希望ASP页面接收到的仍然是正常的中文字符,而不会是乱码。
大家知道,ServerXMLHTTP对象在作HTTP操作之前,会先将URL转换为UTF8编码。而IIS接收时,会自动将这个UTF8编码的URL转换为Unicode编码,但是它有时会错误地丢掉奇数UTF8编码字符串的最后一个字节,所以得到就会是乱码。这个问题的描述可以参看《IIS是如何接收ServerXMLHTTP传过来的编码字符》。
这样,对于我们的情况,我们希望能够在用SXH对象之前将URL字符串Encode一下。这样的做法在ASP中是通过Server.URLEncode来做的。
下面我们就给出Visual C++中如何做到这一点的。(注意:这需要MFC。以后有空时,我们会给出STL实现的URLEncode)
inline BYTE toHex(const BYTE &x) { return x > 9 ? x + 55: x + 48; } CString URLEncode(CString sIn) { CString sOut; const int nLen = sIn.GetLength() + 1; register LPBYTE pOutTmp = NULL; LPBYTE pOutBuf = NULL; register LPBYTE pInTmp = NULL; LPBYTE pInBuf =(LPBYTE)sIn.GetBuffer(nLen); BYTE b = 0; //alloc out buffer pOutBuf = (LPBYTE)sOut.GetBuffer(nLen*3 - 2);//new BYTE [nLen * 3]; if(pOutBuf) { pInTmp = pInBuf; pOutTmp = pOutBuf; // do encoding while (*pInTmp) { if(isalnum(*pInTmp)) *pOutTmp++ = *pInTmp; else if(isspace(*pInTmp)) *pOutTmp++ = ´+´; else { *pOutTmp++ = ´%´; *pOutTmp++ = toHex(*pInTmp>>4); *pOutTmp++ = toHex(*pInTmp%16); } pInTmp++; } *pOutTmp = ´\0´; //sOut=pOutBuf; //delete [] pOutBuf; sOut.ReleaseBuffer(); } sIn.ReleaseBuffer(); return sOut; } |
CString strUnEncodeLinkTo("Globalhelp.xml?username=郑昀"); CString strLinkTo = URLEncode(strUnEncodeLinkTo); // strLinkTo的结果是: // "Globalhelp%2Exml%3Fusername%3D%D6%A3%EA%C0" |
这样,经URLEncode转换之后的URL,被IIS接收时,用QueryString(“username”)得到的就会是正确的中文字符了。
请再看一下,下面这种情况:
ASP的代码为:
1 Dim strURL
2 strURL = "郑昀"
3 strURL = Server.URLEncode(strURL)
4 strURL = "http://localhost/tester/Receiver.asp?name=" & strURL
5 xmlhttp.setOption(0) = 936
6 xmlhttp.Open "POST",strURL,false
7 xmlhttp.setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
8 xmlhttp.send
第三行代码把中文字符Encode了一下。所以strURL就变为了“%D6%A3%EA%C0”。
第五行代码的意思是,设置SXH对象的SXH_OPTION_URL_CODEPAGE的值为936,即GB2312。(而这个选项的缺省值为CP_UTF8,这就是为什么会将你的Unicode的URL字符串转换为UTF8的原因。)
现在我们把它设置为GB2312这种codepage。会出现什么结果呢?
接收的ASP页面上是这么做的:
1 Dim value
2 value = Request.QueryString("name")
这个value的值仍然会是“%D6%A3%EA%C0”,这就是设置codepage为GB2312的结果。
如果将上面代码的第五行注释掉,那么这里的value就会是“郑昀”。
所以说SXH.setOption是可以控制转换用的codepage的。