自己动手丰衣足食-搞定网页乱码

发表于:2007-07-01来源:作者:点击数: 标签:
朋友发过来的信件,全都是 Hi, Sorry for writing back late. #25968;#25454;#20002;#20102;#23601;#20002;#20102;#21543;#65292;#20197;#21518;#23567;#24515;#28857;#23601;#261 59;#20102;#65292;#20320;#24212;#35813;#25226;#37027;#20123;#37325;#3520

朋友发过来的信件,全都是

Hi, Sorry for writing back late.
数据丢了就丢了吧,以后小心点就&#261

59;了,你应该把那些重要的东东刻下

这个样子,怎么办?让他重写,估计谁也没有这个耐心,只好自己捉摸一下了。

判定问题:看这段文本可以猜出每个&#xxxxx;都是一个字符的某种编码,在google上搜了一把,果然发现这些都是unicode码。

分析问题:unicode无非就是2个字节存储一个字符,所以只要将这些unicode码当作16位数存在一个宽字符缓存中,显示就行了。
          还要考虑windows一般显示字符都要转换成mutibyte方式,所以还要用个api函数:WideCharToMultiByte。
         
实现:    code + debug --> ok! 朋友的长信被“解密”了。

现在和大家分享快乐(没有优化,不好意思了):

#define _UNICODE  // IMPORTANT!!

// convert from one wide char to mutibyte char[]
char* Convert( wchar_t wc, char* lpDest )
{
        // construct wchar string
 wchar_t strScr[2];
 strScr[0] = wc;
 strScr[1] = L´\0´;

 // lpDest must a char string with 3 byte, and lpDest[2] == ´\0´
 assert( 0 == lpDest[2] );

 int iRet = WideCharToMultiByte(
  CP_ACP, // codepage
  0, // dwFlags
  strScr, // lpWideCharStr
  -1, // clearcase/" target="_blank" >cchWideChar
  lpDest, // lpMutiByteStr
  3, // cchMutiByte
  NULL, // lpDefaultChar
  NULL  // lpUsedDefaultChar
    );

 int iError = GetLastError();
 switch(iError)
 {
 case ERROR_INSUFFICIENT_BUFFER:
  break;
 case ERROR_INVALID_FLAGS:
  break;
 case ERROR_INVALID_PARAMETER:
  break;
 default:
  return lpDest;
 }
 return NULL;
}

// from unicode string to normal string
CString ParseConvert( CString& szSrc )
{
 CString szDest = "";

 int cLength = szSrc.GetLength();
 char cDestChar[] = "??";
 for( int i=0 ; i < cLength; i ++ )
 {
  if( szSrc[i] == ´&´ && szSrc[i+1] == ´#´ )  // a unicode char start
  {
   int iCount = 0;
   char szWC[10] ;
   memset( szWC, 0, 10 );
   i += 2;
   while( szSrc[i] != ´;´ )
   {
    szWC[iCount] = szSrc[i];
    iCount++;
    i++;
   }
   int wc = 0;
   sscanf( szWC, "%d", &wc );
   szDest += Convert( wc, cDestChar );
  }
  else
  {
   szDest += szSrc[i];
  }
 }
 return szDest;
}

void CDecodeDlg::OnButton1()
{
 CFileDialog dlg(TRUE);
 CString szFileName;
 if( dlg.DoModal() == IDOK )
 {
  szFileName = dlg.GetPathName();
 }
 else
  return;

 CStdioFile file;
 file.Open( szFileName, CFile::modeRead | CFile::typeText );

 CString szBuf, szLine;

 while( file.ReadString( szLine ) )
 {
  szBuf += szLine;
  szBuf += "\n";
 }
 file.Close();

        // try it
 MessageBox( ParseConvert( szBuf ) );

}

mailto:


原文转自:http://www.ltesting.net