JS(Unicode->GB)的精简版(仍含拼音和UrlEncode)

发表于:2007-07-01来源:作者:点击数: 标签:
用的Unicode和GB的转换库如下地址 148k的js,本地 测试 没有问题,但搁到网上就会觉得有点慢了 所以需要一个精简版,采录的只是GB2312编码,即部分GBK,但够用即可 这次特别精简了代码,但功能不变,区别只是该版只能作用于常见汉字。 什么马配什么鞍,也修改


用的Unicode和GB的转换库如下地址

148k的js,本地测试没有问题,但搁到网上就会觉得有点慢了

所以需要一个精简版,采录的只是GB2312编码,即部分GBK,但够用即可
这次特别精简了代码,但功能不变,区别只是该版只能作用于常见汉字。
什么马配什么鞍,也修改了UrlEncode和getSpell的算法,请大家不要混淆。
这次qswhGB2312.js只有18k,可在网上随意使用

Unicode和GB的转换库和UrlEncode和getSpell函数,请下载

主要代码如下
var strGB="啊阿...鼾齄";//GB2312的字符串,略
var qswhSpell=["a",0,..,"zuo",3747];//拼音的对照表,略
function UrlEncode(str){
 var i,c,p,q,ret="",strSpecial="!\"#$%&´()*+,/:;<=>?@[\]^`{|}~%";
 for(i=0;i<str.length;i++){
  if(str.charCodeAt(i)>=0x4e00){
   var p=strGB.indexOf(str.charAt(i));
   if(p>=0){
    q=p%94;
    p=(p-q)/94;
    ret+=("%"+(0xB0+p).toString(16)+"%"+(0xA1+q).toString(16)).toUpperCase();
   }
  }
  else{
   c=str.charAt(i);
   if(c==" ")
    ret+="+";
   else if(strSpecial.indexOf(c)!=-1)
    ret+="%"+str.charCodeAt(i).toString(16);
   else
    ret+=c;
  }
 }
 return ret;
}

function getSpell(str,sp){
 var i,c,t,p,ret="";
 if(sp==null)sp="";
 for(i=0;i<str.length;i++){
  if(str.charCodeAt(i)>=0x4e00){
   p=strGB.indexOf(str.charAt(i));
   if(p>-1&&p<3755){
    for(t=qswhSpell.length-1;t>0;t=t-2)if(qswhSpell[t]<=p)break;
    if(t>0)ret+=qswhSpell[t-1]+sp;
   }
  }
 }
 return ret.substr(0,ret.length-sp.length);
}

sp是分隔符,范例如下
<script src=qswhGB2312.js></script>

<script language=javascript>
document.write(UrlEncode("中文 <>\"#%{}|^~[]`&?+Abc"),"<br>")
document.write(getSpell("中国程序员大本营"),"<br>")
document.write(getSpell("秋水无恨","´"),"<br>")
</script>

ps.该文章现仅限在csdn文档中心,如要转载,请和作者联系,否则后果自负。


原文转自:http://www.ltesting.net