软件本地化测试的技术问题之字符集问题本地化软件测试
首先要讨论的问题就是不同字符集的使用。西方语言,如英语、法语和德语,使用不到256个字符,所以它们可以用单字节编码表示。【U是亚洲语言,比如中文和日文,却有几万个字符,所以需要职字节编码。因此在做本地化测试的时候,应该检查开发人员是否使用了正确的字符编码。
不同的操作系统采用不同的方法输八和输出字节,这些不同的方法使字符的编码规范化从而代表不同的语言,这样我们就很容易看出在特定的编码中哪些宁符是被支持的,哪些字符是不被支持的。比如,英文字符几乎被所有的编码作为子集而提供支持,但是某些重音字符(如∈,e)和所有其他的扩展符弓却不一定被支持。字符集是操作系统r”所使用的字符映射表,例如,某些uNIx系统使用只包含128字符的7位AscII字符集(包括Tab、空格、标点、符号、大小写字母、数字和回车键等)。然而对于很多语言来说,7位AscII字符集远远不够。因为它不包含特殊字符(比如6、a或a)。所以一个新的标准8位AscII诞生了,它包含256个字符。微软的wind使用的就是8位AscII字符集,对于uNIx计算机,还有一个IsO标准(Is08859.x),微软和IsO标准极为相似。但是即使拥有256个字符,8位AscII还是无法满足所有语言的需求。汉语、U语和韩语这些语言的字符都很多,仍无法适用扩展后的AscII字符集,对于
这些语言,可以使用16位字符集(双字节、多字节或变数字节),这就是后来产生的统一的字符编码标准unicode,采用取字节对字符进行编码,几乎包含了所有语言的每个字符。目前,很多操作系统都支持unicode,如windowsNT4 0、windows 2000、windowsxP和uNⅨ系列。
文章来源于领测软件测试网 https://www.ltesting.net/