Java 字符编码问题

发表于:2007-07-01来源:作者:点击数: 标签:
1.关于文件编码 一般文件保存(文本文件),在保存的时候按系统默认语言编码(字符集)保存, 在中文系统上是GBK,英文系统上是ISO8859_1, 日文系统上是MS932. 在打开的时候同样是按当前系统默认语言(字符集)编码去解码,所以一些中文汉字在日文系统上会显示乱
1.关于文件编码
一般文件保存(文本文件),在保存的时候按系统默认语言编码(字符集)保存, 在中文系统上是GBK,英文系统上是ISO8859_1, 日文系统上是MS932. 在打开的时候同样是按当前系统默认语言(字符集)编码去解码,所以一些中文汉字在日文系统上会显示乱码的原因就是这个. 说白了也就是打开文件时候不同平台使用的字符集不同, 例如中文字符集包括 a,b,c, 日文字符集包括a,b,当在日文系统上解码汉字c的时候,就会出现所谓的乱码。

2. java工作处理编码模式
(1)java在运行期一律以unicode来存储字符,这样有利的支持了多语言环境.
(2)java在读取文件的时候默认是按照系统默认语言(字符集)编码来解码文件,读取和保存时候的编码不一致也导致程序中参数值错误,用FileInputStream类读取文件可以指定编码读取
(3)java在输出到系统界面时(windows)会把内存中变量字符再通过系统默认语言(字符集)编码去转换,所以在输出过程中也会碰到一系列的编码问题

3.解决方案
(1)swing/awt : 输出到系统界面解码时可以通过设置组件显示字体来替换系统字符集解码
例如:
public static void setFont(Font pFont){
UIManager.put("Button.font", pFont);
UIManager.put("ToggleButton.font", pFont);
UIManager.put("RadioButton.font", pFont);
UIManager.put("CheckBox.font", pFont);
UIManager.put("ColorChooser.font", pFont);
UIManager.put("ToggleButton.font", pFont);
UIManager.put("ComboBox.font", pFont);
UIManager.put("ComboBoxItem.font", pFont);
UIManager.put("InternalFrame.titleFont", pFont);
UIManager.put("Label.font", pFont);
UIManager.put("List.font", pFont);
UIManager.put("MenuBar.font", pFont);
UIManager.put("Menu.font", pFont);
UIManager.put("MenuItem.font", pFont);
UIManager.put("RadioButtonMenuItem.font", pFont);
UIManager.put("CheckBoxMenuItem.font", pFont);
UIManager.put("PopupMenu.font", pFont);
UIManager.put("OptionPane.font", pFont);
UIManager.put("Panel.font", pFont);
UIManager.put("ProgressBar.font", pFont);
UIManager.put("ScrollPane.font", pFont);
UIManager.put("Viewport", pFont);
UIManager.put("TabbedPane.font", pFont);
UIManager.put("TableHeader.font", pFont);
UIManager.put("Table.font", pFont);
UIManager.put("TextField.font", pFont);
UIManager.put("PasswordFiled.font", pFont);
UIManager.put("TextArea.font", pFont);
UIManager.put("TextPane.font", pFont);
UIManager.put("EditorPane.font", pFont);
UIManager.put("TitledBorder.font", pFont);
UIManager.put("ToolBar.font", pFont);
UIManager.put("ToolTip.font", pFont);
UIManager.put("Tree.font", pFont);
}
通过传递一个字体名称来控制软件输出的字符集,避免产生乱码

2. JSP : 可以通过设置charset来解决
例如:<%@ page contentType="text/html;charset=gb2312" %>

3. 数据库: java在数据库流中也会产生编码问题, 可以参照文件的方法,在接收流时以特定的字符集去解码
例如: 使用方法 InputStreamReader(InputStream in, Charset cs) 可以实现


原文转自:http://www.ltesting.net