第一章 Windows9x系统下汉字输入法的基本原理
Windows系统下汉字输入法实际上是将输入的标准ascii字符串按照一定的编码规则转换为汉字或汉字串,进入到目的地。由于应用程序各不相同,用户不可能自己去设计转换程序,因此,汉字输入自然而然落到WINDOWS系统管理中。
一、输入法与系统的关系
键盘事件 应用程序
| |
Windows的USER.EXE
|
输入法管理器
|
输入法
系统的键盘事件有windows的user.exe软件接收后,user.exe在将键盘事件传导输入法管理器(Input Method Manager,简称IMM)中,管理器 再将键盘事件传到输入法中,输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe中,user.exe再将翻译后的键盘事件传给当前正运行的应用程序,从而完成汉字的输入。
二、汉字输入法的组成
微软Windows9x系统中汉字输入法的名称是"Input Method Editor" ,简称IME,输入法的程序名称为:*.ime,数据文件名称为*.MB,即通常说的输入法编码表(字典).
实际上IME文件是一个动态连接库程序(DLL),它与dll文件没有区别,只是名称不同而已。
一般汉字输入法都由三个窗口组成:
状态窗口(Status Windows)-显示当前的输入法状态(中文还是英文等站环信息);
编码输入窗口(Composition Windows)-显示当前击键情况;
汉字选择窗口(Candidates Windows)-列出当前编码的全部汉字(串),供用户选择或查询。
上述三个窗口由基本的用户接口(User Interface )函数管理着。
现在我们用Dumpbin.exe打开微软提供的拼音输入法(WINDOWS\SYSTEM\WINPY.IME)看看它有什么组成(这里一WINDOWS98为例,并假定windows系统安装在c:盘下):
C:\Dumpbin c:\windows\system\winpy.ime
Microsoft (R) COFF Binary File Dumper Version 6.00.8168
Copyright (C) Microsoft Corp 1992-1998. All rights reserved.
Dump of file WINPY.IME
File Type: DLL //IME 实际为dll程序
Section contains the following exports for WINPY.ime
0 characteristics
34A37323 time date stamp Fri Dec 26 17:04:35 1997
0.00 version
1 ordinal base
19 number of functions //共有19个函数
19 number of names // 对应19个名称
ordinal hint RVA name
1 0 0000A010 CandWndProc //"选择汉字窗口"注册函数
2 1 0000E750 CompWndProc //"输入编码窗口"注册函数
3 2 0000FB50 ImeConfigure //配置当前ime参数函数
4 3 0000FEC0 ImeConversionList//将字符或字符串转换成目标字符
5 4 0000FFA0 ImeDestroy //退出当前使用的IME
6 5 000030D0 ImeEnumRegisterWord
7 6 0000FFB0 ImeEscape //应用软件访问输入法的接口函数.
8 7 00003080 ImeGetRegisterWordStyle
9 8 0000E9A0 ImeInquire //启动并初始化当前IME输入法
10 9 0000A800 ImeProcessKey //IME输入键盘事件管理函数
11 A 00002C20 ImeRegisterWord //向输入法字典注册字符串
12 B 000109A0 ImeSelect //启动当前IME输入法
13 C 000109E0 ImeSetActiveContext //设置当前的输入处于活动状态.
14 D 0000C850 ImeSetCompositionString 由应用程序设置输入法编码
15 E 0000AEE0 ImeToAsciiEx //将输入的键盘事件转换为汉字编码事件
16 F 00002F40 ImeUnregisterWord //删除被注册的字符串.
17 10 0000CA90 NotifyIME //IME事件管理函数
18 11 00005160 StatusWndProc //状态窗口注册函数
19 12 00002350 UIWndProc //用户界面接口函数