数据存储文件设计的过程
作者:周玲 来源:希赛网
文件设计指数据存储文件设计,其主要工作就是根据使用要求、处理方式、存储的信息量、数据的活动性,以及所能提供的设备条件等,来确定文件类别,选择文件媒体,决定文件组织方法,设计文件记录格式,并估算文件的容量。
文件设计的过程主要分为两个阶段。第一个阶段是文件的逻辑设计,主要在概要设计阶段实施。它包括:
① 整理必须的数据元素。在软件设计中所使用的数据,有长期的,有短期的,还有临时的。它们都可以存放在文件中,在需要时对它们进行访问。因此首先必须整理应存储的数据元素,给它们一个易于理解的名字,指明其类型和位数,以及其内容涵义。
② 分析数据间的关系。分析在业务处理中哪些数据元素是同时使用的。把同时使用次数多的数据元素归纳成一个文件进行管理。分析数据元素的内容,研究数据元素与数据元素之间的逻辑关系,根据分析,弄清数据元素的含义及其属性。
③ 确定文件的逻辑设计。根据数据关联性分析,明确哪些数据元素应当归于一组进行管理,把应当归于一组的数据元素进行统一布局,产生文件的逻辑设计。
第二个阶段是文件的物理设计,主要在软件的详细设计阶段实施。主要工作有:
④ 理解文件的特性。针对文件的逻辑规格说明,进一步研究从业务处理的观点来看所要求的一些特性,包括文件的使用率、追加率和删除率,以及保护和保密等。
⑤ 确定文件的存储媒体。选择文件的存储媒体,应当考虑以下一些因素。
·数据量:根据处理数据量,估算需要媒体的数量。数据量大的文件可选用磁带、磁盘或光盘做为存储媒体,数据量小的文件可采用软盘做为存储媒体。
·处理方式:处理方式有联机处理和批处理。对于联机处理, 多选用直接存取设备,如磁盘等;对于批处理,选用任何一种存储媒体都可以。
·存取时间和处理时间:批处理对于时间没有严格的要求, 因此对存储媒体也没有特殊的要求。实时处理最好选用直接存取媒体,如磁盘等,以满足响应时间的要求。
·数据结构:根据文件的数据结构,选用能实现其结构的合适媒体及相应的存取方法。例如,顺序文件可选用磁带或光盘,而索引文件和散列文件则必须选用磁盘。
·操作要求:对于数据量大,执行时较少要求用户干预的文件,应当选用磁带媒体;而对于频繁交互的文件,应当选用磁盘媒体。
·费用要求:在满足上述要求的基础上,应当尽量选用价格低的媒体。
⑥ 确定文件的组织方式。根据文件的特性,来确定文件的组织方式。常用的文件组织方式有:顺序文件(按记录的加入先后次序排列、按记录关键码的升序或降序排列、按记录的使用频率排列);直接存取文件(无关键码直接存取文件、带关键码直接存取文件、桶式直接存取文件);索引顺序文件(B+树);分区文件;虚拟存储文件;倒排文件等。
⑦ 确定文件的记录格式。确定了文件的组织方式之后,需要进一步确定文件记录中各数据项以及它们在记录中的物理安排。考虑设计记录的布局时,应当注意以下几点:
·记录的长度:设计记录的长度要确保能满足需要,还要考虑使用设备的制约和效率,尽可能与读写单位匹配,并尽可能减少处理过程中内外存的交换次数。
·数据项的顺序:对于可变长记录,应在记录的开头记入长度信息;对于关键码,应尽量按级别高低,顺序配置;联系较密切的数据项,应归纳在一起进行配置。
·数据项的属性:属性相同的数据项,应尽量归纳在一起配置;数据项应按双字长,全字长,半字长和字节的属性,顺序配置。
·预留空间:考虑到将来可能的变更或扩充,应当预先留下一些空闲空间。
·子数据项:可把一个数据项分成几个子数据项,每一个子数据项也可以做为单独的项来使用。
⑧ 估算存取时间和存储容量(不要求)