软件测试中获取负面测试用例的技术

发布: 2011-1-06 09:22 | 作者: 网络转载 | 来源: 领测软件测试网采编 | 查看: 105次 | 进入软件测试论坛讨论

软件测试中获取负面测试用例的技术

测试用例（Test Case）是为某个特殊目标而编制的一组测试输入、执行条件以及预期结果，以便测试某个程序路径或核实是否满足某个特定需求。

　　测试用例（Test Case）目前没有经典的定义。比较通常的说法是：指对一项特定的软件产品进行测试任务的描述，体现测试方案、方法、技术和策略。内容包括测试目标、测试环境、输入数据、测试步骤、预期结果、测试脚本等，并形成文档。

　　不同类别的软件，测试用例是不同的。不同于诸如系统、工具、控制、游戏软件，管理软件的用户需求更加不统一，变化更大、更快。笔者主要从事企业管理软件的测试。因此我们的做法是把测试数据和测试脚本从测试用例中划分出来。测试用例更趋于是针对软件产品的功能、业务规则和业务处理所设计的测试方案。对软件的每个特定功能或运行操作路径的测试构成了一个个测试用例。

　　随着中国软件业的日益壮大和逐步走向成熟，软件测试也在不断发展。从最初的由软件编程人员兼职测试到软件公司组建独立专职测试部门。测试工作也从简单测试演变为包括：编制测试计划、编写测试用例、准备测试数据、编写测试脚本、实施测试、测试评估等多项内容的正规测试。测试方式则由单纯手工测试发展为手工、自动兼之，并有向第三方专业测试公司发展的趋势。

　　要使最终用户对软件感到满意,最有力的举措就是对最终用户的期望加以明确阐述，以便对这些期望进行核实并确认其有效性。测试用例反映了要核实的需求。然而，核实这些需求可能通过不同的方式并由不同的测试员来实施。例如，执行软件以便验证它的功能和性能，这项操作可能由某个测试员采用自动测试技术来实现；计算机系统的关机步骤可通过手工测试和观察来完成；不过，市场占有率和销售数据（以及产品需求），只能通过评测产品和竞争销售数据来完成。

　　既然可能无法（或不必负责）核实所有的需求，那么是否能为测试挑选最适合或最关键的需求则关系到项目的成败。选中要核实的需求将是对成本、风险和对该需求进行核实的必要性这三者权衡考虑的结果。

　　确定测试用例之所以很重要，原因有以下几方面。

　　测试用例构成了设计和制定测试过程的基础。测试的“深度”与测试用例的数量成比例。由于每个测试用例反映不同的场景、条件或经由产品的事件流，因而，随着测试用例数量的增加，您对产品质量和测试流程也就越有信心。判断测试是否完全的一个主要评测方法是基于需求的覆盖，而这又是以确定、实施和/或执行的测试用例的数量为依据的。类似下面这样的说明：“95 % 的关键测试用例已得以执行和验证”，远比“我们已完成 95 % 的测试”更有意义。测试工作量与测试用例的数量成比例。根据全面且细化的测试用例，可以更准确地估计测试周期各连续阶段的时间安排。测试设计和开发的类型以及所需的资源主要都受控于测试用例。测试用例通常根据它们所关联关系的测试类型或测试需求来分类，而且将随类型和需求进行相应地改变。最佳方案是为每个测试需求至少编制两个测试用例：

　　·一个测试用例用于证明该需求已经满足，通常称作正面测试用例； ·另一个测试用例反映某个无法接受、反常或意外的条件或数据，用于论证只有在所需条件下才能够满足该需求，这个测试用例称作负面测试用例。

1.         负面测试的目的
负面测试在BS7925-1中的英国标准定义是采用Beizer的定义，其定义负面测试为“旨在说明软件不能工作的测试”（原文：Testing aimed at showing software does not work）。它可以带出一系列补充性的和竞争性的目的。
•发现导致重大失效、崩溃、破坏和安全漏洞的故障
•观察和度量系统对外界问题的响应
•揭露软件的弱点和开发的潜力
虽然有个一个公正的定义，但是它离被普遍接受还差的很远。负面测试是一个紧跟着被重新定义的术语，有时甚至是各小组的。一个常见的方法，其实践和英国标准定义不同的是它包括旨在使用专门对付失效的功能的测试。
• 输入验证，拒绝和重新请求的功能（人工输入和外界系统）
• 内部数据验证和拒绝
• 应付缺乏的，缓慢的或坏掉的外界资源
• 错误处理功能，例如消息，日志，监视功能
• 恢复功能，例如故障恢复，回滚和恢复

2.         获取测试用例的技术
负面测试不是一种测试设计技术，说是一种方法或分类更加合适。使用许多正式的测试设计技术来获取那些能够被划分为‘负面测试’的测试是很有可能。这一节详述了各种各样的知名技术的应用。
• 边界值分析和等价类划分Boundary Value Analysis and Equivalence Class Partitioning
• 状态转换测试State Transition testing
• 逆着已知的约束测试Test against known constraints
• 故障模式和结果分析Failure Mode and Effects analysis
• 并发Concurrency
• 用例和误用的用例Use cases and mis-use cases

2.1.   边界值分析和等价类划分
有两种基于输入和输出数据和系统行为期望的技术。
边界值分析（BVA：Boundary Value Analysis）利用关于预知系统行为转换位置的边界的需求和设计来检查那些能够带出一连贯范围数值的数据元素。
这个方法用于产生三个数值－一个就是边界本身，另外两个在前者的两边（尽可能的和数字相接近）。如果边界在有效和无效范围之间，使用无效数值的测试用例将成为一个负面测试用例。例如，使用66在只接受从18～65数值的年龄字段。
等价类划分（ECP：Equivalence Class Partitioning）着眼于边界之间的范围。给出的等价类中的每个成员应该在一个已知测试的环境里，使系统做同样的事情－这样测试员不必要测试在等价类中每一个数值。无效输入数据的范围可以被看成为负面测试－例如，一个年龄字段可能被期望用相同的方法拒绝所有的负数。
ECP一般被延伸到包括非连续数值的集合，胜于连续的数值范围。要注意一些输入可能看上去等价，但是实际上出现很多不同的行为。例如，一个简单web的表单的输入是为空或者太长时可能会被拒绝，但是控制字符的正确组合可能危害潜在web服务器的安全。

2.2.   状态转换测试
假设有一个状态转换图或者一个与其等价的理解，那么就很容易获得可以明确地检查不可到达的状态是否真的不可到达的测试用例。与这种方法相同的变种称为n-switch 测试，在一套已知的转换之后，那些不可到达的状态仍然是不可到达吗？图形工具，例如Compendium-TA [4]能够帮助你获得这样的测试。

2.3.   逆着已知的约束测试
大多数的系统有明确的和含蓄的限制和约束。如同需求一样对待这些约束（参加Robinson+Robinson, [5])）就可以得到各种负面测试。例如：
• “The site is designed to be viewed with Internet Explorer 4.5 or later” – 负面测试可以使用IE3.0或Netscape.
• “No more than five users will use the system at the same time” –负面测试可以尝试6个，然后8。
概括来说，测试包括度量和观察系统的行为胜于直接逆着期望结果测试。这只能在系统的操作参数之外工作时被使用，并且这种观察可能导致对系统的进一步了解。

2.4.   故障模式和结果分析
从对潜在的技术，实现和已知故障的分析来预见系统特有的故障是很有可能的。这种分析是观察在故障条件下系统行为的测试基础。捕获和文档化这种信息是非常重要的－特别是如果他们允许诊断数据和环境。对于那些监视他们系统并且拥有在系统被使用时（例如银行，电话公司）可以采取行动的技术专家的组织而言，这些文档通常是测试的必要输出。另一方面，对于更广泛的分布式软件包来说，这些信息也可以成为FAQ或故障诊断指南的一部分。
这些测试可能不可能在没有一个有效的测试工具或应用驱动下执行。这样的工具通常是自定制的，并且可能需要在代码的已提交版本里运行。
然而，象Canned HEAT和Holodeck (都出自the Florida Institute of Technology, [6])这样的工具允许将普通性故障引入到运行在Windows的软件中。
6.4.1. 故障家族
有很多来源可以帮助你开发故障模式的家族。既有故障的根本原因分析，系统设计文档，基础设施特有问题的知识能够帮助识别故障模式，并且因此为获取测试提供来源。
以下列表虽不详尽，但或许可以帮助引发更多的关于可能的故障想法。
• 外部资源：反应迟钝或缓慢的，莫明其妙或不恰当的反应。
• 协处理器故障：独特的间断处理器，多任务和递归
• 并发使用：资源锁定，请求已拒绝的锁定，死锁，锁定响应延迟
• 牺牲处理器Sacrificial processes：允许失败的处理器并且用可控方式恢复
• 文件系统：文件不能被找到，打开，读，写，权限变更，文件系统识别介质错误，介质移除，介质装满
• 网络：网络中断，网络忙碌/缓慢，传输段丢失、损坏、无序，处理器之间的对话被中断
• 内存：不足以给请求的分配，碎片
• 已达到的限制：排队，licences，线程，连接，数组大小，资源分配

2.5.   并发
测试对资源的并发使用可以是一个非常富有成效的找bug方法。初始分析包括鉴别也许会尝试同时使用的数据，数据库条目，文件、连接和超过一个处理器的硬件。通过允许测试者在系统之前利用资源，简单，定制的工具可能有些帮助, 并且在他们选择的时候发布它。测试也应该检查第二个请求者最终得到了资源。更加复杂的测试将着眼于二个以上的请求, 排队, 超时和死锁。

2.6.   用例和误用的用例
用例，在实践中趋向于处理系统的‘happy path’。各种错误输入的覆盖，拒绝的循环和部分转换通常是很稀少的。‘误用的用例’术语，虽然不是偏僻的标准，但是能够帮助明确地识别和区分他们。执行这些路径地用例可以通过图解期望结果正常范围外的用户的活动来帮助提高设计，并且允许一个正式的方法来测试选择和覆盖