测试时代 - 软件测试精品文章

　　　　　　　　　　　　　 软件产品的可用性的测试

　　　　　　　　　　　　　　　　　　　　来源:51CMM
　　关于可用性的测试和评估，在国外现在已经形成一个新的专业，称为可用性工程（Usability Engineering）。由于是一个专业，因此就有专门的人员来从事这项工作，并发
展出一整套的方法和技术来进行可用性的测试和评估。根据我们给软件可用性所下的定义，一个软件可用性的测试和评估应该遵循以下原则：

（1）最具有权威性的可用性测试和评估不应该是专业技术人员，而应该是产品的用户。因为无论这些专业技术人员的水平有多高，无论他们使用的方法和技术有多先进，最后起决定作
用还是用户对产品的满意程度。因此，对软件可用性的测试和评估，主要应由用户来完成。

（2）软件的可用性测试和评估是一个过程，这个过程早在产品的初样阶段就开始了。因此一个软件在设计时反复征求用户意见的过程应与可用性测试和评估过程结合起来进行。当然，
在设计阶段反复征求意见的过程是后来可用性测试的基础，不能取代真正的可用性测试。但是如果没有设计阶段反复征求意见的过程，仅靠用户最后对产品的一两次评估，是不能全面反映
出软件的可用性。

（3）软件的可用性测试必须是在用户的实际工作任务和操作环境下进行。可用性测试和评估不能靠发几张调查表，让用户填写完后，经过简单的统计分析就下结论。可用性测试必须是
用户在实际操作以后，根据其完成任务的结果，进行客观的分析和评估。

（4）要选择有广泛代表性的用户。因为对软件可用性的一条重要要求就是系统应该适合绝大多数人使用，并让绝大多数人都感到满意。因此参加测试的人必须具有代表性，应能代表最
广大的用户。

软件是高新技术，人们对软件的认识通常是从技术上来考虑，似乎技术越先进，水平越高，系统就越好。所谓人们的认识，不仅包括设计人员和管理人员，而且包括普通用户。因此
提出软件的可用性问题，不仅是设计人员思想上的一场革命，也是普通人认识上的一场革命。

在软件产品开发过程中，软件可用性的测试是必不可少的一环。可用性是从人的角度来看软件系统是否易用，高效，使人满意。做为一种特殊的IT产品，它的可用性显得格外重要：

考察软件系统的可用性一般来讲就是测试软件的可用性是否达到了用户的要求。目前的方法大致可以分为四类，用户模型法，用户调查法，专家评审法和用户测试法。

用户模型法是用数学模型来模拟人机交互的过程。这种方法把人机交互的过程看做是解决问题的过程。它认为人使用软件系统是有目的的。而一个大的目的可以被细分为许多不的目
的。这了完成每个小的目的，又有不同的动作和方法可供选择，每一个细小的过程都可以计算完成的时间。这个模型就可以用来预测用户完成任务的时间了。这个方法特别适合于无法进行
用户测试的情形。在人机交互领域中最著名的预测模型是GOMS（Goals,Operators,Methods,Selections）模型。

用户调查法包括问卷调查法和访谈法。这两种方法是社会科学研究，市场研究和人机交互学中沿用已久的技术，适用于快速评估，可用性测试和实地研究，以了解事实，行为，信仰和
看法。

访谈与普通对话的相似程度取决于待了解的问题和访谈和类型。访谈有4种主要类型：开放开（或非结构化）访谈，结构化访谈，半结构化采谈和集体访谈.具体就采用何种访谈技术
取决于评估目标，待解决的问题和选用的评估范型。例如，如果目标是大致了解用户对新设计构思（如交互设计）的反映，那么非正式的开放式访谈通常是最好的选择。但如果目标是搜集
关于特定特征（如新型WEB浏览器的布局）的反馈，那么，结构化的访谈调查通常更为适合，因为，它的目标和问题更为具体。

调查问卷是用于收集统计数据和用户意见的常用方法，它与访谈有些相似，也是用来了解用户的满意度和遇到的问题。问卷需要认真的设计。可以是开放式的问题，也可以是封闭的问
题，但必须措辞明确，避免可能的误导问题，保证所收集的数据有高的可信度。在学术论文中常见的可用性问卷包括：用户交互满意度问卷（questionnaire for user interaction
satisfaction,QUIS）,软件可用性测量目录(software usability measurement inventory,SUMI)计算机系统可用性问卷(computer system usability
questionnaire,CSUQ)。

专家评审法分为启发式评估和走查法。启发式评估是由Jakob Nielsen和他的同事们开发的非正式可用性检查技术，使用一套相对简单，通用，有启发性的可用性原则来进行可用性评
估。具体方法是，专家使用一组称为“启发式原则”的可用性规则做为指导，评定用户界面元素（如对话框，菜单，在线帮助等）是否符合这些原则。在进行启发式评估时，专家采取“角
色扮演”的方法，模拟典型用户使用产品的情形，从中找出潜在的问题。参与评估的专家数目可以不同。由于启发式评估不需要用户参与，也不需要特殊设备，所以它的成本相对较低，而
且较为快捷，因此也称为“经济评估法”。

走查法包括认知走查和协作走查，是从用户学习使用系统的角度来评估系统的可用性的。这种方法主要用来发现新用户使用系统时可能遇到的问题，尤其适用于没有任何用户培训和系
统。走查就是逐步检查使用系统执行的过程，从中找出可用性问题。走查的重点非常明确，适合于评估系统的一小部分。

用户测试法：可用性既然是评价软件质量的标准，而且是从用户的角度出发，评价起来当然少不了用户的参与，在所有的可用性评估法中，最有效的就是用户测试法了。该方法是在测
试中，让真正的用户使用软件系统，而测试人员在旁边观察，记录，测量。因此，用户测试法最能反映用户的要求和需要的。根据测试的地点不同，用户测试可分为实验室测试和现场测
试。实验室测试是在可用性实验室里进行的，而现场测试则是由可用性测试人员到用户的实际使用现场进行观察和测试。根据试验设计的方法不同，用户测试以可分为有控制条件的统计试
验和非正式的可用性观察测试。这两种试验方法在某些情况下也可以混合使用，所以经常被笼统的称为可用性试验。可用性的实验就是在产品实际应用的环境之外，就特定的环境、条件、
使用者进行测试，藉以记录系统的表现，更能对特定的因果关系进行验证，得到量化的数据。

用户测试常用的方法包括实验室的实验、焦点团体讨论(Focus Group Discussion)及发声思考(Thinking Aloud)。焦点团体讨论是一般市场营销研究常用的手段。邀请一群使用者，一
般五至八人一起就几个焦点问题进行讨论，由一位主持人掌控讨论的方向，围绕着预定的题目进行，让参与者都能畅所欲言并热烈讨论。不过若针对软件进行讨论，必须要考虑系统的规模
与使用的体验，对企业的软件来说，一次的讨论绝对不够，必须要进行一系列的讨论与评价。

　　发声思考法是心理学研究所用的研究方法，在国外被人机交互或可用性的研究者用来评估软件的使用。发声思考法要求受测者使用指定的系统，边用边说话，说出使用之时心中想的一
切，包括困难、问题、感觉等。这个方法能从每位受测者的评价过程中收集到相当大的信息，而所需邀请的受测者也不多，在国外的相关业界可说是标准的软件使用质量评价方法。

小结

以上介绍的可用性工程方法都是多年工业实践证明切实有效的。在各个方法的实际运用中，可以根据具体情况对方法执行上的某些细节灵活掌握。在特定的产品开发项目中，如何选
择所使用的可用性工程方法直接关系到可用性工程的运用效果。在这里一定要综合考虑开发过程当时所处的阶段、各种方法所能提供的信息以及它们所需要的技能、人员、时间、设备等方
面的资源，在此基础上，选择一组适合具体情况、能够互补和相互衔接的方法，使得以用户为中心的设计理念得到尽可能的充分体现。