测试中的随机性(3)

发表于:2014-08-25来源:uml.org.cn作者:Dr. James McCaffrey点击数: 标签:软件测试
而方差 2 由下式算出: 2 = ((2*n1*n2) * (2*n1*n2 - n1 - n2)) / ((n1 + n2)2 * (n1 + n2 - 1)) 这两个公式均根据概率论得出。我们可以用平均值和方差来确定某个特定模式

  而方差 α2 由下式算出:

α2 = ((2*n1*n2) * (2*n1*n2 - n1 - n2)) / ((n1 + n2)2 * (n1 + n2 - 1))

  这两个公式均根据概率论得出。我们可以用平均值和方差来确定某个特定模式是随机过程结果的概率。假设我们以两个符号的模式开始,该模式表示为以下字符串:

string s = "XOOOXXXXOXXXXXXXOOOOXXXXXXXXXX";

  尽管可以手动计算该模式中 X 和 O 的数量以及游程数,但让我的程序代劳会更轻松。首先,我将确定该模式字符串中的两个符号类型:

char kind1 = s[0], kind2 = s[0];
for (int i = 0; i < s.Length && kind1 == kind2; ++i)
{
if (s[i] != kind1) kind2 = s[i];
}

  我将模式字符串中的第一个字符指定给第一种符号,接着扫描整个模式字符串,直到找到第二种符号类型。接下来,将执行两项简单的错误检查,以确保该模式中至少存在两种不同字符并且存在的字符类型不超过两种。

if (kind2 == kind1)
throw new Exception("字符串必须具有两种不同的类型");

for (int i = 0; i < s.Length; ++i)
if (s[i] != kind1 && s[1] != kind2)
throw new Exception("字符串只能具有两种类型");

  如果要考虑性能,则可将这三次对模式字符串的遍历重新转换为仅仅一次遍历,但清晰性可能会受到一些影响。

  现在,我就可以开始计算模式中每种类型符号的数量以及游程数了:

int n1 = 0, n2 = 0, runs = 1;
for (int i = 0; i < s.Length-1; ++i)
{
if (s[i] == kind1) ++n1;
else if (s[i] == kind2) ++n2;
if (s[i+1] != s[i]) ++runs;
}
if (s[s.Length-1] == kind1) ++n1;
else if (s[s.Length-1] == kind2) ++n2;

  我从第一个字符开始扫描该模式,一直持续到倒数第二个字符。如果当前字符与我先前确定的符号类型匹配,则我将递增相应的计数器。为计算模式中的游程数,我利用了游程取决于符号类型的变化的这样一个事实。如果当前字符与下一个字符不同,则我就知道又出现一个游程,然后我将相应递增游程计数器。由于我在模式字符串中的倒数第二个字符处停止,因此最后我要检查最后一个字符。我还会从 1(而不是 0)开始累计游程计数器,因为根据定义,所有模式都至少具备一个游程。

  Wald-Wolfowitz 检验方法仅在所分析模式中每种类型符号的数量为 8 或大于 8 时才有效,因此我将执行以下检查:

if (n1 < 8 || n2 < 8)
throw new Exception("n1 和 n2 必须均大于等于 8," +
"本次测试才有意义");

  分析过程进行到这时,我已算出模式中两种符号类型中每一种的数量以及实际游程数。现在,如果两个符号类型是随机生成,则我将计算模式中的预期游程数:

double expectedRuns = 1 + ((2.0*n1*n2) / (n1 + n2));

  然后我将计算游程数的方差(如果随机生成),如下所示:

double varianceNumerator = (2.0*n1*n2) * (2.0*n1*n2 - N);
double varianceDenominator = (double)((N*N)*(N-1));
double variance = varianceNumerator / varianceDenominator;

  分析中的下一步是计算标准化检验统计量 z:

double z = (R - expectedRuns) / Math.Sqrt(variance);

  z 统计量等于模式中的实际游程数减去模式中的预期游程数,然后再除以预期游程数的标准偏差(即方差的平方根)后所得到的值。解译模式中的标准化游程数要比解译实际游程数容易。解译代码很简单,但在概念上稍微有些隐晦。它的开头如下所示:

原文转自:http://www.uml.org.cn/Test/200611225.htm