如何通过时钟精度提高代码性能测试?_性能测试

如何通过时钟精度提高代码性能测试?

发表于：2009-03-27来源：作者：点击数：标签：代码性能测试时钟精度

要想真正有效地测试、优化程序性能——特别是为 Windows 服务器开发的多线程程序，操作系统提供的标准时钟是不够的，必须使用解析度更高的时钟。本文介绍了如何访问处理器的十亿分之一秒级别的时钟，极大地提高代码性能测试的速度和精度。一、获取计时数

要想真正有效地测试、优化程序性能——特别是为Windows服务器开发的多线程程序，操作系统提供的标准时钟是不够的，必须使用解析度更高的时钟。本文介绍了如何访问处理器的十亿分之一秒级别的时钟，极大地提高代码性能测试的速度和精度。

一、获取计时数据

　　和其他Windows服务器一样，在Windows 2003 Server上最能发挥性能优势的是多线程程序。Windows 2003 Server支持各种多处理器系统，同时也能在单处理器的P4系统上运行。对于单处理器P4系统，Windows 2003 Server将发挥出Intel超线程技术提供的各种硬件线程执行引擎的优势。

　　开发服务器应用的人都知道，之所以要开发并行程序，真正的原因只有一个——性能。然而，众所周知，性能改善是一个比较模糊的目标，因为多线程代码的性能通常只能靠经验估计。在单线程程序中，性能改进程度一般可以精确地预知，例如减少了多少指令和延迟较高的操作，但多线程代码不同，Windows平台中线程调度是不确定的，也就是说，在Windows中应用程序可以要求调度程序运行线程，但调度程序何时（是否）运行线程则远远超出了应用程序代码的控制范围。

　　在测试性能时，开发者很快会遇到一个问题，这就是Windows内建的标准时钟实在不够精确，其可靠测量事件时间的解析度很难高于一秒，这样，要确定一个代码片段是否真正得到优化就很困难了。如果一定要用Windows的标准时钟进行测试，必须利用循环让代码运行几百万次，才能获得有效的时间数据。绝大多数情况下，使用这类循环意味着修改应用程序。

　　其实，还有更好的办法，这就是Win32高解析度时钟，涉及的函数有两个：QueryPerformanceCount()，QueryPerformanceFrequency()。在Intel系统中，从P II开始，这些函数依赖于Pentium芯片内建的一个计数器。当一个Intel系统启动时，一个64位的寄存器跟踪着消逝的时钟周期，这个计数器提供了解析度极高的计时设备。

　　整个64位寄存器都要用到。32 bit的整数大约能计数20亿，对于当前每秒运行20-30亿个周期的处理器，32 bit的计数器会在一秒或更少的时间内溢出，64 bit的计数器则能容纳这些秒数的20亿倍，按20亿秒计算就是约63年——可以相信，这已经远远超出测量任何程序的要求了。

　　要对一个事件进行计时，只需获得事件开始之前、结束之后的时钟计数。下面的代码不依赖于Win32（即，从C/C++直接访问），稍后我们再看看操作系统提供的函数。我们首先定义一个数据结构，然后再来看填写该结构的代码：

typedef struct _BinInt32 { __int32 i32[2];

}

BigInt32; typedef struct _BigInt64 { __int64 i64

;

} BigInt64; typedef union _bigInt { BigInt32 int32val

; 　

BigInt64 int64val

;

}

BigInt

;

原文转自：http://www.ltesting.net

软件测试 > 测试技术 > 性能测试 >