图 2. 每种工作负荷模式都有相关的一类用户请求
分布和相关性
Web 流量显示了突增、长尾和相关的抵达模式。流量突增指请求的随机到达,其高峰期的流量远远超过平均水平。这种突增现象由不可预测的事件(如股市动荡)或特殊 事件(如圣诞节和情人节)引起。这些事件会产生请求间的相关性(例如,更大的突增易于在邻近的地方发生)、长尾分布(例如,流量增长的波动幅度极大)以及 相关性和长尾分布的结合。随机变量的长尾分布是指分布曲线的尾端呈指数下降。对于这些分布,会产生极大一个值。成批抵达过程显示了这种长尾行为,并且成批 请求的大小趋向于密切相关。在容量规划中,获得流量突增、长尾和相关抵达的实际结果并非易事。
突增和变化极大的点击率是影响站点性能和可用性的最显而易见的工作负荷模式复杂性之一。在传统模型中,各个请求相互独立,流量突增幅度的变化相对较小。这些分布属于短尾分布类。HVWS 的流量突增引起了长尾分布和强相关性结构。1998 年长野奥运会的流量模式恰好说明了这一点,如图 3所示。这种请求突增是由某些特殊事件引发的,例如,在这次奥运会上,日本获得了跳高滑雪项目的金牌。请比较亚洲的长尾分布和当日欧洲的短尾分布之间的差异。另外,请注意每天、一天中以及不同地点间的独立性结构。
图3. 1998 年长野奥运会流量模式
IBM 的 Wimbledon 2000 网站也在最忙碌的一天,2000 年 7 月 7 日,显示出极度突增现象。
图 4绘制了那天的破记录站点流量,当时的每分种峰值点击次数达到 963,948 次,且每天峰值点击次数总计达到 281,605,872 次。
图 4. 破记录那天 IBM 的 Wimbledon 网站
非传统请求流量对 Web 服务器造成压力。长尾分布的流量突增所产生的性能下降要比短尾分布所产生的性能下降大几个数量级。与短尾模型相比,长尾分布发生极端流量突增的情况更频 繁。另外,相关性结构可导致在邻近的地方发生流量突增现象。对于这种输入流量特性,性能评测结果,尤其是响应时间,与输入流量具有相似的指数。这有助于解 释为什么一些体育和电子商务网站比相对简单的网站(例如只提供静态内容的大学网站)更难维护。
就 SLA 而论,长尾分布的同级服务比独立的短尾请求流量要求具备更为强大的一组服务器。为了确保获得优良的性能,您必须注重流量的高峰期,因为请求的巨增是导致性能降低的首要元凶。这有些繁忙站点需要更多的峰值储备空间(空闲容量)来处理这些容量,例如大容量在线贸易站点用 3:1 的比例来保留空闲容量。
文章来源于领测软件测试网 https://www.ltesting.net/
版权所有(C) 2003-2010 TestAge(领测软件测试网)|领测国际科技(北京)有限公司|软件测试工程师培训网 All Rights Reserved
北京市海淀区中关村南大街9号北京理工科技大厦1402室 京ICP备2023014753号-2
技术支持和业务联系:info@testage.com.cn 电话:010-51297073