一种常见的AB测试误区分析(3)_软件测试工程师入门

刘慈欣谈ChatGPT：人类的无能反而

OpenAI 因使用“窃取”的个人数据

搜狐回应员工遭遇工资补助诈骗：

软件测试 > 测试技术 > 软件测试工程师入门 >

一种常见的AB测试误区分析(3)

发表于：2017-01-13来源：吆喝科技作者：吆喝科技点击数：标签：AB测试

2次 2.2% 3次 1.8% 5次 1.4% 10次 1.0% 看一下自己犯了多大的错误，如果你在AB测试过程中不时的查看统计结果并快速的做决定，上面的表格会让你起鸡皮疙瘩。

2次 2.2%
3次 1.8%
5次 1.4%
10次 1.0%

看一下自己犯了多大的错误，如果你在AB测试过程中不时的查看统计结果并快速的做决定，上面的表格会让你起鸡皮疙瘩。

应该如何做

避免重复检验显著性错误的最好方式就是不去重复的检验显著性。事先决定样本数量，等试验结束后再去AB测试软件中查看“优于原版本的概率”。如果你能抑制提前结束试验的想法，那中途偷窥数据也无妨。这有些反人性，所以最佳建议还是不要偷窥。

既然要事先决定样本数量，应该取多少呢？下面是经验公式：

δ是能检测到的最小变化，σ是样本的标准差。样本的标准差可能不好预知，但是如果参与计算的样本取值是2值的（比如统计转化率），则有：

保证样本的规模就能避免问题。
对AB测试软件的建议：在试验结束之前不要报告显著性水平，不要用显著性水平来决定是继续试验还是停止试验。试验进行中不报告显著性水平而是报告目前样本数量能检测出多大的差别，计算公式为：

原文转自：http://www.appadhoc.com/blog/a-mistake-analysis-of-abtesting/

软件测试 > 测试技术 > 软件测试工程师入门 >

一种常见的AB测试误区分析(3)

应该如何做

相关文章

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

软件测试用例评审说明

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

软件测试用例评审说明

MBT基于模型的测试介绍资料

iso29119相关介绍性资料

HP QTP 10 中文版官方中文补丁

HP QTP 10 英文版下载地址

HP ALM 11 官方中文版下载地址

Quality Center 9.0中文版下载地

HttpWatch Basic Edition Version 7.

WIN2003+ORACLE11G+QC11(ALM11) 安装

WIN2003+SQL2005(SP3)+QC11(ALM11) 安

软件测试沙龙 More>>

新浪微博 More>>

热门标签

《测试团队的招聘与管理

《我们应该如何构建我们

软件测试 > 测试技术 > 软件测试工程师入门 >

一种常见的AB测试误区分析(3)

应该如何做