一篇文章读懂A/B测试背后的统计学原理(3)_测试管理

刘慈欣谈ChatGPT：人类的无能反而

OpenAI 因使用“窃取”的个人数据

搜狐回应员工遭遇工资补助诈骗：

软件测试 > 测试技术 > 测试管理 >

一篇文章读懂A/B测试背后的统计学原理(3)

发表于：2016-11-15来源：未知作者：未知点击数：标签：

第二类错误：原假设为假时接受了原假设减少了第一类错误后，还有另一种错误会影响我们的决断，那就是原假设为假时接受了原假设，说白了就是2个

第二类错误：原假设为假时接受了原假设

减少了第一类错误后，还有另一种错误会影响我们的决断，

那就是原假设为假时接受了原假设，说白了就是2个版本有差异时候，我们错误的认为他们没有差异，这个错误的概率在统计学角度也称为取伪错误，记为 β ），这个概率可以相对大一些，业界大约定俗成的一个标准就是10%和20%的概率。

和显著性水平一样，为了避免我们犯第二类错误，我们需要通核算 β 从而计算出另一个参数来给我们参考，就是统计功效，和核算置信区间的置信度类似，它是的思路是 1-β 来得出（统计功效 power = 1 – β ）

统计功效是指版本差异（效果）为某个指定值时，通过显著性检验能正确地把差异检验出来的概率。说白了就是，假设两个版本的确存在差异，我们能够正确拒绝原假设，获得统计显著性结果（95%置信区间中数据）的概率。

统计功效的核算涉及样本数量，方差， α 、以及最小变化度或者置信区间下限。

由此可见，只有我们把第一类错误控制在5%以内，第二类错误控制在10%-20%左右，我们才可以说得出具有参考价值的出的试验数据。

换句话说，我们在做A/B测试时，试验结果达到95%的置信度，以及80%-90%的统计功效时，它对我们来说才是有意义、可以作为决策参考的。

原文转自：http://iamue.com/18769

软件测试 > 测试技术 > 测试管理 >

一篇文章读懂A/B测试背后的统计学原理(3)

相关文章

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

软件测试用例评审说明

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

软件测试用例评审说明

MBT基于模型的测试介绍资料

iso29119相关介绍性资料

HP QTP 10 中文版官方中文补丁

HP QTP 10 英文版下载地址

HP ALM 11 官方中文版下载地址

Quality Center 9.0中文版下载地

HttpWatch Basic Edition Version 7.

WIN2003+ORACLE11G+QC11(ALM11) 安装

WIN2003+SQL2005(SP3)+QC11(ALM11) 安

软件测试沙龙 More>>

新浪微博 More>>

热门标签

《测试团队的招聘与管理

《我们应该如何构建我们

软件测试 > 测试技术 > 测试管理 >

一篇文章读懂A/B测试背后的统计学原理(3)