欢迎来到 星空Online - 织梦者,我的原创世界。

A/B Testing 与正态分布(下)

在上一章中,我们一起回顾了什么是分布,概率分布函数及概率密度函数的意义,并在最后给出了正态分布及标准正太分布的数学定义及其相关公式。但并没有涉及到如何利用正态分布进行计算,该篇会从应用的角度,通过几个具体案例与大家一起研究如何计算出我们想要得出的各种数值。

首先我们回顾一下正态分布及标准正态分布的相关的数学定义及相关公式。

假定随机变量 $X$ 服从一个位置参数为 $\mu$、尺度参数为 $\sigma$ 的概率分布,且其概率密度函数为 $ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} $,则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记做 $X\sim{N}(\mu, \sigma^2)$,读作 $X$ 服从 $N(\mu, \sigma^2)$,或 $X$ 服从正态分布。特别的,当 $\mu = 0$、$\sigma = 1$ 时,$f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$,我们将这种情况称为标准正态分布,记为 $X\sim{N}(0, 1)$。其概率密度函数可记为 $\phi(x)$。

阅读 评论

A/B Testing 与正态分布(上)

在上一篇文章中,我们介绍了什么是中心极限定理,以及该定理在 A/B 测试数据分析过程中起到的至关重要的作用。中心极限定理揭示了:当我们拥有一个足够大的样本集合时,基于中心极限定理的特性,该样本的均值一定是服从正态分布的。

本章节让我们一起来回顾:什么是正态分布,以及正态分布在统计计算过程中起到了什么作用。

提到正态分布这个词,它是由两部分组成的 —— “正态”以及“分布”,“正态”的意思我们可以晚点再去了解,但“分布”的含义大家肯定都是很清楚的,在统计学领域,可以简单把它看成是一个不确定的值落在某个区间范围的概率。

阅读 评论

A/B Testing 与中心极限定理

在对精细化运营愈发重视的今天,A/B 测试已经成为了各大互联网公司中产品迭代过程中重要环节之一,通过随机分流的方式,观察一段时期内不同分支下的数据表现,再从中选择最符合自己预期目标的方案,可以更科学的量化产品的迭代效果。

A/B 测试之所以能够通过局部样本来预估整体大盘的数据表现,其最为重要的理论依据就是中心极限定理。

首先我们先来看下什么是中心极限定理。

阅读 评论