What is Z-score

  • : 单个数据点
  • : 总体均值
  • : 总体标准差

通过该公式,Z-score表示一个数据点与平均值之间的标准差距离。具体来说:

  • 当Z-score为0时,表示该数据点等于均值。
  • 当Z-score在±1之间时,表示数据点在一个标准差范围内。
  • 当Z-score超过±3时,通常被视为异常值

Pros and Cons

Z-score的概念很直接,部署快捷。

Z-score为什么要叫做Z-score,是因为Z的符号来源于正态分布。在统计学中,标准正态分布是一种具有均值为0、标准差为1的特殊正态分布,通常用字母 Z 表示。

也是因为此,Z-score用于的数据分布常常处于正太分布,对数据正太分布有依赖性,因此对极端值敏感,使得均值和标准差容易受到极端值影响,导致误判