python 异常点检测 cook距离_数据分析师所需的统计学:异常检测

2023-09-24 24 0

e8c0a5ce-6913-eb11-8da9-e4434bdf6706.png

近期,工作需要试了很多异常检测的方法,统计学和算法相关的都有,所以来总结一下。

在本篇文章主要从原理、python实现、局限的方式讲述以下几种统计学的异常检测的方法:

1、3Sigma

2、Numeric Outlier

3、格拉布斯准则(Grubbs算法)

4、多维度异常检测:马氏距离

1、3igma

原理:

3Sigma又称为拉依达准则,这种判别处理原理及方法仅局限于对正态或近似正态分布的

样本数据处理,原则:

数值分布在(μ-σ,μ+σ)中的概率为0.6827

数值分布在(μ-2σ,μ+2σ)中的概率为0.9545

数值分布在(μ-3σ,μ+3σ)中的概率为0.9973

所以,数据在(μ-3σ,μ+3σ)的概率低于0.01,我们可以称这些数据为异常值。

Python实现:

1、依据历史数据计算出正常区间(μ-3σ,μ+3σ)

2、判断目标数据是否有异常值

#输出正常区间

<

代码编程
赞赏

相关文章

零基础学习游戏建模多久能出师?3D建模师告诉你如何有效的学会建模
学3D建模一定要有美术功底?有则锦上添花,没有也不影响你学习
3D建模难学吗?零基础学6个月,能否找到工作?
3D建模入行难不难?零基础学习次世代,这6条建议能帮到你
游戏建模师薪资能给到多少?建模初学者如何快速入行,获取涨薪机会?
游戏建模行业门槛真有这么高?教你如何学习,找到合适自己的方式