Criterio di Chauvenet

Abbozzo
Questa voce sull'argomento teoria della probabilità è solo un abbozzo.
Contribuisci a migliorarla secondo le convenzioni di Wikipedia.
Voce da controllare
Questa voce o sezione sull'argomento matematica è ritenuta da controllare.
Motivo: presentazione errata o quantomeno molto confusa

In statistica, il criterio di Chauvenet fornisce un metodo per stabilire l'affidabilità di un dato rispetto agli altri osservati, cioè se il dato vada considerato come un outlier.

In azzurro è evidenziata la probabilità di presentazione dei dati esterni all'intervallo [ ( x m a ) , ( x m + a ) ] {\displaystyle [(x_{m}-a),(x_{m}+a)]} .

Si supponga di avere estratto n {\displaystyle n} osservazioni e sia f x ( x ) {\displaystyle f_{x}(x)} la distribuzione normale con media x m , {\displaystyle x_{m},} se x s {\displaystyle x_{s}} è l'osservazione sospetta, si procede calcolando la probabilità associata all'estrazione di osservazioni dalla distribuzione normale più lontani dalla media di x s . {\displaystyle x_{s}.} Sia quindi

| x m x s | = a , {\displaystyle |x_{m}-x_{s}|=a,}

la distanza tra la media e il dato sospetto; essendo la funzione di distribuzione considerata simmetrica rispetto a x m , {\displaystyle x_{m},} la probabilità che capitino eventi esterni all'intervallo [ ( x m a ) , ( x m + a ) ] {\displaystyle [(x_{m}-a),(x_{m}+a)]} è:

Pr { X < ( x m a ) } + Pr { X > ( x m + a ) } = 2 x m + a + f x ( x ) d x . {\displaystyle \Pr \left\{X<(x_{m}-a)\right\}+\Pr \left\{X>(x_{m}+a)\right\}=2\int _{x_{m}+a}^{+\infty }f_{x}(x)dx.}

Quindi, se la probabilità risultante p {\displaystyle p} è tale che:

n p < 0 , 5 , {\displaystyle np<0{,}5,}

allora si rigetta il dato x s {\displaystyle x_{s}} e si ripete il procedimento con un a {\displaystyle a} minore. Se invece è

n p > 0 , 5 , {\displaystyle np>0{,}5,}

allora si conserva il dato e si ripete il procedimento con un a {\displaystyle a} maggiore.

Alla fine del procedimento, trovato il dato x s {\displaystyle x_{s}} per il quale la probabilità in esame soddisfi n p = 0 , 5 , {\displaystyle np=0{,}5,} i dati al di fuori del range [ ( x m a ) , ( x m + a ) ] {\displaystyle [(x_{m}-a),(x_{m}+a)]} saranno scartabili, mentre quelli all'interno attendibili.

Voci correlate

  • Probabilità
  • Variabile casuale normale
  • Outlier

Altri progetti

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su Criterio di Chauvenet
  Portale Matematica
  Portale Statistica