Criterium van Chauvenet

In de statistiek is het criterium van Chauvenet een vuistregel om een extreme waarde in een steekproef als uitbijter te bestempelen. Het criterium bepaalt de kans om in een normale verdeling die bij de steekproefuitkomsten past, een resultaat te vinden dat even extreem is als of erger dan de gevonden waarde. Als bij deze kans het aantal te verwachten waarden kleiner is dan 1/2 wordt de extreme waarde als uitbijter beschouwd. Het criterium is genoemd naar de Amerikaanse wiskundige en astronoom William Chauvenet[1], die het bedacht heeft.

Criterium

De getallen x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} zijn de uitkomsten van een steekproef van omvang n {\displaystyle n} , met gemiddelde x ¯ {\displaystyle {\bar {x}}} en standaardafwijking s {\displaystyle s} . Een van deze waarden x ext {\displaystyle x_{\text{ext}}} ligt tamelijk extreem ten opzichte van de anderen.

Bereken voor Z {\displaystyle Z} standaardnormaal verdeeld

p ext = P ( | Z | > | x ext x ¯ | s ) = 2 ( 1 Φ ( | x ext x ¯ | s ) ) {\displaystyle p_{\text{ext}}=P\left(|Z|>{\frac {|x_{\text{ext}}-{\bar {x}}|}{s}}\right)=2\left(1-\Phi \left({\frac {|x_{\text{ext}}-{\bar {x}}|}{s}}\right)\right)} ,

waarin Φ {\displaystyle \Phi } de verdelingsfunctie is van de standaardnormale verdeling.

De extreme waarde x ext {\displaystyle x_{\text{ext}}} wordt als uitbijter beschouwd, als:

n p ext < 1 2 {\displaystyle n\,p_{\text{ext}}<{\tfrac {1}{2}}}

Kritiek

Hoewel het criterium van Chauvenet een objectieve en kwantitatieve maat lijkt te zijn voor het bepalen of een waarneming een uitbijter is, dus mogelijk niet tot de populatie behoort, blijft het verwijderen van uitbijters uit een waargenomen steekproef een dubieuze praktijk die door veel wetenschappers wordt bekritiseerd. In het bijzonder in kleine steekproeven of als de onderliggende verdeling mogelijk te veel afwijkt van normaliteit.

Referenties

  1. Chauvenet, William. A Manual of Spherical and Practical Astronomy V. II. 1863. Reprint of 1891. 5th ed. Dover, N.Y.: 1960. pp. 474–566.
· · Sjabloon bewerken
Onderwerpen uit de beschrijvende statistiek
Gemiddelden:rekenkundig gemiddelde · meetkundig gemiddelde · harmonisch gemiddelde · kwadratisch gemiddelde · gewogen gemiddelde · getrimd gemiddelde · Winsorgemiddelde
Andere liggingsmaten:mediaan · modus · kwartiel · deciel · percentiel
Spreidingsmaten:variantie · standaardafwijking · variatiecoëfficiënt · interkwartielafstand
Grafische beschrijvingen:histogram · boxplot · Q-Q plot
Overig:moment · scheefheid · kurtosis · vijf-getallensamenvatting