Satz von Halmos-Savage

Der Satz von Halmos-Savage ist ein Lehrsatz der mathematischen Statistik, der bei Vorliegen einer dominierten Verteilungsklasse ein notwendiges und hinreichendes Kriterium für die Suffizienz von σ-Algebren (und damit auch von Statistiken) liefert. Damit ist der Satz von Halmos-Savage ein Hilfsmittel, um zu überprüfen, ob gewisse Funktionen eine Datenkompression ohne Informationsverlust ermöglichen. Aus dem Satz von Halmos-Savage lässt sich das leichter zu handhabende Neyman-Kriterium für Suffizienz ableiten. Ebenso lassen sich aus dem Satz Kriterien für die Existenz von minimalsuffizienten σ-Algebren ableiten.

Der Satz wurde 1949 von Paul Halmos und Leonard J. Savage bewiesen.[1]

Rahmenbedingungen

Gegeben sei ein statistisches Modell ( X , A , P ) {\displaystyle (X,{\mathcal {A}},{\mathcal {P}})} mit einer dominierten Verteilungsklasse P {\displaystyle {\mathcal {P}}} .

Für eine beliebige Verteilungsklasse P {\displaystyle {\mathcal {P}}} sei N P {\displaystyle {\mathcal {N}}_{\mathcal {P}}} die Menge aller P {\displaystyle {\mathcal {P}}} -Nullmengen. Für eine dominierte Verteilungsklasse existiert nun immer ein dominierendes P {\displaystyle P^{*}} , so dass N P = N P {\displaystyle {\mathcal {N}}_{\mathcal {P}}={\mathcal {N}}_{P^{*}}} und P {\displaystyle P^{*}} eine abzählbare Konvexkombination mit echt positiven Koeffizienten von Elementen aus P {\displaystyle {\mathcal {P}}} ist. Es gilt also

P = i = 1 α i P i  mit  α i > 0  und  i = 1 α i = 1 {\displaystyle P^{*}=\sum _{i=1}^{\infty }\alpha _{i}P_{i}{\text{ mit }}\alpha _{i}>0{\text{ und }}\sum _{i=1}^{\infty }\alpha _{i}=1} .

Aussage

Sei P {\displaystyle {\mathcal {P}}} eine dominierte Verteilungsklasse und P {\displaystyle P^{*}} wie oben angegeben. Dann ist eine Unter-σ-Algebra S {\displaystyle {\mathcal {S}}} von A {\displaystyle {\mathcal {A}}} genau dann suffizient, wenn für alle P P {\displaystyle P\in {\mathcal {P}}} eine Funktion f P L ( X , S ) {\displaystyle f_{P}\in {\mathcal {L}}(X,{\mathcal {S}})} existiert, so dass f P {\displaystyle f_{P}} P {\displaystyle P^{*}} -fast sicher die Radon-Nikodým-Ableitung von P {\displaystyle P} bezüglich P {\displaystyle P^{*}} ist, also

f P = d P d P P -fast sicher {\displaystyle f_{P}={\frac {\mathrm {d} P}{\mathrm {d} P^{*}}}\quad P^{*}{\text{-fast sicher}}} .

Beispiel

Seien S 1 S 2 A {\displaystyle {\mathcal {S}}_{1}\subset {\mathcal {S}}_{2}\subset {\mathcal {A}}} σ-Algebren und sei S 1 {\displaystyle {\mathcal {S}}_{1}} suffizient. Außerdem sei P {\displaystyle {\mathcal {P}}} eine dominierte Verteilungsklasse. Dann existiert nach dem Satz von Halmos-Savage ein f P {\displaystyle f_{P}} , so dass f P L ( X , S 1 ) {\displaystyle f_{P}\in {\mathcal {L}}(X,{\mathcal {S}}_{1})} und

f P = d P d P P -fast sicher {\displaystyle f_{P}={\frac {\mathrm {d} P}{\mathrm {d} P^{*}}}\quad P^{*}{\text{-fast sicher}}} .

Da aber L ( X , S 1 ) L ( X , S 2 ) {\displaystyle L(X,{\mathcal {S}}_{1})\subset L(X,{\mathcal {S}}_{2})} ist, gilt f P L ( X , S 2 ) {\displaystyle f_{P}\in L(X,{\mathcal {S}}_{2})} . Da f P {\displaystyle f_{P}} immer noch die Dichten-Eigenschaft erfüllt, ist mit nochmaliger Anwendung des Satzes auch S 2 {\displaystyle {\mathcal {S}}_{2}} suffizient.

Man beachte, dass diese Aussage im Allgemeinen nicht gilt und dies eines der Defizite des Suffizienzbegriffs darstellt.

Literatur

  • Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3. 

Einzelnachweise

  1. Halmos, Savage: Application of the Radon-Nikodym Theorem to the Theory of Sufficient Statistics, Annals of Mathematical Statistics, Band 20, 1949, S. 225–241, Project Euclid