Odległość Cooka

Odległość Cooka, dystans Cooka (ang. Cook's distance, Cook's D) – miara wykorzystywana w analizie regresji, służąca do wykrywania obserwacji odstających i oszacowania ich wpływu na cały model statystyczny[1]. Jej twórcą jest amerykański statystyk R. Dennis Cook, który zaproponował ją w latach 70. XX wieku[2].

W ramach obliczania odległości Cooka porównuje się stopień dopasowania do danych empirycznych dwóch modeli: modelu pełnego (w którym uwzględniono wszystkie obserwacje) oraz modelu niepełnego (a więc zbioru w którym pominięto jedną, wybraną obserwację)[1].

Przypisy

  1. a b Trzęsiok, M. (2014). O jakości danych w kontekście obserwacji oddalonych w wielowymiarowej analizie regresji. "Studia Ekonomiczne", (191), 75-88.
  2. Cook, R.D. (1977). Detection of influential observations in linear regression, „Technometrics”, 19 (1), s. 15-18.