Statystycznie, ja i mój pies mamy po trzy nogi

Podziel się

Statystyka stanowi istotny element mojej pracy. W związku z tym, powiedzonko o trzech nogach psa i jego właściciela słyszałem już wielokrotnie. Tak się jednak składa, że bardzo lubię to powiedzenie, a tym tekście wytłumaczę dlaczego.

Statystyka budzi wśród wielu osób nieufność, a na jej temat krąży wiele porzekadeł, które podważają jej wiarygodność czy sens jej stosowania. Nie dzieje się tak bez przyczyny – mimo że rolą statystyki jest przekształcanie surowych danych w użyteczne informacje, często jest ona wykorzystywana żeby manipulować faktami, czy też je maskować. Przykłady takich działań to m.in. zjawisko p-hackingu, czy też dobrze znane wielu osobom manipulacje danymi na wykresach, które można oglądać w telewizji, a potem podziwiać w plebiscycie na najgorszy wykres roku, organizowanym przez Fundację SmarterPoland.pl.

Problem jednakże nie leży w samej statystyce. Statystyka to jedynie zbiór matematycznych metod i algorytmów, które przy spełnieniu pewnych założeń pozwalają coś policzyć. Problem tkwi w nieumiejętnym, lub celowo niewłaściwym, korzystaniu z tych metod.

Wracając do naszego psa i właściciela, powiedzenie to przypomina trochę ten stary dowcip o samochodach, które według plotki mieli rozdawać za darmo na Placu Czerwonym w Moskwie. Puenta dowcipu była taka, że jednak nie w Moskwie a w Petersburgu, nie na Placu Czerwonym a na Newskim Prospekcie, nie samochody a rowery i nie rozdają, tylko kradną.

Jeżeli przez chwilę potraktujemy zdanie o psie i właścicielu poważnie, to ze statystycznego punktu widzenia zawiera ono dwa podstawowe błędy. Po pierwsze, nie STATYSTYCZNIE po trzy nogi, tylko ŚREDNIO po trzy nogi. To nie statystyka twierdzi, że nogi są trzy. To zastosowanie średniej arytmetycznej daje taki wynik. Po drugie, nikt kto ma jakiekolwiek pojęcie o statystyce nie użyje średniej arytmetycznej do liczenia nóg, dla zbioru danych składającego się z dwóch elementów.

Powód, dla którego lubię powiedzonko o psie i jego właścicielu jest więc następujący: jest ono świetnym przykładem tego, co w mojej ocenie stanowi istotę problemu, czyli niewłaściwego używania statystyki. Osoba wypowiadająca to zdanie staje się żywym przykładem tego, co faktycznie stanowi kluczowy problem w statystyce – braku podstawowej wiedzy i nieumiejętnego korzystania z metod statystycznych.

W odpowiedzi na różne anty-statystyczne powiedzonka przytaczam czasem słowa szwedzkiego matematyka, Andrejsa Dunkelsa:

Łatwo jest kłamać przy użyciu statystyki, ale trudno jest mówić prawdę bez niej.

Andrejs Dunkels

W rzeczy samej, statystyka pozwala nam opisywać rzeczywistość przy pomocy liczb, ograniczać wpływ subiektywnych czynników i oceniać, kiedy uzyskane wyniki powinniśmy uznać za statystyczny szum, a kiedy warto bliżej im się przyjrzeć. Stanowi bardzo użyteczne narzędzie, ale tylko wówczas, kiedy jest wykorzystywana zgodnie ze swoim przeznaczeniem.


Podsumowanie tl;dr:

  1. Dlaczego statystyka budzi nieufność?
    Ponieważ często jest ona wykorzystywana do manipulowania faktami lub maskowania prawdy.
  2. Co stanowi kluczowy problem w statystyce?
    Kluczowym problemem jest brak podstawowej wiedzy i nieumiejętne korzystanie z metod statystycznych, co może prowadzić do błędnych wniosków i ułatwiać nieuczciwym badaczom manipulowanie faktami.
  3. Dlaczego lubię powiedzenie o psie i jego właścicielu?
    Ponieważ jest ono idealnym przykładem nieprawidłowego korzystania z metod statystycznych. Osoba wypowiadająca te słowa, chcąc podważyć zasadność stosowania statystyki, pokazuje zamiast tego jak ważne jest stosowanie jej w sposób zgodny z jej przeznaczeniem.
  4. Czy łatwo jest kłamać przy użyciu statystyki?
    Tak, ale trudno jest mówić prawdę bez niej.

Podziel się