Nauka

Pensja w portfelu i w Excelu

Jak się wykorzystuje statystykę do szacowania zarobków Polaków

Średniej arytmetycznej wytyka się najczęściej jej główną słabość, mianowicie wrażliwość na wartości skrajne. Średniej arytmetycznej wytyka się najczęściej jej główną słabość, mianowicie wrażliwość na wartości skrajne. Jonathan Kitchen / Getty Images
Zawsze chcemy wiedzieć, ile zarabiają inni. Czy dowiemy się tego od statystyków?
Odpowiednikiem tendencji do liczbowego opisu jakościowych cech zbiorowości jest mnogość najrozmaitszych indeksów.srapulsar38/PantherMedia Odpowiednikiem tendencji do liczbowego opisu jakościowych cech zbiorowości jest mnogość najrozmaitszych indeksów.

Sławomir Sierakowski w tekście „Sprzedana demokracja?” (POLITYKA 50/15) twierdzi, że GUS oszukuje nas, podając comiesięczny komunikat o średniej płacy w sektorze przedsiębiorstw albo co kwartał o średniej płacy w gospodarce, i sugeruje, aby przeciętne zarobki charakteryzować nie średnią arytmetyczną, lecz medianą lub dominantą. Zanim bliżej przyjrzymy się tej propozycji, warto rozważyć, po co w ogóle potrzebna jest informacja o średnich zarobkach.

Pierwszy powód wydaje się oczywisty – każdy pragnie wiedzieć, jak się ma jego comiesięczna pensja do zarobków innych osób. Naturalne jest więc poszukiwanie jakiegoś punktu odniesienia, bez którego 3 tys. zł może się wydawać albo dużo, albo mało. Na przykład 20 lat temu pensja tej wysokości uważana była za wyjątkowo wysoką – stanowiła bowiem czterokrotność średniej krajowej. Dzisiaj z kolei stanowi zaledwie ok. 3/4 średniej płacy, a dodatkowo jest mniejsza od mediany, co oznacza, że ponad połowa zatrudnionych zarabia więcej niż 3 tys. zł miesięcznie. Dla wielu osób jest mniej ważne, ile za te 3 tys. zł mogą kupić towarów i usług, czyli jaka jest siła nabywcza ich płacy, a ważniejsze to, czy płaca ich osiąga przynajmniej poziom średniej krajowej.

Statystyka bez porównań jest uboga, co ilustruje anegdota o tym, jak się witają statystycy. Jeden z nich pyta: „Jak się miewa twoja żona?”. Na co drugi, po chwili zawahania, odpowiada: „W porównaniu z kim?”. Wyniki statystyczne zyskują właściwy i pełniejszy kontekst dopiero po skonfrontowaniu ich z innymi jednostkami zbiorowości lub innymi jej charakterystykami. Tego typu odniesienia, na przykład dynamiki średniej płacy do zmiany w czasie PKB, dają nowe możliwości interpretacyjne, na przykład: w jakim zakresie uczestniczymy w owocach wzrostu gospodarczego.

Potrzebujemy jednej konkretnej liczby

Innym powodem comiesięcznych komunikatów GUS o średniej płacy w przedsiębiorstwach jest dążenie do przekazania informacji o poziomie płac za pomocą jednego syntetycznego wskaźnika. Problem tkwi jednak w tym – jakiego wskaźnika? Najlepiej byłoby oczywiście zaprezentować cały rozkład płac w populacji zatrudnionych, a więc procentowe udziały pracowników w poszczególnych przedziałach zarobków, od najniższych do najwyższych. Nie jest to jednak ani możliwe, ani – jak się wydaje – pożądane. Oznaczałoby to bowiem konieczność znacznie bardziej szczegółowego raportowania przez przedsiębiorstwa o wysokości pracowniczych wynagrodzeń, i to co miesiąc. Tak szczegółowe dane są zbierane przez GUS jedynie raz na dwa lata w badaniu reprezentacyjnym, obejmującym tylko wylosowane do próby przedsiębiorstwa. Badanie to jest i czasochłonne, i kosztowne. Ostatnie dane na ten temat, które ogłosił GUS na początku grudnia 2015 r., dotyczą struktury wynagrodzeń w październiku 2014 r.

O ile wskazane byłoby wykonywanie takiego badania raz do roku, o tyle wątpliwe, czy istnieje rzeczywista potrzeba prezentowania szczegółowej struktury wynagrodzeń z częstotliwością miesięczną. Zwróćmy bowiem uwagę, że w wielu dziedzinach życia gospodarczego i społecznego, gdzie istnieją łatwo dostępne dane szczegółowe na temat pewnych złożonych zjawisk, przywiązujemy się najczęściej i tak do jednego tylko wskaźnika. Tak jest z oceną dynamiki wzrostu gospodarczego lub poziomu życia społecznego, gdzie powszechnie jest stosowany produkt krajowy brutto (PKB), mimo że posiada on sporo wad jako miernik syntetyczny. Na przykład nie mierzy degradacji środowiska i wyczerpywania się zasobów naturalnych, a usługi publiczne są w nim wyrażone nie wynikami, lecz nakładami (w postaci wydatków rządowych).

W ostatnich kilkunastu latach nasiliła się tendencja do poszukiwania syntetycznych liczbowych miar wielu złożonych zjawisk. Odbiorcy tego typu informacji, a więc niemal my wszyscy, pragniemy jednej konkretnej liczby: wartości wskaźnika, procentu w sondażu, miejsca w rankingu. Mniej nas obchodzą treści, jakie się za tymi liczbami kryją, a pewnie jeszcze mniej konstrukcja tych zagregowanych wskaźników. Zamiast opisu rozkładu płac wolimy jedną jego charakterystykę.

Także i w tym dążeniu, podobnie jak w skłonności do porównań, wcale nie odbiegamy od postawy statystyków, od których oczekujemy, że tego typu adekwatne charakterystyki liczbowe będą w stanie zaproponować. W historii statystyki znanych jest wiele prób krótkiego liczbowego opisu pewnych regularności, które same w sobie były zawsze dość złożone.

Kiedy zakwitną bzy w Brukseli?

Jeden z najsłynniejszych statystyków XIX w. Adolf Quetelet obliczył na przykład, że „bzy mają największe szanse zakwitnąć w Brukseli wtedy, gdy suma kwadratów średnich temperatur dziennych od ostatniego mrozu osiągnie 4264 stopnie”. Współczesnym odpowiednikiem tendencji do liczbowego opisu jakościowych cech zbiorowości jest mnogość najróżniejszych indeksów (indeks wolności gospodarczej, ang. index of economic freedom; wskaźnik rozwoju społecznego, ang. human development index; indeks postrzegania korupcji, ang. corruption perceptions index), popularność technik scoringowych (punktowych) czy badań ankietowych. W każdej takiej sytuacji, o czym warto pamiętać, ceną za jednoznaczną liczbową charakterystykę danej cechy (ilościowej bądź jakościowej) jest utrata wielu ważnych informacji. Nie inaczej rzecz się ma z rozkładem płac.

Zastąpienie przez jeden parametr informacji o wysokości, zróżnicowaniu czy koncentracji płac musi prowadzić do daleko idących uproszczeń. Chodzi jednak o to, aby te konieczne uproszczenia nie wykrzywiały prawdziwego obrazu opisywanego rozkładu. Odpowiedzmy więc na pytanie: czy średnia arytmetyczna płac w stosunku do innych miar poziomu przeciętnego – w szczególności mediany i dominanty – fałszuje ten obraz czy nie?

Średniej arytmetycznej wytyka się najczęściej jej główną słabość, mianowicie wrażliwość na wartości skrajne. W przypadku płac w gospodarce Polski oznacza to, że bardzo wysokie płace – mimo że niewielkiej części zatrudnionych (6,4 proc. zarabia powyżej dwukrotnej średniej) – podwyższają istotnie płacę średnią. Trzeba przyznać, że w tego typu rozkładach, mówiąc językiem statystyki – o silnej asymetrii prawostronnej – średnia arytmetyczna nie stanowi dobrej miary poziomu średniego. Stąd bierze się dyskomfort wielu pracujących, którzy za przeciętną płacę są skłonni uważać taką jej wysokość (medianę), poniżej i powyżej której lokuje się po 50 proc. zatrudnionych. W rozkładach płac jest to często wykorzystywany miernik, aczkolwiek również niepozbawiony wad.

Słabą stroną mediany jest to, że może się ona w ogóle nie zmieniać przy znacznych zmianach wysokości płac. Na przykład, gdyby wspomnianym wyżej 6,4 proc. najlepiej zarabiających podnieść płace o dowolnie dużą kwotę, to mediana płac – jako miernik poziomu średniego – nie ulegnie zmianie. Otrzymamy więc lepsze samopoczucie: średnia w gospodarce nie powinna rosnąć, skoro poprawiło się jedynie tym z najwyższymi zarobkami, ale z drugiej strony na własne życzenie otrzymamy nieprawdziwy obraz rzeczywistości. Trudno bowiem uznać za prawdziwe stwierdzenie, że przeciętnie w rozkładzie płac nic się nie zmieniło, skoro płace najlepiej zarabiających istotnie wzrosły. Medianę uznać więc można za dobre uzupełnienie informacji o średniej arytmetycznej, ale nie jako jej lepszą alternatywę. W niektórych krajach, gdzie zróżnicowanie płac jest większe niż w Polsce (np. w Wielkiej Brytanii), częściej operuje się jednak medianą płac niż średnią arytmetyczną.

Realne zarobki milionów Polaków

Za jeszcze bardziej kontrowersyjną należy uznać propozycję Sławomira Sierakowskiego z przywołanego wcześniej artykułu, aby dominującą w gospodarce płacę (dominantę) traktować jako uogólnienie wysokości zarobków („to są realne zarobki milionów Polaków” – pisze autor). Fakt, że największy odsetek zatrudnionych stanowią ci, których zarobki oscylują wokół dominanty, nie mówi prawie nic o przeciętnym poziomie zarobków. Jeżeli 26 proc. osób zarabiało w 2014 r. pomiędzy 50 proc. a 75 proc. średniego wynagrodzenia (wg danych GUS), to z samej tej informacji nie wynika, jak rozłożone są płace pozostałych ponad trzech czwartych zatrudnionych. A na dodatek płace tej większości mogą się istotnie zmieniać, nie wpływając w ogóle na wartość dominanty. Podobne słabości mediany i dominanty biorą się stąd, że obie one należą do tzw. miar pozycyjnych poziomu przeciętnego, stąd nie reagują na różne zmiany w wartościach analizowanej cechy u poszczególnych jednostek. Miary pozycyjne uważa się za mniej precyzyjne charakterystyki syntetyczne rozkładu od miar klasycznych, do których zalicza się m.in. średnią arytmetyczną.

Gdyby comiesięczną informację o średniej płacy w przedsiębiorstwach wzbogacić o medianę i dominantę płac, to obraz rozkładu płac byłby pełniejszy. Są to miary względem siebie komplementarne. Przeszkodą uniemożliwiającą obecnie podawanie wszystkich tych trzech wielkości jest inny zakres informacji statystycznych potrzebnych do ich obliczenia.

Średnią arytmetyczną płac daje się łatwo wyliczyć, znając jedynie sumę wykorzystanego w danym miesiącu funduszu płac w przedsiębiorstwach i liczbę zatrudnionych. Z kolei wyznaczenie mediany i dominanty wymagałoby dokładniejszych informacji o wysokości zarobków wszystkich zatrudnionych w firmach.

Należy postulować zwiększenie częstotliwości wykonywania przez GUS reprezentacyjnego badania struktury płac do przynajmniej raz w roku. Przy udoskonalonym planie próbkowania i zmniejszeniu dość dużej obecnie próby (29,7 tys. przedsiębiorstw zatrudniających powyżej 9 osób, tj. 13 proc. populacji) nie musiałoby się to wiązać z istotnym zwiększeniem nakładów finansowych na badanie. W dłuższej zaś perspektywie informacje o płacach mogłyby być możliwe do pozyskania od przedsiębiorstw w zintegrowanych komputerowych systemach sprawozdawczości. Skoro dane o wypłaconych kwotach wynagrodzeń są i tak rejestrowane co miesiąc w bazach danych przedsiębiorstw, to dlaczego nie miałyby się one stać elementem zasobów informacyjnych statystyki publicznej? Wówczas rozkład płac można będzie charakteryzować nie tylko średnią arytmetyczną, ale dowolną miarą poziomu przeciętnego i – co ważne – zróżnicowania (dyspersji). Równie bowiem gorące jak o średniej płacy bywają dyskusje o zróżnicowaniu i koncentracji rozkładu płac.

***

Autor jest statystykiem, obecnie pełni funkcję prorektora Uniwersytetu Gdańskiego.

Polityka 9.2016 (3048) z dnia 23.02.2016; Nauka; s. 66
Oryginalny tytuł tekstu: "Pensja w portfelu i w Excelu"
Więcej na ten temat
Reklama

Codzienny newsletter „Polityki”. Tylko ważne tematy

Na podany adres wysłaliśmy wiadomość potwierdzającą.
By dokończyć proces sprawdź swoją skrzynkę pocztową i kliknij zawarty w niej link.

Informacja o RODO

Polityka RODO

  • Informujemy, że administratorem danych osobowych jest Polityka Sp. z o.o. SKA z siedzibą w Warszawie 02-309, przy ul. Słupeckiej 6. Przetwarzamy Twoje dane w celu wysyłki newslettera (podstawa przetwarzania danych to konieczność przetwarzania danych w celu realizacji umowy).
  • Twoje dane będą przetwarzane do chwili ew. rezygnacji z otrzymywania newslettera, a po tym czasie mogą być przetwarzane przez okres przedawnienia ewentualnych roszczeń.
  • Podanie przez Ciebie danych jest dobrowolne, ale konieczne do tego, żeby zamówić nasz newsletter.
  • Masz prawo do żądania dostępu do swoich danych osobowych, ich sprostowania, usunięcia lub ograniczenia przetwarzania, a także prawo wniesienia sprzeciwu wobec przetwarzania, a także prawo do przenoszenia swoich danych oraz wniesienia skargi do organu nadzorczego.

Czytaj także

Nauka

Dwie Polki na serio rozpracowują SARS-CoV-2. Czy im się uda?

Polskie badaczki próbują rozpracować wirusa CoV-2

Paweł Walewski
03.04.2020
Reklama

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną