Ile słów jest w języku polskim?
Nie da się wskazać jednej, pewnej liczby, ponieważ wynik zależy od definicji „słowa”, kryteriów liczenia i zakresu źródeł, a język stale się zmienia. Słowniki notują około 130–150 tys. haseł, natomiast pełny, żywy zasób polszczyzny (z odmianami, derywatami, terminologią, regionalizmami i neologizmami) sięga setek tysięcy jednostek leksykalnych.
Dlaczego nie ma jednej liczby
To, co liczyć jako „słowo”, różni się między badaniami: hasła bazowe, formy fleksyjne, derywaty, zdrobnienia, nazwy własne czy wielowyrazowe jednostki wpływają na końcowy wynik. Dodatkowo słowniki i korpusy nie rejestrują wszystkiego na bieżąco, więc realne użycie przewyższa stan odnotowany w kompendiach.
Ile słów ma język polski – co mówią słowniki
Jako punkt odniesienia często przywołuje się Wielki słownik ortograficzny PWN z ok. 140 tys. haseł i podobne zasoby, z których po odjęciu nazw własnych uzyskuje się szacun rzędu 130 tys. jednostek podstawowych. Inne kompendia i bazy leksykalne podają wielkości od ponad 100 tys. do ponad 150 tys. haseł, w zależności od przyjętych kryteriów i zakresu rejestracji.
Szacunki „pełnego” zasobu
Artykuły popularyzatorskie i wpisy eksperckie wskazują, że po doliczeniu słownictwa potocznego, gwarowego, fachowego i nowości leksykalnych polszczyzna przekracza „słownikowe” 150 tys., wchodząc w zakres kilkuset tysięcy jednostek leksykalnych. Rozbieżności między źródłami wynikają z tego, czy liczone są formy pochodne i fleksyjne oraz jak definiuje się „słowo” versus „hasło” i „znaczenie”, co utrudnia porównania.
Ile słów zna użytkownik
Badania i testy słownictwa pokazują, że przeciętny użytkownik zna i aktywnie używa tylko ułamka zasobu języka, zwykle kilka–kilkanaście tysięcy słów czynnie, a istotnie więcej biernie. Nowsze testy online raportują medianę biernego słownika rodzimych użytkowników nawet w okolicach 70–80 tys., ale to wyniki metodologicznie zależne od prób i narzędzi, więc należy traktować je orientacyjnie.
Co wliczać, a co pominąć
Uwzględnienie nazw własnych, skrótów, symboli, internacjonalizmów oraz jednostek wielowyrazowych znacząco zawyża licznik, ale nie wszystkie te kategorie traktuje się jako „słowa” w sensie leksykograficznym. Podobnie włączanie derywatów i form fleksyjnych zwiększa liczebność, lecz utrudnia porównywalność między źródłami.


