Kysymykseen on erittäin vaikea antaa karkeatakaan arviota. Seuraavassa esittelen seikkoja, joita on syytä ottaa huomioon, ennen kuin alkaa tehdä laskutoimituksia suomen sanamäärästä. Lasketaanko kaikki sanamuodot mukaan? Ajatellaanko vaikkapa sanat kaiuttimen ja kaiuttimella omiksi sanoikseen vai vain yhden sanan eri taivutusmuodoiksi?

Entä homonyymit, sellaiset sanat, jotka ääntyvät samalla tavoin, mutta ovat erimerkityksisiä? Näihin lukeutuvat esimerkiksi sanat kuusi (puu) ja kuusi (6). Otetaanko vaikkapa kaikki oikeus-sanan eri merkitykset lukuun? Oikeudella voidaan tarkoittaa jollekin kuuluvaa etua (äänioikeus), oikeudenmukaisuutta (oikeus tapahtui), oikeusjärjestystä (rikosoikeus), tuomioistuinta (käräjäoikeus) sekä sitä, että jokin esiintyy edukseen (kukat pääsevät tuossa parhaiten oikeuksiinsa).

Miten yhdyssanat otetaan huomioon? Tilapäisiä yhdyssanoja muodostuu roppakaupalla lisää. Esimerkiksi sanalle kertakäyttökäsipyyhejärjestelmäkorjaaja-apumies voi olla tarvetta vain kerran maailmanhistoriassa, mutta se on silti käyttökelpoinen sana. Sitä paitsi suomen kielessä on mahdollista muodostaa loputtoman pitkä yhdyssana joko sijapäätteistä tai sitten vain yhdyssanasta vaikkapa toistamalla: lapsenlapsenlapsenlapsen…lapsi. Guinnessin ennätyskirja mainitsee suomen pisimmäksi käytössä olleeksi sanaksi atomiydinenergiareaktorigeneraattorilauhduttajaturbiiniratasvaihteen, jossa on 66 kirjainta.

Noteerataanko sekä puhuttu että kirjoitettu kieli? Puhekieleen syntyy niin runsaasti uutta sanastoa, ettei mikään seula pysty joka sanaa laskemaan ja arkistoimaan. Suomenkielinen sosiaalinen vuorovaikutus eri puolilla maata ja maailmaa tuottaa jatkuvasti erilaisia sanoja jo murretaustankin takia. Lisäksi erilaisissa ryhmissä kehkeytyy slangia. Esimerkiksi armeijassa ja harrastusryhmissä on oma puhetapansa, puhumattakaan ammattikielistä. Variaatio on huima. Aivan oma lukunsa ovat erityisalat, muun muassa lääketiede, jonka sanasto on erityisen laaja ja alati muuttuva. Suomalaisessa Lääketieteen termit -teoksessa on 30 000 hakusanaa, mutta esimerkiksi saksalaisessa Reallexikon der Medizin -sanastossa jo 240 000. Arviot koko lääketieteen sanojen määrästä liikkuvat puolen miljoonan tienoilla.

Entä tarkastellaanko vain nykykieltä, ei enää historian hämärään jäänyttä sanastoa? Koiraa merkitsevä 5 000 vuotta vanha sana peni ei ole enää käytössä, mutta se on helposti jäljitettävissä suomen kielen sanaksi. Onpahan se jäänyt elämään joihinkin nykyisiin sanoihin (peninkulma, penikka = pentu; kakara). Poistunutta sanastoa vasta olisikin vaikea laskea!

Yleiskieltä kuvaavassa Kielitoimiston sanakirjassa (2004) on noin 100 000 hakusanaa. 1951–1961 ilmestynyt Nykysuomen sanakirja on ollut vielä laajempi esitys: se koostuu 200 000 yleiskielen sanasta. Sanakirjat ovat kuitenkin pelkkä valikoima – paljon sanoja on jätetty pois, koska niitä käytetään harvoin, ja toisaalta sanakirjassa on aina sanoja, joita ei todellisuudessa liiemmin käytetä.