Povídání o normálním rozdělení a IQ

Dušan Polanský

Intelekt je hlavně o vrozeném nadání. Jeho výše se obvykle udává jako inteligenční kvocient, zkráceně IQ. Ten je definován jako poměr mentálního věku a věku skutečného vynásobeného číslem 100. Kupříkladu pokud desetileté dítě má inteligenci dvanáctiletého dítěte, pak jeho IQ = 100 * (12/10) = 120. Ovšem u dětí se inteligence až tak často neměří, obvykle se měří až u dospělých lidí. Koneckonců u dětí by to bylo někdy zcela zbytečné jednak proto, že hodně rodičů si myslí, že právě jejich dítě je génius, jednak proto, že je to nepedagogické, protože dítě s nižším IQ by mohlo být zbytečně frustrováno, a přitom většinou zcela zbytečně, protože sebekvalitnější test na zjištění IQ nemůže zachytit celou bohatost psychiky a potenciál schopností člověka. Podle mne ideální je IQ 100, což je i můj případ, pak si člověk nepřipadá ani chytrý, ani hloupý a ví, že nemůže moc filozofovat nad životem, ale že musí poctivě makat, aby se vůbec uživil, tedy pokud nezdědil nějaké melouny a mohou mu být řeči o poctivém makání na háku.

Když už se bavíme dost volně o inteligenci, není si dobré plést chytrost a moudrost. Když o někom řekneme, že je chytrý, měli bychom vždy upřesnit, na co je chytrý. Moudrost si sice vážíme, ale pokud bychom měli na výběr, většina z nás dá přednost chytrosti před moudrostí. Ovšem bacha i na moudré lidi, nejednou jejich moudrosti mohou být pozvánkou do pekla, proto asi největší jistotou je, spoléhat se na svůj zdravý rozum. Také není dobré plést si intelektuála a inteligentního člověka. Intelektuálové jsou většinou lidé, kteří se nedokáží uplatnit v praktickém životě, a tak se tváří, že jsou vyvolení a že si s inteligencí stojí lépe než my obyčejní jakž takž inteligentní lidé. Namlouvají si, že vidí až kamsi za horizont, kam my obyčejní lidé vůbec nedohlédneme. Obvykle sem patří filozofové, literáti, historici umění, teologové, sociologové a lidé podobného ražení a zaměření. Za intelektuály určitě nikoho nenapadne považovat např. úspěšné techniky, řemeslníky, lékaře, farmáře, inženýry, přírodovědce, což jsou podle intelektuálů jenom inteligentní lidé. Sice bez nich by intelektuálové pomřeli hlady, ale ti si namlouvají, že je to přesně naopak, že právě bez nich by lidstvo málem nemohlo existovat. Ale uznávám, že občas nějaký intelektuál zazáří jako nově zrozená hvězda na jasné obloze, abych byl konkrétní, zmíním hned dva mně sympatické intelektuály: Immanuela Kanta (1724–1804) a Tomáše Akvinského (1225–1274).

Měřiči inteligenčního kvocientu zjistili, že inteligence má přibližně normální rozdělení. Určitě jste o něm již slyšeli. Křivka jeho hustoty pravděpodobnosti má tvar zvonu, viz obrázek č. 1, často se této křivce říká Gaussova, podle německého matematika Carla Friedricha Gausse (1777–1855). Křivka má jednu velice příjemnou vlastnost, je symetrická podle nejčastější hodnoty náhodné proměnné. Kupříkladu normální rozdělení má výška dospělých mužů nebo žen, roční srážky v mm v Brně, rychlost aut jezdících kolem božích muk po silnici okresní třídy. Když se nad těmito příklady zamyslíme, intuitivně cítíme, že se u těchto náhodných jevů uplatňuje součet mnoha malých vlivů. Takzvaná centrální limitní věta dokazuje, že součty mnoha malých vlivů musí být normálně rozděleny. Důkaz této věty lze nalézt v každé jenom trochu slušně napsané knize o teorii pravděpodobnosti. Je dobré vědět, že typů rozdělení jsou desítky, ovšem normální rozdělení je určitě nejznámější, není se pak co divit, že laici si myslí, že málem všechny měřitelné náhodné jevy mají normální rozdělení. Není to ani zdaleka pravda, u těchto jevů se musí uplatnit součet mnoha malých vlivů. Také si je dobré uvědomit, že absolutní důkaz, že určitý náhodný jev má 100 % normální rozdělení je z principu nemožný právě proto, že se pohybujeme ve světě náhodných jevů. Ideální z hlediska matematického by bylo, kdybychom všechny malé vlivy na určitý náhodný jev nejen znali, ale dokázali je i matematicky popsat a znali bychom i přesnou míru vlivu na zkoumaný náhodný jev. To, že tomu tak není a nikdy nebude, je jenom dobře, protože pak máme 100 % jistotu, že svět nikdy nebude jeden veliký automat. Svět bez působení náhody nemůže být svobodným světem. Tím neříkám, že vám přeji, aby vám ve jménu svobody zítra při návratů domů zcela náhodou spadla na hlavu uvolněná taška, ale vzpomeňte si, co způsobila jedna taková náhodně uvolněná taška v románu Ben Hur od Lewise Wallaceho; spíš jste asi viděli slavný stejnojmenný oskarový film z roku 1959.

Obvykle mi matematický důkaz nějaké věty nestačí - třebaže dobře vím, že matematika je deduktivní disciplína -, chci odvozenou skutečnost alespoň intuitivně pochopit nebo si ji představit či v ideálním případě otestovat. Mám osobní zkušenost, že co si takhle nezafixuji, tak se mi to spolehlivě vykouří za několik dnů z hlavy. Matematikou se neživím, takže je to jev přirozený. Výsledek výše zmíněné centrální limitní věty jde poměrně lehce otestovat. Stačí k tomu mít alespoň tři hrací kostky a trochu času. 100 krát vrhneme hrací kostkou a do histogramu (na vodorovné ose každé možné hodnotě vrhu, tedy číslům 1 až 6, vyčleníme sloupeček o šířce 1 cm) na svislou osu vyneseme četnost výskytu možnýchčísel. Čísla 1 až 6 se vyskytují přibližně stejně často, takže po křivce ve tvaru zvonu ani vidu, ani slechu. Nevadí, vezmeme dvě kostky, teď možné hodnoty budou 2 až 12. Opět 100 krát vrhneme společně dvě kostky a opět nakreslíme histogram. Zjistíme, že se již histogram začíná podobat zvonu. A do třetice vezmeme tři kostky, teď možné hodnoty budou 3 až 18. Opět 100 krát vrhneme společně tři kostky a opět nakreslíme histogram. Zjistíme, že histogram je již velice podobný zvonu. A pokud máte dostatek času a hlavně trpělivosti můžete počet kostek dále zvyšovat. Histogram se bude více a více blížit normálnímu rozdělení. Ty kostky a jejich vzájemné ovlivňování se při vrhu jsou totiž simulací oněch malých vlivů.

Dost již obecného povídání. Podívejme se společně na obrázek č. 1. V bodě 1 máme mimo zmíněné Gaussovy křivky uvedené i základní kvantitativní charakteristiky, které při vyhodnocování náhodného jevu používáme. Především jsou to aritmetický průměr a směrodatná odchylka. Pokud vás problematika průměrů více zajímá, snad vás zaujme střípek, který jsem speciálně k tomu napsal již dříve. Většinou neznáme charakteristiky celého základního výběru, v našem případě by základním výběrem mohla být množina všech dospělých občanů ČR. Obvykle náhodnou proměnnou, např. IQ, zjišťujeme na menší množině prvků, často této množině říkáme výběrový soubor. Zde nebudeme řešit, jak má být tento soubor veliký, aby měl dostatečnou vypovídací hodnotu pro učinění závěrů na celý základní výběr, jednoduše budeme předpokládat, že nám kdosi hodnověrný dodal zmíněné charakteristiky, v našem případě aritmetický průměr a směrodatnou odchylku a navíc nám prozradil, že náhodná proměnná má normální rozdělení. Tahle informace je již dostatečná k tomu, abych dokázali vypočítat, kolik procent náhodné proměnné padne do určitého rozpětí, např. nás může zajímat, kolik osob má IQ vyšší než 130.

Než si ukážeme jak se takové výpočty dělají, není to nic těžkého, musíme si vysvětlit ještě jeden pojem, a to normální náhodná proměnná. O co jde? Když vyšetřujeme nějakou náhodnou proměnnou je přirozené, že její hodnoty jsou závisle na charakteru této náhodné proměnné. Kupříkladu výšku dospělých mužů udáváme v cm a měřením jsme zjistili, že nejčastější hodnota se pohybujeme kolem 175 cm, že nejčastější hodnoty inteligenčního kvocientu se pohybují kolem 100 jednotek IQ atd. Vidíme, že většinou se jedná o jiné jednotky a jiné kvantitativní hodnoty. Nemluvě o tom, že různé náhodné proměnné mohou mít různé směrodatné odchylky, takže Gaussova křivka obvykle nikdy není stejně štíhlá. Za této situace by bylo šílenstvím mít tabulky pro každý případ náhodné proměnné, náhodných proměnných kolem nás jsou tisíce. Bylo by šikovné mít jednu jedinou tabulku, s kterou bychom mohli pracovat pro jakoukoliv náhodnou proměnnou s normálním rozdělením. Vzpomněl jsem tabulku. Proč? Jde o to, že Gaussova křivka je popsaná explicitním vzorcem. Je pravda, že konkrétní výpočet hodnot podle tohoto vzorce není zcela jednoduchý, jedná se o výpočet ne zcela jednoduchého integrálu, ale to nás vůbec nemusí bolet, právě pro naše pohodlí jsou tyto hodnoty uvedeny v jedné, ne moc veliké, tabulce, která je uvedena v každé učebnici teorie pravděpodobnosti nebo statistiky a pochopitelně je k nalezení i na internetu. Převod všech možných náhodných proměnných na bezrozměrnou normovanou proměnnou, obvykle se značí Z a její konkrétní hodnoty z, se dělá jednoduchým vzorečkem. Ten je uveden na obrázku č. 1 v rámečku. Tímto zdánlivě umělým trikem dosáhneme toho, že můžeme využívat jednu jedinou tabulku standardizovaného normálního rozdělení pro všechny případy náhodných proměnných s normálním rozdělením.

Že se opravdu nejedná o žádný umělý trik, se lehce můžete přesvědčit i sami. Napište si nějakou číselnou řadu celých náhodných čísel, kupříkladu ať jich je 10 a každé číslo ať udává, kolikrát za den jste si vzpomněl(a) na milovanou (případně nenáviděnou či nemilovanou) osobu. Spočtěte si z této řady aritmetický průměr, a pak směrodatnou odchylku podle vzorce: odmocnina (suma (x – aritmetický průměr)2/10). Na obrázku č. 1 je uveden trochu jiný vzoreček, ve jmenovateli je uvedeno (n – 1), což má hlubší logiku a souvisí s tím, že pracujeme s výběrovým souborem. Možná jednou v samostatném střípku vysvětlím, proč tomu tak jest. Teď vytvoříme novou řadu z původní řady podle vzorečku uvedeném v rámečku na obrázku č. 1, tedy od každé původní hodnoty odečteme aritmetický průměr a vydělíme takto získaného čitatele směrodatnou odchylkou. Dostaneme opět řadu 10 čísel, která jsou ale jiná než čísla původní řady. Zkuste si spočíst aritmetický průměr a směrodatnou odchylku této nové řady. Budete možná překvapeni: aritmetický průměr vám vyjde 0 a směrodatná odchylka 1. Není to náhoda. Klidně si můžete vymyslet jinou číselnou řadu a postupovat stejně, výsledek dopadne pokaždé stejně, aritmetický průměr vám vyjde pokaždé 0 a směrodatná odchylka 1. Řadu, která vznikla z původní řady výše popsaným „normováním“, nazýváme standardizovanou řadou.

Ale co vlastně čísla z tabulky tabulky hodnot standardizované křivky normálního rozdělení udávají? Odpověď je prostá: plochu pod křivkou hustoty od mínus nekonečna po konkrétní hodnotu normované proměnné Z, přičemž celá plocha pod křivkou je rovna 1, pro názornost se podívejte opět na obrázek Gaussovy křivky. Na obrázku náhodnou proměnnou správně značíme X a její konkrétní hodnoty x, protože ještě neproběhlo normování.

Po teoretizování to chce konečně nějaký jednoduchý příklad. Mějme nějakou náhodnou proměnnou, která má aritmetický průměr 100 a směrodatnou odchylku 10, uznáte, že to jsou sympatická čísla pro snadné počítání. Spočteme jaká je pravděpodobnost, že hodnoty náhodné proměnnou spadnou do rozpětí: a) aritmetický průměr ± 1*směrodatná odchylka, b) aritmetický průměr ± 2* směrodatná odchylka, c) aritmetický průměr ± 3* směrodatná odchylka. Výpočet je uveden na obrázku č. 1 v bodě č. 2. Nejdřív musíme hodnoty náhodné proměnné X převést výše popsaným normovacím trikem na hodnoty normované náhodné proměnné Z. V druhém kroku vyhledáme příslušné hodnoty proměnné Z v tabulce normálního rozdělení, tabulku zde neuvádím, ale stačí do vyhledávání na google.cz napsat heslo „normální rozdělení tabulka“ a nabídnou se vám jich desítky, doporučuji používat tu, která hodnoty používá na 4 desetinná místa. Teď jde již jenom o to, co s hodnotami z tabulek spáchat. Ukážeme si to např. na příkladě a). Otázka v tomto případě zní: jaká je pravděpodobnost že hodnoty náhodné proměnnou spadnou do rozpětí aritmetický průměr ± 1*směrodatná odchylka. Hodnoty normované proměnné Z nám vyšly –1 a 1. Což je přirozené a jistě ne náhoda, protože chceme zjistit pravděpodobnost náhodné proměnné v rozpětí od aritmetický průměr ± 1*směrodatná odchylka, z čehož automaticky vidíme, že používanou jednotkou na ose proměnné Z je právě směrodatná odchylka, tedy žádné cm, kg, eura, jednotky IQ, papoušci, jak v jedné kreslené pohádce, ale pokaždé a vždy jednotkou je směrodatná odchylka. Nás zajímá plocha pod křivkou hustoty od aritmetický průměr ± 1*směrodatná odchylka. Tabulka nám říká, že od mínus nekonečna k +1 je táto plocha 0,8413 a od mínus nekonečna do –1 plocha je 0,1587. Pro představu se podívejte na křivku normálního rozdělení. Máte pravdu, tyto dvě hodnoty od sebe odečteme a dostaneme hledanou plochu, což je současně i pravděpodobnost, že náhodná proměnná spadne do rozpětí aritmetický průměr ± 1*směrodatná odchylka. Teď dva dotazy. Jaká je průměrná hodnota normované proměnné Z. Správně 0, vždyť měříme doleva a napravo v směrodatných odchylkách . U číselné normované řady tomu nebylo jinak. Jaká je směrodatná odchylka normované proměnné Z? Už to slyším: 1. Tak správně. Jinak výpočet příkladu b) a c) je obdobný.

Co nám náš výsledek říká? Poměrně důležitý závěr. Pokud známe aritmetický průměr a směrodatnou odchylku náhodné proměnné s normálním rozdělením, tak s velikou pravděpodobností víme, že do rozpětí aritmetický průměr ± 1*směrodatná odchylka padne 68,26 % hodnot náhodné proměnné, do rozpětí aritmetický průměr ± 2*směrodatná odchylka padne již 95,44 % hodnot náhodné proměnné a konečně do rozpětí aritmetický průměr ± 3*směrodatná odchylka téměř všechny hodnoty náhodné proměnné. Tomuto pravidlu se říká pravidlo třech sigma. Proč? Protože v teorii pravděpodobnosti se směrodatná odchylka značí řeckým písmenem sigma. Také se pak není co divit, že tabulky normované proměnné Z jsou uváděny pouze do ± 3,4. Pak nárůst plochy je tak nepatrný, že to nestojí ani za řeč.

Konečně na obrázku č. 2 jsou výpočty k našemu IQ. Opět nám nějaký měřič musel dodat základní údaje: průměr je 100 jednotek IQ, směrodatná odchylka 15 (někdy se uvádí i 16) a rozdělení je normální. Zadání příkladů je uvedeno pod bodem č. 1, pro přehlednost jsou vpravo uvedeny výsledky. Vlastní výpočet je uveden v bodě č. 2. Jaké jsou závěry z našich výpočtů? Podle mne vcelku optimistické. 49,08 %, tedy přibližně polovina dospělých má IQ v rozpětí 90 až 110. Takže pokud naše IQ spadá do tohoto rozpětí, neměli bychom si příliš stěžovat na osud, jak mnozí z nás s oblibou činí. Pokud máte IQ nad 130, je potřeba zajít každý den do kostela a poděkovat Hospodinovi, že byl k vám tak velkorysý, jelikož pouze 2,28 % dospělé populace má tak vysoké IQ. Pokud máte IQ pod 80, nezoufejte, nemusí to být vůbec pravda, jelikož objektivní test pro určení IQ neexistuje a v principu ani nikdy nemůže být vymyšlen.

Než naše povídání o normálním rozdělení s aplikací na IQ končí, ještě dvě malé poznámky. První. IQ není vše, velice důležitá je i manuální zručnost a praktičnost. Není náhoda, že dnes chybí tisíce šikovných řemeslníků a je přebytek intelektuálů, viz jejich definici výše, pedagogů a různých teoretiků, a nejednou s vysokým IQ. Život je totiž instituce výsostně praktická, a proto miluje především praktiky. Druhá. Často se diskutuje o tom, zda průměrné IQ lidstva roste nebo klesá. Názory jsou na to různé. Osobně jsem optimista, třebaže se často uvádí, že klesá kvalita mužského spermatu, což je dáno hlavně faktory souvisejícími s kvalitou životního prostředí, stravou a nedostatkem pohybu. Na druhé straně působí pozitivně na kvalitu lidského genofondu skutečnost, že lidé se celosvětově promíchávají a jsou nuceni, či už chtějí, nebo nechtějí, řešit inteligenčně složitější problémy, než tomu bylo v minulosti. Toť vše.

V Brně 10. října 2015.

Domů | Prolog 2001: Vesmírná odysea | Nejen básně v próze | Střípky