Zákon velkých čísel, Polanský

Zákon velkých čísel

Dušan Polanský

Teorie pravděpodobnosti se zabývá náhodou, a jak všichni dobře víme, náhoda v našich životech hraje docela velikou roli již od samotného aktu početí v matčině lůně. Tedy s jednou jedinou výjimkou, alespoň podle Jeremiáše (1-5): „Než jsem Tě zformoval v matčině lůně, znal jsem Tě. Ještě než jsi přišel na svět, posvětil jsem Tě; národům učinil jsem Tě prorokem“. V našich životech je to složitější, někomu náhoda přeje, někomu nepřeje. Podle teorie pravděpodobnosti tomu ani nijak jinak nemůže být. Na náhodě jsou založeny např. hazardní hry, velikou roli hraje náhoda ve fyzice mikrosvěta, v biologii, botanice. Takže se ani nelze moc divit, že teorii pravděpodobnosti věnují velikou pozornost matematici, fyzici, biologové, botanici, ale v neposlední řadě i hazardní hráči.

Pomyslnou třešničkou na dortu teorie pravděpodobnosti je zákon velkých čísel. Je to docela známý zákon nejen různým odborníkům, kteří teorii pravděpodobnosti přednáší nebo ji v praxi využívají, ale i laikům. Je ale pravda, že laikům je známý spíše na intuitivní úrovni na základě běžné životní zkušenosti než coby matematická věta. Tento zákon tvrdí, že u mnoha zcela nezávislých a narůstajících opakování náhodného experimentu musí být relativní četnost a pravděpodobnost konkrétní náhodné události stále bližší.

Kupříkladu když budeme poctivě házet „necinknutou“ mincí a budeme počítat, kolikrát nám padla hlava, tak se počet padnutí hlavy bude blížit při většíma větším počtu hodů k polovině hodů. K polovině proto, že podle teorie pravděpodobnosti je pravděpodobnost hození hlavy při jednom hodu přesně 0,5 a střední hodnota počtu hodů se získá vynásobením počtu hodů právě zmíněnou pravděpodobností. Kupříkladu při 500 pokusech střední hodnota bude 500*0,5 = 250. Jenom si připomeňme, že relativní četnost v našem příkladu vypočteme tak, že vydělíme počet příznivých hodů, tedy v našem případě počet padnutí hlavy, celkovým počtem hodů. Kupříkladu hodíme mincí 80 krát a hlava nám padne 36 krát, pak relativní četnost je 36/80 = 0,45.

Jako u všeho na světě nejlepším důkazem jakékoliv teorie je potvrzení praxí. Když se budete nudit, zkuste si hodit mincí kupříkladu 1 000 krát a značte si čárkami, kolikrát vám padne hlava. Asi 500 krát to přesně nebude, třebaže vyloučit to zcela nelze, ale s velikou pravděpodobností to bude číslo blízké 500. Podle zákona velkých čísel to funguje tak, že sice absolutní vzdálenosti skutečných výskytů od teoreticky předpovězených rostou, ale relativní četnost neomylně šplhá k teoretické hodnotě dané teorií pravděpodobnosti. Pro lepší pochopení si uvedeme několik fiktivních příkladů.

Budeme házet mincí, přičemž víme, že výsledek hodu mincí má náhodný charakter a že hody jsou nezávislé. Hodíme mincí 100 krát. Podle teorie pravděpodobnosti střední hodnotu naší náhodné proměnné vypočteme tak, že vynásobíme počet všech hodů pravděpodobností padnutí hlavy, což nám dá 100*1/2 = 50 padnutí hlavy. Nech hlava nám padne 58 krát, pak relativní četnost je 0,58 a absolutní vzdálenost měřená v hodech od teoretické střední hodnoty 50 je 8. Teď hodíme mincí 1 000 krát, nech nám hlava padne 540 krát, takže relativní četnost je 0,54 a absolutní vzdálenost od teoreticky vypočtené střední hodnoty 500 je 40. Hodíme mincí 10 000 krát, nech nám hlava padne 4 850 krát, takže relativní četnost je 0,485 a absolutní vzdálenost od teoretické střední hodnoty 5 000 je 150. Vidíme, že relativní četnost padnutí hlavy se s narůstajícím počtem pokusů neomylně blíží k teoretické hodnotě padnutí hlavy, tedy k 0,5, ale absolutní vzdálenosti skutečných výskytů sledované události, tedy padnutí hlavy, od teoreticky vypočtené střední hodnoty rostou. Ale i tohle vše opět funguje s velikou pravděpodobností, tedy klidně se nám může stát, že pokud hodíme mincí opět 10 000 krát, absolutní vzdálenosti skutečných výskytů sledované události od teoreticky vypočtené střední hodnoty bude jenom 30, tedy menší než při 1 000 hodech. Ovšem pokud 10 000 hodů bychom zopakovali několikrát, např. 100 krát (což je dost těžko realizovat ručně, spíš bychom použili počítačový program) a udělali bychom aritmetický průměr absolutních vzdáleností od teoretické hodnoty, s velikou pravdděpodobností tento aritmetický průměr absolutních vzdáleností bude větší než v případě 1 000 hodů.

Tyhle skutečnosti si jed dobré uvědomit kupříkladu při hazardních hrách. Pokud v ruletě padla za sebou černá barva 4 krát, vůbec to neznamená, že v dalším pokusu s velikou pravděpodobností padne barva červená. Stát se to může, ale zákon velkých čísel nám nic takového neříká! On pouze tvrdí, že s narůstajícím počtem roztočení rulety absolutní vzdálenost skutečných výskytů červené barvy od teoretické hodnoty, tedy od poloviny roztočení rulety, roste, a relativní četnost výskytu červené barvy neomylně šplhá k vypočtené hodnotě pravděpodobnosti, tedy v našem ruletovém příkladu k 0,5.

Zákon velkých čísel je matematicky dokázán za přesně definovaných předpokladů. Důkaz lze nalézt v každé solidnější učebnici či monografii teorie pravděpodobnosti. Má to ale jeden malý háček, důkaz předpokládá docela slušnou znalost diferenciálního a integrálního počtu. Protože coby laik nepíšu svoje texty pro odborníky – na to jednoduše nemám – ale pro laiky, zde si uvedeme důkaz, v němž vystačíme s běžnou matematikou na úrovni cca 1. třídy střední školy. Mezi námi, příliš rafinované matematické postupy svým formalismem někdy málem dokonale mlží hlavní myšlenku důkazu. I sebesložitější důkaz být měl mít hlavní myšlenku pochopitelnou selským rozumem.

Problém je, že i náš výklad předpokládá elementární znalost teorie pravděpodobnosti na úrovni střední školy. Abych čtenáři usnadnil pochopení výkladu, pokusím se být co nejvíce srozumitelný a nebudu spěchat, čímž ale text bude rozsáhlejší. Prostě i zde platí, že něco je za něco. Pro větší názornost jsem na konec každého dílčího bloku, kromě posledního, zařadil vyřešený příklad.

Ve všech našich úvahách budeme uvažovat pouze nezávislé náhodné proměnné, tedy takové proměnné, které se nebudou navzájem ovlivňovat. Logiku to má, kupříkladu v našem příkladu s mincí každý hod jednotlivé mince lze považovat za zcela nezávislý od předchozího hodu, potažmo předchozích hodů. Sice nevíme, co v konkrétním hodu padne, ale máme naprostou jistotu, že teoretická pravděpodobnost pádu hlavy nebo orla je při každém hodu stejná, tedy 0,5.

Na obrázku č. 1 (číslo obrázku zjistíte po najetí myší na obrázek) jsou uvedeny tři charakteristiky náhodných proměnných, s nimiž budeme pracovat. Jsou to: střední hodnota, rozptyl (někde se potkáte s názvem střední kvadratická odchylka) a směrodatná odchylka. Definice by měly být jasné z obrázku. V bodě č. 4 jsou vypočteny číselné hodnoty těchto charakteristik pro klasickou hrací kostku. Popravdě jejich vypovídací hodnota je v tomto případě pramalá, ale účelem tohoto příkladu je pouze ukázat, jak se charakteristiky prakticky počítají.

Na obrázku č. 2 pod bodem č. 1 je uveden bez důkazu (není moc složitý) důležitý teorém o směrodatné odchylce, což je velice často používaná charakteristika náhodné proměnné (veličiny). Důležité je si uvědomit, že zde uvažujeme o n náhodných proměnných. Je pak docela rozumně pochopitelné, že i jejich součet musí být náhodná proměnná. V bodě č. 2 je uveden příklad, který ukazuje, jak se E(X) a Q(X) prakticky spočtou v případě střelby. Vypálíme n krát a pokaždé pravděpodobnost zásahu je p. V bodě č. 3 jsou spočteny konkrétní hodnoty E(X) a Q(X) pro 1 000 výstřelů a pravděpodobnost zásahu terče 0,5. Směrodatná odchylka nám vyšla 16. Co to prakticky znamená? Že s velikou pravděpodobností při tisícovce ran za dané hodnoty pravděpodobnosti zásahu počet zásahů do cíle se bude pohybovat v rozmezí 484 až 516.

Průběžná poznámka. Nejstarší zákon velkých čísel publikoval Jacob Bernoulli v roce 1713. Dokázal, že pokud opakovaně konáme náhodný pokus, jehož výsledkem je 1 (úspěch) s pravděpodobností p a 0 (neúspěch) s pravděpodobností 1 − p , tak střední hodnota z n výsledků pokusu konverguje s rostoucím n k np a rozptyl k p(1 − p). Vidíme, že nás tento výsledek po zvládnutí výpočtů na obrázku č. 2 ani moc nepřekvapuje! Není také náhoda, že takovým pokusům říkáme bernoulliovské. Ovšem naším cílem je všeobecnější důkaz zákona velkých čísel, důkaz, jehož autorem je vynikající ruský matematik Pafnutij Ľvovič Čebyšev (1821–1894).

Než přistoupíme k vlastnímu důkazu zákona velikých čísel, představme si, že měříme nějakou veličinu a měříme ji n krát. Z těchto měření uděláme obyčejný aritmetický průměr a ptáme se, jaký bude aritmetický průměr středních hodnot a aritmetický průměr směrodatných odchylek? Tuhle otázku si ale položíme za speciálního předpokladu: zatím budeme předpokládat, že všechny náhodné proměnné mají stejnou střední hodnotu i směrodatnou odchylku, teprve na konci našeho povídání se tohoto omezujícího předpokladu zbavíme.

Jak to s naší zvědavostí dopadlo, můžeme vidět na obrázku č. 3 v bodě č. 1. Pro aritmetický průměr středních hodnot se žádný zázrak nekonal, výsledná střední hodnota aritmetického průměru je stejná jako dílčí střední hodnoty jednotlivých proměnných, které v našem příkladu jsou stejně veliké. Ovšem překvapení nás čeká u směrodatné odchylky. Výsledný aritmetický průměr směrodatných odchylek je výrazně menší než dílčí směrodatné odchylky jednotlivých měření, a to dokonce srqrt(n) krát menší. Poznámka: sqrt je běžná zkratka pro odmocninu např. v programovacích jazycích.

Jako příklad k těmto závěrům jsem si vymyslel absurdní situaci: měření délky fotbalového hřiště obyčejným dřevěným metrem, a to dokonce 100 krát. Pro fotbalové neznalce uvádím, že délka fotbalového hřiště, ale i šířka nejsou pevně dány, délka se může pohybovat v rozmezí 90 až 120 metrů a šířka dokonce od 45 do 90 metrů. Popravdě hřiště široké 90 metrů si neumím představit, a to jsem fotbal hrál do 52 let. Jak to s měřením dopadlo, je vidět v bodě č. 2.

Obecná poznámka k směrodatné odchylce Q(X). V příkladu s hřištěm jsme Q(X) zadali jaksi od oka, ale obecně Q(X) není vůbec jednoduché určit, k jejímu určení musíme znát zákon rozložení náhodné proměnné nebo alespoň jeho přibližný charakter. Kupříkladu u inteligenčního kvocientu, zkráceně IQ, jenž je definován jako poměr mentálního věku a věku skutečného vynásobeného číslem 100, literatura uvádí pro Q(X) hodnoty 15 nebo 16. Tyto hodnoty byly určeny na základě testování mnoha výběrových souborů osob. V našem textu všude předpokládáme, že Q(X) té které náhodné proměnné odkudsi známe. V tomto textu si hodnoty Q(X) jednoduše vymýšlím.

Zatím jsme se jenom seznamovali se základními charakteristikami teorie pravděpodobnosti a vysvětlili si chování aritmetického průměru E(X) a Q(X) v případě více náhodných proměnných za předpokladu, že všechny proměnné mají stejné E a Q. Teď se pokusíme odpovědět na rafinovanější otázku: Jaká je pravděpodobnost toho, že pokud hodím mincí 1 000 krát a znám směrodatnou odchylku, nech je např. 15, jaká je pravděpodobnost toho, že počet padnutí hlavy se bude pohybovat v intervalu od 450 do 550. Intuitivně cítíme, že tahle pravděpodobnost je veliká a že k určení této pravděpodobnosti potřebujeme znát hodnotu E(X) a Q(X) potažmo D(X), protože Q(X) je druhá odmocnina z D(X). Spočíst E(X) v případě hodu mincí, není žádný problém, ale určení Q(X) již není až tak jednoduché, viz poznámka o odstavec výše. Pokud E(X) a D(X) známe, na podobné otázky nám dává odpověď Čebyševova nerovnost. Kvantitativní odhady získané pomocí Čebiševovy nerovnosti jsou kapánek hrubší, ale pro náš účel bohatě postačí. Jenom si uveďme, že v specializované literatuře lze nalézt přesnější odhady než nám dává Čebiševova nerovnost.

V dalších výpočtech několikrát využijeme známý poznatek, že pokud pravděpodobnost nějakého jevu je p, tak pravděpodobnost opačného jevu je 1–p. Dále fakt, že pokud P(...) > k, tak 1 – P(...) <= k, potažmo pokud P(...) < k, tak 1 – P(...) >= k , přičemž platí: 0 =< k <= 1.

Na obrázku č. 4 jsou pod bodem č. 1 uvedeny její dvě možné a ekvivalentní formulace Čebiševovy nerovnosti. Jak se s Čebiševovými nerovnostmi prakticky počítá, je uvedeno v bodě č. 2. Jsou zde spočteny dva příklady. První dává odpověď na otázku položenou v odstavci výše. Druhý příklad ukazuje, že při používání Čebiševovy nerovnosti musíme být opatrní, pokud nebudeme, budou pro nás různé vzorce jenom jakousi hrou s čísly. Bohužel právě v aplikacích teorie pravděpodobnosti je tohle riziko docela veliké. V bodě č. 3 je uvedena jiná formulace Čebiševovy nerovnosti uvedené výše pod označením 1a. Zkuste se nad ní zamyslet, zdá se mi názornější.

U hodu mincí získané výsledky silně závisely na počtu hodů. Je proto logické, že by se nám hodilo, kdybychom počet hodů, pokusů měření apod. nějak vpašovali do Čebyševovy nerovnosti. Že to není až tak složité, ukazuje obrázek č. 5. Zde předpokládáme, že střední hodnota s a směrodatná odchylka q jsou pro všechny náhodné proměnné stejné. V bodě č. 1 je v rámečku Čebyševova nerovnost v tvaru, v němž figuruje počet pokusů. V bodě č. 2 je příklad, který nám ukazuje, že když budeme chtít dosáhnout jakékoliv malé odchylky aritmetického průměru všech náhodných proměnných od střední hodnoty, že se nám to vždy podaří. Jak? Zvyšováním počtu pokusů! Vzpomeňme si na naše hody mincí. Pokud chceme, aby se počet padnutí hlavy více a více blížil k polovině všech hodů, musíme zvyšovat počet hodů. V bodě č. 3 je formulován zákon velkých čísel plynoucí z našich vývodů, zatím pouze pro případ, že střední hodnota s a směrodatná odchylka q jsou pro všechny náhodné proměnné stejné.

Na posledním obrázku, č. 6, jsme opustili speciální předpoklad, že střední hodnota s a směrodatná odchylka q jsou pro všechny náhodné proměnné stejné. Stačí, když dokážeme určit horní ohraničení všech směrodatných odchylek všech náhodných proměnných, na obrázku je tahle horní ohraničení označeno jako b. Principiálně tuto hodnotu určit vždy dokážeme. Výsledný vzorec opět s využitím Čebyševovy rovnice je uveden v rámečku v bodě č. 1. Figurují v něm dle očekávání: počet pokusů a horní ohraničení všech směrodatných odchylek b. V bodě 2. je vysloven zákon velikých čísel pomocí aparátu, který jsme zde používali. Sofistikovanější znění toho zákona lze nalézt v podrobných učebnicích či monografiích.

Jsem si vědom toho, že text je trochu únavně dlouhý a matematicky ne zcela úplně košer, ale pokud jste se dopracovali až sem, možná že se vám podařilo alespoň trochu pochopit nejen krásu teorie pravděpodobnosti, ale i její rafinovanosti. Pokud vás můj výklad neuspokojil, zbývají vám dvě možnosti, buď se na teorii pravděpodobnosti vykašlat, nebo sáhnout po nějaké kvalitní monografii či učebnici teorie pravděpodobnosti. A to je z mé strany vše.

Napsáno v Brně v první polovině července. Publikováno rovněž tam 18. července 2018.

Domů | Prolog 2001: Vesmírná odysea | Nejen básně v próze | Střípky