Thomas Bayes a zánět zrakového nervu

Dušan Polanský

Se starší dcerou, oftalmoložkou, jsme si krátce povídali o souvislostech zánětu zrakového nervu a roztroušené sklerózy. Chvilkou rozumím doopravdy chvilku, tak asi minutu a půl, jelikož vnoučata více mudrování zatím nedovolí. Její otázka byla přirozená: „Dá se alespoň trochu věrohodně spočíst z přibližných statistických údajů, jaká bude pravděpodobnost toho, že pokud pacient bude mít zánět zrakového nervu, onemocní v budoucnu i roztroušenou sklerózou?“ Podobných otázek je kolem péče o zdraví hodně. Kupříkladu ročně na zahrádce chytnu cca 10 klíšťat, jaká je pravděpodobnost, že onemocním klíšťovou encefalitidou. To druhé bych si dokázal spočíst na základě informací, které jsou známé, ale nebudu to dělat, jelikož pravděpodobnost by vyšla docela slušná a pak bych začal běhat na odběry a na různá vyšetření. Raději jsem se svěřil do rukou osudu. Ale teď již zpět od klíšťat k očím. Dceři jsem stihnul nakonec jenom sdělit, že k hodnotě, ke které se chce dopracovat, by se možná dalo dostat Bayesovým vzorcem. „A co je to za vzorec, to slyším poprvé?“ Ale jak chcete něco vysvětlit, když malá Jindra křičí, že jí mám vyprávět pohádku – čtení nemám povoleno, zásadně musím vyprávět – a ještě k tomu se Vojtíšek rezolutně dožaduje nošení. „Víš co, napíšu k tomu krátké povídání, dám si to na stránky, do emailu mi pošly údaje, co k tomu máš, a já něco vyprodukuji.“ No a něco jsem vyprodukoval.

Základní povídání o pravděpodobnosti jsem již napsal. Pokud chcete dobře porozumět našemu povídání, nebylo by zlé, zvládnout tento text. Než se dopracujeme ke vzorečku anglického duchovního Thomase Bayese (1701(?) – 1761), říkáme mu Bayesův vzorec, který k řešení našeho problému použijeme, musíme si vysvětlit, co je to podmíněná pravděpodobnost. Jinak i v střípku, na který se odvolávám, se již s touto pravděpodobností neformálně pracovalo, ale schválně jsem tento pojem matematicky nezavedl, abych začátečníka neodradil množstvím nových pojmů.

Schéma výpočtu v klasické teorii pravděpodobnosti je triviální. Někdo se mě zeptá na pravděpodobnost nějakého jevu. Co udělám? Spočtu zlomek, kde v čitateli je počet zkoumanému jevu příznivých výsledků a ve jmenovateli počet všech možných výsledků. Například při poctivém házení „necinknutou“ hrací kostkou (pravidelný šestistěn) je počet všech možných výsledků roven 6, může padnout 1 nebo 2 nebo 3 nebo 4 nebo 5 nebo 6. Chci znát pravděpodobnost pádu šestky. Do čitatele dosadím 1, jelikož pouze jeden výsledek je příznivý pádu 6, a do jmenovatele 6, tolik je všech možných výsledků, takže pravděpodobnost pádu šestky je 1/6. To je celá idea klasické teorie pravděpodobnosti. Vše ostatní jsou již jenom detaily a složitosti kolem.

Pokud musím uvažovat i podmíněnou pravděpodobnost, výpočet je obvykle o něco složitější, ale pokud umím spočíst počet příznivých případů k vyšetřovanému jevu a celkový počet možných případů, stále se pohybujeme ve světě klasické teorie pravděpodobnosti. Malý příklad. V urně jsou čtyři koule: žlutá, modrá, bílá a červená. Jaká je pravděpodobnost, že vytáhneme červenou. Jistě, máte pravdu, přesně na chlup 1/4. Představme si, že táhneme, ale netrefíme se, vytáhneme bílou, ale nevrátíme ji do urny. Pokud bychom ji vrátili, pravděpodobnost tažení červené koule v druhém tahu by se nezměnila. Jaká je pravděpodobnost vytažení červené koule v druhém tahu? Protože v urně zůstaly jenom tři koule, tak 1/3. Vidíme, že je jiná než před prvním tahem. Je to proto, že pravděpodobnost v druhém tahu je podmíněna výsledkem prvního tahu, tedy informací získanou z minulosti. Zapisuje se to nějak takhle: P(tažení červené koule v druhém tahu | když v prvním tahu byla tažena koule bílá) = 1/3. Za svislicí jsme napsali jev, který ovlivňuje, podmiňuje, pravděpodobnost jevu před svislicí. I přesto, že v tomto příkladu pracujeme s podmíněnou pravděpodobnosti, náš výpočet probíhal přesně podle pravidel klasické teorie pravděpodobnosti.

Ovšem někdy do hry vstupuje prvek nejistoty, některou pravděpodobnost musíme odhadnout jenom intuitivně na základě ne zcela přesných a ověřených podkladů. V běžném životě se s takto podmíněnou pravděpodobností potkáváme poměrně často. Něco máme v plánu udělat, ale nově získaná informace, třebaže cítíme, že není zcela přesná, náš plán může změnit. Názorněji. Dívka se zamiluje do staršího bohatého pána, který jí tvrdí, že je rozvedený. Ona mu uvěří. Pán si užívá, tedy dívka taky, ale každý trochu jinak. Pán více sexu, dívka více bohatství. Dívka si říká: „Vždyť co, nehnusí se mi, pracháč je, nebudu muset makat, klidně se za něho provdám.“ Její odhodlání je málem 100 %, řekněme 95%. Jenomže pak to rupne, dívka se nějak dozví, že pracháč je ženatý. Ten jí sice slibuje, že se rozvede, aby byla trpělivá, a pak vede kolem toho takové ty řečičky o složité rodinné situaci, komplikovaných majetkových poměrech atd. Důvod je prostý, získat čas, aby si ještě užil krásného, mladého těla. Jenomže naše pragmatická dívka mu již moc nevěří, pravděpodobnost sňatku za nové situace odhaduje tak na 20 %. Původní pravděpodobnost po získání nové informace, v tomto případě, že muž je ženatý, se výrazně změnila. Zapsali bychom to nějak takto: P(vdám se za starého pracháče | je ženatý) = 20 %. Předtím to vypadalo optimističtěji: P(vdám se za starého pracháče | je rozvedený) = 95%. Svislice opět odděluje pravděpodobnost, na kterou se ptáme, od informace, kterou máme k dispozici a která ovlivňuje pravěpodobnost, která nás zajímá. Čteme nějak takto: pravděpodobnost toho, že se vdám za pracháče poté, co jsme se dozvěděla, že je ženatý, je cca 20 %. Jenomže se může objevit nová informace, která může názor dívky změnit, kupříkladu se dozví, že manželka prý má přítele. Sice zdroj této informace není zcela spolehlivý, ale pravděpodobnost sňatku z pohledu dívky se tím pravděpodobně zvýší.

Než se pustíme do příkladu se zánětem zrakového nervu několik technických poznámek. Pravděpodobnost jakéhokoliv jevu je reálné číslo od 0 do 1. Pravděpodobnost jevu nemožného je 0, jevu jistého je 1. My pracujeme i s procenty, protože často je v běžné mluvě používáme. Kdo z nás v životě nevyslovil větu: „Spolehni se na 100 procent“? 100 % je 1, 0 % je 0. Převod z jednoho vyjádření na druhé a opačně je jednouchý. Například pravděpodobnost 20 % znamená 0,2. Pravděodobnost 0,99 je 99 %.

Teď konečně k příkladu kolem očí. Víme, že roztroušenou sklerózu (dále RS) má v Evropě 50-200 mužů či žen na 100 000 obyvatel. Rozhodl jsem se pro hodnotu 100, abych s nějakou konkrétní hodnotou pracoval. Riziko, že je pacientovi po zánětu zrakového nervu (dále ZN) diagnostikována do 10 let RS je 38 %. Tento údaj jsem si upravil na 40 %, tím se období 10 let o něco prodlouží, odhadl jsem to na 12 let. Proč ne, je to jenom příklad. Co nás zajímá? Chceme zjistit, jaká je pravděpodobnost v procentech, že když budu mít ZN, dostanu do 12 let RS. Pěkně nepříjemná otázka. Zapsáno v matematické notaci P(RS | ZN) = ? %. Teď již budeme společně sledovat výpočet na obrázku. Uvidíme, zda se nám ? podaří nahradit konkrétním číslem.

Pod číslem 1 v kroužku je graficky znázorněna naše výchozí situace. Zkratky RS a ZN již známe, pruh nad zkratkou znamená logické NE, tedy jev opačný k jevu zapsanému bez pruhu. Bohužel v jazyce HTML nejde dát pruh nad písmeno, tak to musím takhle okecat. Připomeňme si, že pracujeme se vzorkem 100 000 obyvatel Evropy, tento počet je vyjádřen velikým písmenem N. Malé x je počet pacientů, kteří dostanou ZN a do 12 let onemocní RS. Malé m je počet pacientů s RS. Malé k je počet pacientů, kteří onemocněli ZN. To, že na 100 000 obyvatel připadá 100 případů RS vyjádříme v procentech hodnotou 0,1 %, pokud 100 % bereme za 1, pak 0,1 % je při vyjádření reálným číslem 0,001. Pravděpodobnost, že pacient RS nemá je 99,9 % neboli 0,999, to proto, že součet pravděpodobnosti určitého jevu a jevu k němu opačnému je vždy 1.

Pod číslem 2 v kroužku jsou dva výpočty stejné pravděpodobnosti: P(RS & ZN). Pokaždé počítáme pravděpodobnost, že pacient onemocněl ZN a současně (pro logický součin používáme znak &) do 12 let onemocněl RS. Rozdíl je pouze v tom, že jednou ve výpočtu kouzlíme s hodnotou m a po druhé s hodnotou k. Jelikož P(RS & ZN) = P(RS & ZN), můžeme do rovnosti dát výsledek našich dvou výpočtů, z čehož již lehce odvodíme Bayesův vzorec. Ten udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností, opravdu je tomu tak i našem výpočtu, vzorec nám udává, jak P(RS | ZN) souvisí s přesně opačnou pravděpodobností P(ZN | RS). Jenomže zrada, na pravé straně ve jmenovateli zlomku se vyskytuje výraz P(ZN), to znamená, že bychom měli vědět, kolik obyvatel z 100 000 onemocní ZN. Tento údaj sice neznáme, ale nějak si pomůžeme. V tomto bodě do hry vstupují nejisté, ne zcela přesné informace či znalosti. Ale o tom bayesovská statistika právě je. Zatímco klasická statistika stanoví pravděpodobnost na základě přesných hodnot počtu případů příznivých k zkoumanému jevu a všech možných případů, bayesovská statistika se nabízí jako alternativa ke klasické teorii pravděpodobnosti tam, kde tento podíl není možné určit přesně. Jejím královstvím je svět nejistých znalostí. Ty se ovšem časem mohou postupně zpřesňovat, a tím se bayesovské výpočty stávají věrohodnějšími a věrohodnějšími.

Pod číslem 3 v kroužku je vzorec pro výpočet P(ZN). Vypadá divoce, ale je docela logický. P(ZN) je součtem pravděpodobnosti, že člověk onemocní ZN, když do 12 let onemocní RS a pravděpodobnosti, že člověk onemocní ZN, když RS do 12 let neonemocní. Ale přesto odhadu jedné nejisté znalosti neuniknu, musím subjektivně, ale přitom maximálně kvalifikovaně odhadnout P(ZN | nemám RS). Odhadnul jsem ji schválně dost pesimisticky, jenom na 10 %. Tohle je nejproblematičtější odhad, ale časem můžeme získat z odborných publikací přesnější údaje, pak bychom do výpočtu, k němuž se za chvíli dostaneme, dosadili nejen posledně zmíněný, ale i jiné přesnější údaje. Odhaduji, že P(ZN | nemám RS) bude v procentech nakonec vyšší, ale tento údaj musí potvrdit lékaři na základě získaných výsledků z vyšetření pacientů.

Pod číslem 4 v kroužku je již vlastní výpočet s konkrétními čísly. Jaký je výsledek? Spočetli jsme na základě údajů určité přesnosti a spolehlivosti, že když teď dostanu zánět zrakového nervu, tak pravděpodobnost toho, že do 12 let onemocním roztroušenou sklerózou je přibližně 0,4 %. Pokud se časem vstupní údaje zpřesní, výsledek bude také přesnější.

Jedno schéma využití Bayesovy věty v medicíně lze popsat takto. Jsou známy pravděpodobnosti nějakých nemocí P(N1), P(N2) až P(Nn). Dále jsou ze zkušenosti známy podmíněné pravděpodobnosti nějakého jevu S (symptom či komplex symptomů) za podmínky, že nastala choroba Nk, tj. jsou známy podmíněné pravěpodobnosti P(S | N1), ... ,P(S | Nn). Bayesův vzorec nám umožňuje z těchto údajů vypočíst aposteriorní pravděpodobnost P(Nk | S) pro každé k.

V druhém medicínském schématu jde o zjištění pravděpodobnosti nemoci N na základě symptomů S1 až Sk. Lékař na základě zkušenosti (nebo publikovaného know-how) kvalifikovaně (tedy nepodívá se do okna a nenapadne ho nějaké číslo) odhadne pravděpodobnosti symptomů P(S1) až P(Sk) spojených s nemocí N. Součet pravděpodoností P(S1) až P(Sk) musí být 1! Nějaký čas sleduje výskyt nemoci N a provede objektivní vyhodnocení (což nemusí být triviální) původní relace mezi symptomy a výskytem nemoci N, tedy určí P(N | S1) až P(N | Sk), klidně se přitom může stát, že pří sledování se určitý symptom vůbec neobjeví, ačkoliv původně se tak předpokládalo, tedy ve výsledku součet pravděpodoností P(N | S1) až P(N | Sk) nemusí být 1! Na základě takto získané zkušenosti provede korekci původních pravděpodobností symptomů, tedy z Bayesova vzorce vypočte P(S1 | N) až P(Sk | N). A tyhle hodnoty se stanou novými pravděpodobnostmi P(S1) až P(Sk) výskytu symptomů při nemoci N. Tento cyklus se může opakovat několikrát podle nově získaných poznatků.

V třetím schématu jde o to, že známe pravděpodobnosti nemocí P(N1), ... , P(Nn). Tyto pravděpodobnosti chceme zpřesnit, proto provedeme dodatečně s krát test (T). O testě ze zkušenosti víme, že pokud test dá pozitivní výsledek, tak v případě nemoci N1 je pravděpodobnost P(T | N1) nějaká, u N2 je opět P(T | N2) nějaká atd. Test provedeme s krát, nech test m krát dopadně pozitivně a s - m krát negativně. Bayesovská teorie nám dovoluje na základě s krát provedeného testu zpřesnit původní pravděpodobnosti P(N1), ... , P(Nn). Praktický výpočet bez odvození finálního vzorce si ukážeme na příkladu. Jenom si připomeňme, že pokud test T provedeme s krát a m krát dopadne pozitivně, počet možností, jak tahle situace může nastat je Cs,mpm.(1-p)s-m, kde Cs,m je kombinační číslo a p je pravděpodobnost pozitivního testu pro konkrétní nemoc, pro negativní výsledek pak pravděpodobnost u této nemoci bude (1 - p).

V Brně 20. června 2014.

Poznámka.  Pokud vás problematika kolem Bayesova vzorce zaujala, ale tento střípek se vám zdá příliš náročný, zkuste si přečíst moje texty v uvedeném pořadí:

Domů | Prolog 2001: Vesmírná odysea | Nejen básně v próze | Střípky