Bayesova věta
Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností.[1] Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702–1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století.[2] Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.
Jedno z mnoha použití Bayesovy věty je v oblasti statistické inference (konkrétně Bayesova inference). Věta taktéž položila základy relativně novému směru statistiky – bayesovské statistiky.[3]
Znění věty
editovatNechť a jsou náhodné jevy a . Potom platí
- .
Důkaz
editovatDůkaz věty vychází z definice podmíněné pravděpodobnosti:
- , pokud . Symetricky , pokud .
Vyjádřením pravděpodobnosti průniku v obou rovnicích získáváme . Vyjádřením obdržíme Bayesovu formuli:
- , pokud .
Alternativní formy Bayesovy věty
editovatPro všechny alternativní formy Bayesovy věty uvažujme nenulovost jmenovatele.
Rozšířené znění
editovatMějme náhodné jevy a , pro . Nechť jsou jevy po dvou disjunktní pro každé a nechť tvoří celý pravděpodobnostní prostor, tedy . Potom platí
- .
Využití doplňku
editovatPři počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož nemusíme znát pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.
Tato formule spočívá ve vhodné úpravě jmenovatele, tedy
- , kde využíváme vztahu .
Po dosazení do původní věty dostáváme
- .[4]
Rodělení doplňku
editovatTato forma Bayesovy věty vychází z předpokladu Bayesovy věty, tedy že platí . Lze ale vyjádřit pravděpodobnost -tého členu . Tedy získáváme upravenou verzi Bayesovy věty využívající doplněk. Pro rozložení podmíněné pravděpodobnosti na pravé straně rovnice lze využít větu o úplné pravděpodobnosti.
Mějme neslučitelné náhodné jevy , kde takové, že pro ně platí . Pak platí
- .[5]
Verzi věty lze z konečného počtu náhodných jevů rozšířit i na nekonečně spočetně jevů.
Přidání historie
editovatPřidání jednoho prvku
editovatFormu, která bere v potaz historii, lze odvodit zavedením substituce a dosazení do znění Bayesovy věty. Získáváme tedy
- , z čehož získáváme vzorec
- , ze kterého přeznačením (pro konzistenci) získáváme formu Bayesovy věty zobecňující prvek historie v následující podobě:
- .
Přidání více prvků
editovatObdobným způsobem lze přidat konečně mnoho prvků historie , respektive i nekonečně spočetně. Můžeme definovat pomocí součtů jako (respektive ).
Tato forma Bayesovy věty může být užitečná, pokud v příkladu testování na drogy budu mít více testovaných lidí, pak obecně označíme výsledek -tého testu, tedy pokud byl první test pozitivní, výsledek do historie zaneseme například jako , pokud by byl negativní, pak bychom položili .
Výsledná forma zobecňující všechny výsledky má podobu
- .
Šancová forma Bayesovy věty
editovatZ definice šance lze odvodit vzorec poměrů pravděpodobností , který má tvar
- , tedy slovně aposteriorní šance hypotézy proti hypotéze je rovna součinu apriorní šance hypotézy proti hypotéze a poměru věrohodností hypotézy proti hypotéze .
Bayesova věta pro spojité náhodné vektory
editovatBayesovu větu lze popsat i pomocí hustoty spojitých náhodných vektorů a . Tedy podmíněná hustota spojitého náhodného vektoru vzhledem k je rovna
Podobu Bayesovy věty pro spojité náhodné vektory lze odvodit dosazením vztahu do vztahu podmíněné hustoty vzhledem k , tedy .[6]
Příklady použití
editovatTestování na drogy
editovatNyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.
Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?
Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:
- pravděpodobnost, že osoba je uživatelem drog (prevalence), tj.
- pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn.
- pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu:
- je pravděpodobnost, že test bude pozitivní, i přesto, že osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu:
- je pravděpodobnost, že test bude pozitivní.
Pravděpodobnost sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:
Po dosazení dostáváme výsledek 1,49 %:
Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost pomocí Bayesovy věty:
Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.
Specificita a senzitivita
editovatSenzitivita testu (také citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci) u daného subjektu. V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.
Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.
Bayesovská statistika
editovatBayesovská statistika je pokročilejší odvětví statistiky, které místo bodových odhadů parametrů z dat uvažuje nějaké pravděpodobnostní rozdělení nad možnými hodnotami parametru. To může být apriorní (známé již před získáním dat) nebo aposteriorní (apriorní rozdělení upravené informacemi zachycenými v datech). Matematicky se tento přechod od apriorního rozdělení a dat k aposteriornímu rozdělení formuluje pomocí podmíněných pravděpodobností a Bayesova věta tedy v bayesovské statistice přirozeně hraje klíčovou roli.
Odkazy
editovatReference
editovat- ↑ OBERHELMAN, David D. Stanford Encyclopedia of Philosophy. Reference Reviews. 2001-06-01, roč. 15, čís. 6, s. 9–9. ISSN 0950-4125. DOI 10.1108/rr.2001.15.6.9.311. (anglicky)
- ↑ A History of Bayes' Theorem. www.lesswrong.com [online]. lesswrong.com, 2011-08-29 [cit. 2024-02-19]. Dostupné online. (anglicky)
- ↑ BERNARDO, José M.; SMITH, Adrian F. M. Bayesian Theory. Hoboken: John Wiley & Sons, Ltd., 2009. ISBN 9780470317716, ISBN 047031771X. (anglicky)
- ↑ BAZETT, Trefor. Introduction to Bayes’ Theorem. Cham: Springer International Publishing Dostupné online. ISBN 978-3-030-95792-6.
- ↑ HRON, Karel; KUNDEROVÁ, Pavla; VENCÁLEK, Ondřej. Základy počtu pravděpodobnosti a metod matematické statistiky. Redakce Tereza Vintrová. 4., doplněné vyd. Olomouc: Univerzita Palackého v Olomouci, 2021. 346 s. ISBN 978-80-244-5990-5. Kapitola Podmíněná pravděpodobnost, s. 37–38.
- ↑ HRON, Karel; KUNDEROVÁ, Pavla; VENCÁLEK, Ondřej. Základy počtu pravděpodobnosti a metod matematické statistiky. Redakce Tereza Vintrová. 4., doplněné vyd. Olomouc: Univerzita Palackého v Olomouci, 2021. 346 s. ISBN 978-80-244-5990-5. Kapitola Podmíněné rozdělení, s. 125.
Související články
editovatExterní odkazy
editovat- Obrázky, zvuky či videa k tématu Bayesova věta na Wikimedia Commons
- Seeing Theory - Bayesian Inference – vizualizace Bayesovy věty na několika příkladech (anglicky)