Archívy autora: Petrik

Tri dôkazy pytagorovej vety

Keď raz Pál Erdős, legendami opradený maďarský matematik, stretol mladého talentovaného študenta, ktorého mal doučovať, začal sa pred ním vyťahovať. „Daj mi štvorciferné číslo,“ povedal Erdős, a študent si jedno vymyslel. „Štvorec je 6,411,024,“ z hlavy vypočítal Erdős. „Koľko dôkazov Pytagorovej vety poznáš?“ Jeden, povedal študent. „Ja 37,“ povedal Erdős.

37 dôkazov Pytagorovej vety pre život asi nepotrebujeme, ale tri sa rozhodne zídu. Alebo aspoň jeden, keďže aj jeden je viac ako nula. A keby sme ich poznali nula, tak by sme ani nemali ako vedieť, že Pytagorova veta vlastne platí. Tak poďme na to.

Dôkaz prvý — grafický

Predstavme si štvorec o strane c. Do neho nakreslime pravouhlé trojuholníky s preponami, ktoré sú zároveň stranami štvorca, a zvyšnými odvesnami a,b. Ako na obrázku.

pytagoras1

Keďže trojuholníky sú pravouhlé, perfektne vypĺňajú priestor veľkého štvorca tak, že akurát v strede zostane malý štvorček o strane b-a. Potom platí, že obsah veľkého štvorca c^2 sa rovná obsahu štyroch trojuholníkov ab/2 a obsahu malého štvorca.

    \[c^2 = 4\frac{ab} 2 + (b-a)^2,\]

    \[c^2 = 2ab + b^2 - 2ab + a^2\]

    \[c^2 = a^2 + b^2.\]

Voilà, Pytagorova veta!

Dôkaz druhý — z kosínusovej vety

Kosínusová veta hovorí c^2 = a^2 + b^2 - 2ab \cos \gamma. Ak je uhol \gamma pravý, tak \cos\gamma = 0, a teda máme Pytagorovu vetu. Poďme si teda dokázať rovno aj vetu kosínusovú.

pytagoras2

Predstavme si trojuholník o stranách a,b,c a uhloch \alpha, \beta, \gamma. Vidíme, že stranu c možno rozdeliť na časti c_1 a c_2, kde c_1 = b\cos\alpha a c_2 = a\cos\beta. Takže

    \[c = b\cos\alpha + c\cos\beta.\]

Okrem toho si všimnime, že výška na stranu c, označme ju d, sa rovná b\sin\alpha a zároveň a\sin\beta. Teda máme vzťah

    \[b\sin\alpha = a\sin\beta.\]

Máme dve rovnice a chceli by sme sa zbaviť jedného z dvoch uhlov, ktoré v nich vystupujú. Napríklad teda uhla \alpha.
Tento vzťah možno umocniť na druhú a použiť identitu \sin^2\alpha + \cos^2 \alpha = 1:

    \[b^2 - b^2\cos^2\alpha = a^2\sin^2\beta.\]

Prvu rovnicu možno upraviť a umocniť na tvar (c - a\cos\beta)^2 = b^2\cos^2\alpha. Porovnaním strán dostaneme

    \[c^2 - 2ac\cos\beta + a^2\cos^2\beta = b^2 - a^2\sin^2\beta,\]

    \[c^2 + a^2 - 2ac\cos\beta = b^2.\]

Oproti prvej forme kosínusovej vety sa nám pomenili písmená. Ale na tom nezáleží. Podstatné je, že strana b, ktorú nepoznáme, a uhol \beta, sú oproti sebe, a strany a a c sú priľahlé uhlu \beta. Dôkaz je hotový.

Dôkaz tretí

Napokon ešte jeden grafický.

pytagoras3

Plochu útvaru na obrázku môžeme vyjadriť dvomi spôsobmi. Po prvé, ako súčet plôch troch trojuholníkov:

    \[A = c^2/2 + 2 \, ab/2.\]

Po druhé, ako súčet plôch obdĺžnika o stranách a a a+b, a pravouhlého trojuholníka o stranách b-a a a+b:

    \[A = a(a+b) + (a+b)(b-a)/2 = a^2 + ab + b^2/2 - a^2/2.\]

Z rovnosti plôch dostaneme, podľa očakávania, Pytagorovu vetu.

Pravdepodobnosť podľa Bayesa

Predstavte si, že sa chcete nechať otestovať na chorobu, ktorá sa často nevyskytuje (napr. v prípade žien rakovinu prsníka). Výskyt v populácii u žien vo veku 50 – 64 rokov je 0.7%. Viete, že prístroj na otestovanie (mammograf) vám s presnosťou 90% povie, či rakovinu máte ak ju naozaj máte ale zároveň s 8% pravdepodobnosťou povie, že rakovinu máte ak ju v skutočnosti nemáte. Máte 50 – 64 rokov, idete teda na testovanie, a zistíte, že ste pozitívny. S akou pravdepodobnosťou ale rakovinou naozaj trpíte?

Prvotný tip by mohol znieť, že s pravdepodobnosťou 90%, keďže to je spoľahlivosť prístroja. Avšak nie je to tak jednoduché.

Predtým než začneme

Odzrkadlujú čísla 90%, 8% a 0.7% použité v tomto článku realitu? Snažili sme sa tieto čísla zvoliť podľa dostupných štatistík.

Britský inštitút Cancer Research uvádza, že mammografy detekujú rakovinu ak ju pacient má, s úspešnosťou v rozmedzí 83% – 95%. Pre guľatosť čísel uvažujeme pre tento článok true-positive rate 90%.

Vedci Henderson a kol. v roku 2015 skúmali dáta z 2 207 942 mammografických vyšetrení a došli k záveru, že miera detekcie rakoviny u zdravých pacientov bola 182 340. Čiže, za false-positive rate môžeme zobrať

    \[\frac{182340}{2207942} \approx 8\%\]

Podľa dát štúdie National Health Service Breast Screening Programme miera výskytu v populácií žien vo veku 50 – 64 rokov 11 048 prípradov na 1 562 532 testovaných, takže pre naše účely môžeme rátať pravdepodobnost

    \[\frac{11048}{1562532}\approx 0.7\%\]

.

Počítanie fazuliek

Ako si problém najjednoduchšie predstaviť? Majme na kope 10000 ľudí. Vieme, že 0.7 percenta trpí rakovinou, čo je presne 70 ľudí. Teraz všetkých ľudí pošleme na testovanie.

  • Spomedzi 70 chorých ľudí bude 63 ľudí správne označených ako pozitívnych po otestovaní (true positive), a 7 budú chybne označených ako zdravých (false negative).
  • Spomedzi zvyšných 9937 zdravých ľudí bude 8%, teda 795 nesprávne označených ako pozitívnych (false positive), a 9142 ľudí bude správe označených ako negatívnych (true negative).

Ak vám test povedal, že ste pozitívny, vy samozrejme neviete, či naozaj ste. Možete totiž patriť do skupiny 63 reálne pozitívnych ľudí, alebo 795 falošne pozitívnych. To znamená, že šanca, že ste reálne pozitívny, je cirka

    \[63 / (63 + 795) \approx 7.3\%\]

.

Náš prvotný tip teda zlyhal na celej čiare, pretože realita je taká, že otestovaní na vzácnu chorobu si môžeme byť len na 7.3% istí, že ju naozaj máme.

Ako sa ale k tomuto výsledku dopracovať abstraktne, bez toho, aby sme museli riešiť konkrétne čísla?

Ako nepočítať fazuľky alebo všeobecný recept

Pravdepodobnosti

Začnime pomaly. Nakreslime si Vennov diagram znázorňujúci pravdepodobnostný priestor, teda všetko, čo sa môže stať.

bayes1

Teraz si predstavme, v našom jednoduchom svete môžu nastať len dva javy:

  1. jav A, napr. zajtra bude pršať, s pravdepodobnosťou P(A)
  2. jav B, napr. zajtra si dostanem jednotku v škole, s pravdepodobnosťou P(B).

Fakt, či dostanem v škole jednotku alebo nie, nezávisí od toho, či bude pršať, teda tieto dva javy sú nezávislé. Takže pravdepodobnosť, že bude pršať a zároveň dostanem jednotku P(A\cap B), je súčin, teda P(A)P(B).

Podmienená pravdepodobnosť

Teraz sa spýtajme, aká je šanca P(B|A), že dostanem jednotku za predpokladu (jav A), že bude pršať (jav B)? Na Vennovom diagrame predpokladáme, že jav A nastal, takže si zazoomujeme na kruh P(A).

bayes2

P(B|A) je potom pomer plochy pod A aj B, teda P(A \cap B), a pravdepodobnosti, že pršalo P(A). Píšeme

    \[P(A|B) = \frac{P(A\cap B)}{P(A)}.\]

To isté sa vieme spýtať aj naopak. Aká je šakca, že bude pršať za predpokladu, že dostanem jednotku?

bayes3

V takomto prípade

    \[P(B|A) = \frac{P(B\cap A)}{P(A)}.\]

Vieme, že P(A\cap B) = P(B\cap A), takže

    \[P(A|B)P(B) = P(B|A)P(A).\]

Toto je veľká vec, ktorá sa volá Bayesova veta. Thomas Bayes bol britský biskup z 18. storočia, ktorého esej publikovaná posmrtne navždy zmenila pohľad na pravdepodobnosť. Jej význam ľudstvo naplno docenilo až o 300 rokov neskôr s príchodom počitačov. Prečo? To uvidíme čoskoro.

Späť k chorobe

Vráťme sa k príkladu s chorobou. Na jeho vyriešenie potrebujeme niekoľko ingrediencií. Z manúalu k prístroju odčítame dve čísla 90% (true positive) a 8% (false positive) a podobne potrebujeme správne označiť:

  • Apriórna šanca, že máme chorobu P(P) (ako pozitívny). Potom P(\text{N}) = 1 - P(\text{P}) je šanca, že sme zdraví.
  • Šanca, že sme pozitívne testovaní, za predpokladu sme zdraví, je P(+|\text{N}) = 8\%.
  • Šanca, že sme pozitívne testovaní, za predpokladu sme chorí, je P(+|\text{P}) = 90\%.
  • Šanca, že sme negatívne testovaní, za predpokladu sme zdraví, je P(-|\text{N}) = 92\%.
  • Šanca, že sme negatívne testovaní, za predpokladu sme chorí, je P(-|\text{P}) = 10\%.

Čo teda chceme zistiť? Pravdepodobnosť, že sme chorí, ak sme pozitívne testovaní P(\text{P}|+). Z Bayesovej vety:

    \[P(\text{P}|+) = \frac{P(+|\text{P})P(\text{P})}{P(+)}.\]

Na ceste k riešeniu nám zostáva prekonať posledný problém — čo je P(+)? To je celková pravdepodobnosť, že sme pozitívne testovaní. Čo nám radí intuícia? Toto číslo je šanca, súčet pravdepodobností, že sme pozitívne testovaní za predpokladu, že sme pozitívni, a že sme pozitívne testovaní za predpokladu, že sme negatívni. Matematicky:

    \[P(+) = P(+ \cap \text{P}) + P(+ \cap \text{N}) = P(+|\text{P})P(\text{P}) + P(+|\text{N})P(\text{N}).\]

bayes4

Takže výsledná (posteriórna) pravdepodobnosť je

    \[P(\text{P}|+) = \frac{P(+|P)P(P)}{P(+|P)P(P) + P(+|N)P(N)}.\]

Krásne! Teraz dosaďme čísla a tešme sa, čo nové sme sa naučili (90% nech je 90/100):

    \[P(\text{P}|+) = \frac{\frac{90}{100} \frac{0.7}{100} }{\frac{90}{100} \frac{0.7}{100} + \frac{8}{100}\frac{99.3}{100}} \approx 7.3\%.\]

Na vyriešenie problému teda potrebujeme tri ingrediencie:

  1. Apriórna pravdepodobnosť P(\text{P}) (potom P(\text{N}) = 1 - P(\text{P})),
  2. podmienená pravdepodobnosť P(+|\text{P}) (true positive rate),
  3. podmienená pravdepodobnosť P(+|\text{N}) (false positive rate).

Pravdepodobnosť ako viera

Bayesov prístup nám ponúka nový pohľad na na veci neznáme. Pravdepodobnosť nie je konštantná, ale mení sa v závislosti od našich pozorovaní. Bayes vymyslel recept, ako prispôsobovať naše vnímanie okolitého sveta v závislosti od javov, ktoré pozorujeme a zaznamenávame.

Ak pozmeníme zmysel javov A a B, na mieste P(A) a P(B) uvidíme niečo všeobecnejšie: pravdepodobnosť, že v niečo veríme P(\text{nazor}) a pravdepodobnosť, že niečo iné pozorujeme. P(\text{pozorovanie}).
Potom platí

    \[P(\text{nazor}|\text{pozorovanie}) = \frac{P(\text{pozorovanie}|\text{nazor}) P(\text{nazor})}{P(\text{pozorovanie})}.\]

Takže na základe našich pozorovaní upravujeme svoj názor. To je presne to, čo intuitívne chceme!

Teraz sa pozrime na aplikácie bayesiánskej pravdepodobnosti v reálnom svete.

Reálny príklad — terorizmus

Americký celebritný štatistik (aj také existuje) Nate Silver v knihe (link) prezentuje ako príklad zo života snahu posudzovať teroristické činy.

Predsavte si, že sa ráno 11. septembra 2001 zobudíte a vidíte, ako v New Yorku do jednej z veží WTO narazilo prvé lietadlo. Netušíte, čo sa deje, pretože nemáte ako vedieť, že išlo o teroristický útok. Ako teda odhadnúť, že to naozaj je teroristický útok?

Označme P(\text{T}) pravdepodobnosť teroristických útokov, pri ktorých sú unášané lietadlá (a P(\text{N}) = 1-P(\text{T}) šancu, že nejde o teroristický útok), a P(\text{n}) všeobecnú pravdepodobnosť nárazu lietadla do veže nad Manhattanom.

Potom P(\text{n}|\text{T}) sú všetky útoky, pri ktorých bolo unesené a narazené lietadlo. Takisto ale existuje P(\text{n}|\text{N}), čo je šanca, že sa na lietadle niečo pokazilo, zablúdilo nad Manhattan a narazilo do budovy (také prípady sa v histórii udiali aj pred 11. septembrom). Zosumarizujme si to v tabuľke:

P(\text{T}) podiel teroristických činov s lietadlami 0.005%
P(\text{n}|\text{T}) podiel teroristických útokov, pri ktorých niekde narazilo lietadlo 100%
P(\text{n}|\text{N}) výskyt nárazov lietadiel z iných dôvodov ako terorizmus 0.008%

Počítame P(\text{T}|\text{N}):

    \[P(\text{T}|\text{n}) = \frac{P(\text{n}|\text{T})P(\text{T})}{P(\text{n}|\text{T})P(\text{T}) + P(\text{n}|\text{N})P(\text{N})} = 38\%.\]

Teraz ale vidíme, že do veží narazilo druhé lietadlo. Aká je pravdepodobnosť, že išlo o teroristický útok za predpokladu, že náraz prvého lietadla bol takým útokom? Jednoducho iterujeme ďalej. Vymeníme posteriórnu pravdepodobnosť P(\text{T}|\text{N}) za priórnu

    \[P(\text{T}|\text{n}) \rightarrow P(\text{T})\]

a počítame novú posteriórnu P(\text{T}|\text{n}). Tentokrát nám výjde 99.99%.

Príklad na precvičenie

V krabici máme 3 biele (B) a štyri čierne (C) guličky. Postupne ich vyťahujeme.

  • Aká je pravdepodobnosť P(\text{B}_2), že v poradí druhá gulička bude biela? A P(\text{B}_3) že tretia gulička bude biela?
  • Aká je pravdepodobnosť P(\text{C}_2|\text{C}_3), že druhá gulička je čierna za predpokladu, že tretia gulička je tiež čierna?

Zdroje:

Henderson, Louise M., a kol. „Increased Risk of Developing Breast Cancer after a False-Positive Screening Mammogram.“ Cancer Epidemiology Biomarkers & Prevention 24.12 (2015): 1882-1889.