Tri dôkazy pytagorovej vety

Keď raz Pál Erdős, legendami opradený maďarský matematik, stretol mladého talentovaného študenta, ktorého mal doučovať, začal sa pred ním vyťahovať. „Daj mi štvorciferné číslo,“ povedal Erdős, a študent si jedno vymyslel. „Štvorec je 6,411,024,“ z hlavy vypočítal Erdős. „Koľko dôkazov Pytagorovej vety poznáš?“ Jeden, povedal študent. „Ja 37,“ povedal Erdős.

37 dôkazov Pytagorovej vety pre život asi nepotrebujeme, ale tri sa rozhodne zídu. Alebo aspoň jeden, keďže aj jeden je viac ako nula. A keby sme ich poznali nula, tak by sme ani nemali ako vedieť, že Pytagorova veta vlastne platí. Tak poďme na to.

Dôkaz prvý — grafický

Predstavme si štvorec o strane c. Do neho nakreslime pravouhlé trojuholníky s preponami, ktoré sú zároveň stranami štvorca, a zvyšnými odvesnami a,b. Ako na obrázku.

pytagoras1

Keďže trojuholníky sú pravouhlé, perfektne vypĺňajú priestor veľkého štvorca tak, že akurát v strede zostane malý štvorček o strane b-a. Potom platí, že obsah veľkého štvorca c^2 sa rovná obsahu štyroch trojuholníkov ab/2 a obsahu malého štvorca.

    \[c^2 = 4\frac{ab} 2 + (b-a)^2,\]

    \[c^2 = 2ab + b^2 - 2ab + a^2\]

    \[c^2 = a^2 + b^2.\]

Voilà, Pytagorova veta!

Dôkaz druhý — z kosínusovej vety

Kosínusová veta hovorí c^2 = a^2 + b^2 - 2ab \cos \gamma. Ak je uhol \gamma pravý, tak \cos\gamma = 0, a teda máme Pytagorovu vetu. Poďme si teda dokázať rovno aj vetu kosínusovú.

pytagoras2

Predstavme si trojuholník o stranách a,b,c a uhloch \alpha, \beta, \gamma. Vidíme, že stranu c možno rozdeliť na časti c_1 a c_2, kde c_1 = b\cos\alpha a c_2 = a\cos\beta. Takže

    \[c = b\cos\alpha + c\cos\beta.\]

Okrem toho si všimnime, že výška na stranu c, označme ju d, sa rovná b\sin\alpha a zároveň a\sin\beta. Teda máme vzťah

    \[b\sin\alpha = a\sin\beta.\]

Máme dve rovnice a chceli by sme sa zbaviť jedného z dvoch uhlov, ktoré v nich vystupujú. Napríklad teda uhla \alpha.
Tento vzťah možno umocniť na druhú a použiť identitu \sin^2\alpha + \cos^2 \alpha = 1:

    \[b^2 - b^2\cos^2\alpha = a^2\sin^2\beta.\]

Prvu rovnicu možno upraviť a umocniť na tvar (c - a\cos\beta)^2 = b^2\cos^2\alpha. Porovnaním strán dostaneme

    \[c^2 - 2ac\cos\beta + a^2\cos^2\beta = b^2 - a^2\sin^2\beta,\]

    \[c^2 + a^2 - 2ac\cos\beta = b^2.\]

Oproti prvej forme kosínusovej vety sa nám pomenili písmená. Ale na tom nezáleží. Podstatné je, že strana b, ktorú nepoznáme, a uhol \beta, sú oproti sebe, a strany a a c sú priľahlé uhlu \beta. Dôkaz je hotový.

Dôkaz tretí

Napokon ešte jeden grafický.

pytagoras3

Plochu útvaru na obrázku môžeme vyjadriť dvomi spôsobmi. Po prvé, ako súčet plôch troch trojuholníkov:

    \[A = c^2/2 + 2 \, ab/2.\]

Po druhé, ako súčet plôch obdĺžnika o stranách a a a+b, a pravouhlého trojuholníka o stranách b-a a a+b:

    \[A = a(a+b) + (a+b)(b-a)/2 = a^2 + ab + b^2/2 - a^2/2.\]

Z rovnosti plôch dostaneme, podľa očakávania, Pytagorovu vetu.

Fibonacciho postupnosť a včelí rodokmeň

V spoločenstvách včiel medonosných, môžeme osadenstvo rozdeliť na tri skupiny:

Jedna kráľovná kralovna
Robotnice robotnica
Trúdy trud

Rozmnožovanie prebieha tak, že kráľovná je oplodnená trúdom a kladie oplodnené vajíčka, z ktorých sa neskôr vyliahnu robotnice alebo nová kráľovná. Zároveň kladie neoplodnené vajíčka, z ktorých sa vyliahnu trúdy. Schematicky:

kralovna trud kralovna
kráľovná + trúd → robotnica alebo nová kráľovná
robotnica
/
kralovna
kráľovná → trúd
trud

Teda trúd má jedného rodiča a robotnica a kráľovná dvoch rodičov. Kráľovná poväčšinu svojho života rodí robotnice a šíri okolo seba feromóny, ktoré zabraňujú vývoju novej kráľovnej. Tieto vyprchajú, keď nadíde čas na novú kráľovnú, napríklad vo vyššom veku pôvodnej.

Poďme sa zamerať na trúdov rodokmeň. Máme


kralovna

trud

kralovna

kralovna

trud

kralovna

trud

trud
8

kralovna

trud

kralovna

kralovna

trud
5

kralovna

trud

kralovna
3

kralovna

trud
2

kralovna
1

trud
1

a keby sme pokračovali, dostali by sme postupnosť

    \[1,1,2,3,5,8,13,21,34,55,89...\]

Otázka, ktorú si položíme znie: Za predpokladu, že sa kráľovná nepári s vlastnými potomkami, koľko predkov má trúd v rodokmeni v n-tej generácií dozadu?

Fibonacciho postupnosť

Ukážka z Liber Abbaci. Prvých 13 Fibonacciho čísel je vyísaných v červenom rámiku vpravo v indicko-arabskom systéme. (Zdroj: Wikipedia)

Označme počet predkov v generácií n, F_n. Písmeno F ako Fibonacci, alebo pre niekoho možno fčela… Všimneme si, že pre počet predkov v n-tej generácií dozadu platí

(1)   \begin{equation*} F_n = F_{n-1} + F_{n-2} \end{equation*}

s tým, že v generácií nula je iba trúd samotný F_0 = 1 a generácií jedna je iba kráľovná F_1 = 1. Túto postupnosť nazývame Fibonacciho postupnosťou.

Leonardo Bonacci, prezývaný Fibonacci, bol taliansky matematik pôsobiaci v Pise na prelome dvanásteho a trinásteho storočia. V publikácií Liber Abbaci (1209) sa zaoberal sa podobnou úlohou ako my, ale na králikoch.

Vzťah (1) môžeme odvodiť aj rigorózne. Nech K_n je počet kráľovien a T_n je počet trúdov v n-tej generácií dozadu. Označme teda celkový počet predkov

    \[F_n=T_n + K_n.\]

Počet trúdov zrátame ako počet otcov kráľovných v generácií n-1, to jest T_n = K_{n-1} a na úvod T_0 = 1. Kráľovné zrátame ako počet mám všetkých trúdov a kráľovien z generácie n-1, teda K_n = T_{n-1} + K_{n-1} s K_0 = 0.

Dostaneme

    \begin{align*} F_n &= T_n + K_n \\    &= K_{n-1} + T_{n-1} + K_{n-1}\\    &= F_{n-1} + K_{n-1}\\    &= F_{n-1} + T_{n-2} + K_{n-2}\\    &= F_{n-1} + F_{n-2}. \end{align*}

s počiatočými podmienkami

    \begin{align*} F_0 &= T_0 + K_0 \\     &= 1 \end{align*}

a

    \begin{align*} F_1 &= T_1 + K_1 \\     &= T_1 + T_0 + K_0\\     &= 1. \end{align*}

Vzťah (1) nazývame rekurentný z francúzskeho recourir – znovu bežať. Ak nás zaujíma počet predkov v generácií 10 tak pomocou vzťahu vyrátame F_2 = F_1 + F_0 a znovu pomocou toho istého vzťahu F_3 = F_2 + F_1 a takto ho necháme zopárkrát bežat, až kým sa nedostaneme k číslu F_{10}.

Teraz je vhodná doba zavolať na výpomoc Pytóna, programovací jazyk, ktorý nám pomôže toto všetko urobiť za nás:

# kód sa dá spustiť napríklad cez https://try.jupyter.org, New -> Python 3
def fib(n):
    fib_cisla = [1, 1]
   
    for i in range(2, n + 1):
      fib_cisla += [fib_cisla[i - 1] + fib_cisla[i - 2]]
  
    return fib_cisla[n]

print(fib(10))
>>> 89

Cvičenie: fib(n) ukladá n prvkov do pamäti v zozname fib_cisla. Skúste ho prepísať tak, aby používal iba trojprvkový zoznam. Riešenie na konci článku.

Uzavretý tvar

Pokiaľ sa čitateľ neuspokojil s algoritmickým riešením, pravdepodobne mu vŕta v hlave, čí by sa dala Fibonacciho postupnosť vyjadrít v uzavretom tvare. To jest pomocou nejakého vzorca, ktorý je nezávislý od predchádzajúcich hodnôt F_{n-1}, F_{n-2}, ... ale iba od n samotného

    \[F_n = f(n)\]

pre nejakú funkciu f. Takýto prepis by bol veľmi pohodlný z výpočtového hľadiska, lebo pre lubovoľné n by funkcia vykonala iba konštantný počet operácií. V informatike označujeme ako O(1). Algoritmus, ktorý sme uviedli v predchádzajúcej sekcií, na druhej strane, potrebuje vykonať n razy konštantný počet operácií, čo zodpovedá zložitosti O(n).

Poďme sa na to pozrieť. Jeden z účinných nástrojov na riešenie vzťahov podobných typu (1) je skúsiť riešenie uhádnuť. Vyskúšajme teda predpokladať, že F_n má tvar

    \[F_n = r^n\]

pre nejakú konštantu r. Dosadíme do rekurentného prepisu Fibonacciho postupnosti \label{eq:1} a dostávame r^n = r^{n-1} + r^{n-2}. Vydelíme r^{n-2} a zostane nám

    \[r^2 = r + 1\]

Toto je dobre známa kvadratická rovnica r^2 - r - 1 = 0 s diskriminantom D = (-1)^2 - (4.1.(-1)) = 5, čo zodpovedá dvom riešeniam

    \begin{align*} r_1 = \frac{1 + \sqrt{5}}{2} \\ r_2 = \frac{1 - \sqrt{5}}{2}. \end{align*}

Už sme skoro tam! Všimnime si, že ak by sme položili F_n = r_1^n tak v rekurentnom prepise (1) sa ľavá strana sa rovná pravej, dokonca F_0 = 1 ale bohužial F_1 = r_1 \neq 1. To isté platí pre r_2. Ako sa vysporiadať s F_1 \neq 1?

Všimnime si jednu dôležitú vlastnosť Fibonacciho prepisu, ktorou je lineárnosť. Ak je riešením G_n = r_1^n aj H_n = r_2^n, tak ľává strana sa bude rovnať pravej aj pre

(2)   \begin{equation*} F_n = k . G_n + l . H_n \end{equation*}

s ľubovoľnými konštantami k, l:

    \begin{align*} F_n &= k . G_n + l . H_n \\ &= k . (G_{n-1} + G_{n-2}) + l . (H_{n-1} + H_{n-2}) \\ &= k . G_{n-1} + l H_{n-1} + k . G_{n-2} + l H_{n-2} \\ &= F_{n-1} + F_{n-2}. \end{align*}

S týmto všeobecným riešením F_n sme ale vo veľkej výhode, lebo si môžeme vybrať konštanty k,l tak aby platilo F_0 = 1 a F_1 = 1. Dostávame sa k sústave

    \begin{align*} k + l &= 1 \\ k . r_1 + l . r_2 &= 1 \end{align*}

ktorej riešením je

    \begin{align*} k &= \frac{1 + \sqrt{5}}{2\sqrt{5}} \\ l &= \frac{1 - \sqrt{5}}{2\sqrt{5}}. \end{align*}

Dosadíme k,l,G_n,H_n do (2) a po upravení dostávame

    \[\label{eq:3} F_{n}=\frac{1}{\sqrt{5}}\bigg[\bigg(\frac{1+\sqrt{5}}{2}\bigg)^{n+1}-\bigg(\frac{1-\sqrt{5}}{2}\bigg)^{n+1}\bigg].\]

Na tejto formule je jeden veľmi zaujímavý fakt a to, že hoc to tak nevyzerá, keď sa to všetko zráta, dostaneme celé číslo 😯 .

Preveríme v Pytóne

# kód sa dá spustiť napríklad cez https://try.jupyter.org, New -> Python 3
def fib(n):
    od5 = 5 ** 0.5
    return (((1 + od5) / 2) ** (n + 1) - ((1 - od5) / 2) ** (n + 1)) / od5

print(fib(10))
>>> 89.00000000000003

Pripomeňme si, že \sqrt{5} = 5^{1/2}.

Teraz môže pozorný čitateľ protestovať: „Ha! Veď 89.00000000000003 nie je celé číslo!“. Zhruba ide o to, že vo vnútri počítača sú desatinné čísla pre numerické výpočty zapísané v dvojkovej sústave s konečným rozvojom. Takže pri výpočte dochádza k chybám na vyšších desatinných miestach, pokiaľ má medzivýpočet nekonečný dvojkový rozvoj.

Riešenie cvičenia

# kód sa dá spustiť napríklad cez https://try.jupyter.org, New -> Python 3
def fib(n):
    fib_cisla = [1, 1, 0]
    for i in range(2, n + 1):
        fib_cisla[i % 3] = fib_cisla[(i + 1) % 3] + fib_cisla[(i + 2) % 3]
    
    return fib_cisla[n % 3]

print(fib(10))
>>> 89

Zdroje

Basin SL. The Fibonacci sequence as it appears in nature. Fibonacci Quarterly. 1963 Feb;1(1):53-6.
King, F. Probability, Part IA Lecture Notes. 1st ed. Cambridge University, 2003. Web. 7 Feb. 2016.
Knott, R. „Who was Fibonacci?“. Maths.surrey.ac.uk. Retrieved 2010-08-02.
Knott, R. „Fibonacci Numbers and Nature“. Maths.surrey.ac.uk. Retrieved 2016-02-07.
Obrázky včiel prevzaté z: http://vcelamedonosnagc.blogspot.co.uk.

Pravdepodobnosť podľa Bayesa

Predstavte si, že sa chcete nechať otestovať na chorobu, ktorá sa často nevyskytuje (napr. v prípade žien rakovinu prsníka). Výskyt v populácii u žien vo veku 50 – 64 rokov je 0.7%. Viete, že prístroj na otestovanie (mammograf) vám s presnosťou 90% povie, či rakovinu máte ak ju naozaj máte ale zároveň s 8% pravdepodobnosťou povie, že rakovinu máte ak ju v skutočnosti nemáte. Máte 50 – 64 rokov, idete teda na testovanie, a zistíte, že ste pozitívny. S akou pravdepodobnosťou ale rakovinou naozaj trpíte?

Prvotný tip by mohol znieť, že s pravdepodobnosťou 90%, keďže to je spoľahlivosť prístroja. Avšak nie je to tak jednoduché.

Predtým než začneme

Odzrkadlujú čísla 90%, 8% a 0.7% použité v tomto článku realitu? Snažili sme sa tieto čísla zvoliť podľa dostupných štatistík.

Britský inštitút Cancer Research uvádza, že mammografy detekujú rakovinu ak ju pacient má, s úspešnosťou v rozmedzí 83% – 95%. Pre guľatosť čísel uvažujeme pre tento článok true-positive rate 90%.

Vedci Henderson a kol. v roku 2015 skúmali dáta z 2 207 942 mammografických vyšetrení a došli k záveru, že miera detekcie rakoviny u zdravých pacientov bola 182 340. Čiže, za false-positive rate môžeme zobrať

    \[\frac{182340}{2207942} \approx 8\%\]

Podľa dát štúdie National Health Service Breast Screening Programme miera výskytu v populácií žien vo veku 50 – 64 rokov 11 048 prípradov na 1 562 532 testovaných, takže pre naše účely môžeme rátať pravdepodobnost

    \[\frac{11048}{1562532}\approx 0.7\%\]

.

Počítanie fazuliek

Ako si problém najjednoduchšie predstaviť? Majme na kope 10000 ľudí. Vieme, že 0.7 percenta trpí rakovinou, čo je presne 70 ľudí. Teraz všetkých ľudí pošleme na testovanie.

  • Spomedzi 70 chorých ľudí bude 63 ľudí správne označených ako pozitívnych po otestovaní (true positive), a 7 budú chybne označených ako zdravých (false negative).
  • Spomedzi zvyšných 9937 zdravých ľudí bude 8%, teda 795 nesprávne označených ako pozitívnych (false positive), a 9142 ľudí bude správe označených ako negatívnych (true negative).

Ak vám test povedal, že ste pozitívny, vy samozrejme neviete, či naozaj ste. Možete totiž patriť do skupiny 63 reálne pozitívnych ľudí, alebo 795 falošne pozitívnych. To znamená, že šanca, že ste reálne pozitívny, je cirka

    \[63 / (63 + 795) \approx 7.3\%\]

.

Náš prvotný tip teda zlyhal na celej čiare, pretože realita je taká, že otestovaní na vzácnu chorobu si môžeme byť len na 7.3% istí, že ju naozaj máme.

Ako sa ale k tomuto výsledku dopracovať abstraktne, bez toho, aby sme museli riešiť konkrétne čísla?

Ako nepočítať fazuľky alebo všeobecný recept

Pravdepodobnosti

Začnime pomaly. Nakreslime si Vennov diagram znázorňujúci pravdepodobnostný priestor, teda všetko, čo sa môže stať.

bayes1

Teraz si predstavme, v našom jednoduchom svete môžu nastať len dva javy:

  1. jav A, napr. zajtra bude pršať, s pravdepodobnosťou P(A)
  2. jav B, napr. zajtra si dostanem jednotku v škole, s pravdepodobnosťou P(B).

Fakt, či dostanem v škole jednotku alebo nie, nezávisí od toho, či bude pršať, teda tieto dva javy sú nezávislé. Takže pravdepodobnosť, že bude pršať a zároveň dostanem jednotku P(A\cap B), je súčin, teda P(A)P(B).

Podmienená pravdepodobnosť

Teraz sa spýtajme, aká je šanca P(B|A), že dostanem jednotku za predpokladu (jav A), že bude pršať (jav B)? Na Vennovom diagrame predpokladáme, že jav A nastal, takže si zazoomujeme na kruh P(A).

bayes2

P(B|A) je potom pomer plochy pod A aj B, teda P(A \cap B), a pravdepodobnosti, že pršalo P(A). Píšeme

    \[P(A|B) = \frac{P(A\cap B)}{P(A)}.\]

To isté sa vieme spýtať aj naopak. Aká je šakca, že bude pršať za predpokladu, že dostanem jednotku?

bayes3

V takomto prípade

    \[P(B|A) = \frac{P(B\cap A)}{P(A)}.\]

Vieme, že P(A\cap B) = P(B\cap A), takže

    \[P(A|B)P(B) = P(B|A)P(A).\]

Toto je veľká vec, ktorá sa volá Bayesova veta. Thomas Bayes bol britský biskup z 18. storočia, ktorého esej publikovaná posmrtne navždy zmenila pohľad na pravdepodobnosť. Jej význam ľudstvo naplno docenilo až o 300 rokov neskôr s príchodom počitačov. Prečo? To uvidíme čoskoro.

Späť k chorobe

Vráťme sa k príkladu s chorobou. Na jeho vyriešenie potrebujeme niekoľko ingrediencií. Z manúalu k prístroju odčítame dve čísla 90% (true positive) a 8% (false positive) a podobne potrebujeme správne označiť:

  • Apriórna šanca, že máme chorobu P(P) (ako pozitívny). Potom P(\text{N}) = 1 - P(\text{P}) je šanca, že sme zdraví.
  • Šanca, že sme pozitívne testovaní, za predpokladu sme zdraví, je P(+|\text{N}) = 8\%.
  • Šanca, že sme pozitívne testovaní, za predpokladu sme chorí, je P(+|\text{P}) = 90\%.
  • Šanca, že sme negatívne testovaní, za predpokladu sme zdraví, je P(-|\text{N}) = 92\%.
  • Šanca, že sme negatívne testovaní, za predpokladu sme chorí, je P(-|\text{P}) = 10\%.

Čo teda chceme zistiť? Pravdepodobnosť, že sme chorí, ak sme pozitívne testovaní P(\text{P}|+). Z Bayesovej vety:

    \[P(\text{P}|+) = \frac{P(+|\text{P})P(\text{P})}{P(+)}.\]

Na ceste k riešeniu nám zostáva prekonať posledný problém — čo je P(+)? To je celková pravdepodobnosť, že sme pozitívne testovaní. Čo nám radí intuícia? Toto číslo je šanca, súčet pravdepodobností, že sme pozitívne testovaní za predpokladu, že sme pozitívni, a že sme pozitívne testovaní za predpokladu, že sme negatívni. Matematicky:

    \[P(+) = P(+ \cap \text{P}) + P(+ \cap \text{N}) = P(+|\text{P})P(\text{P}) + P(+|\text{N})P(\text{N}).\]

bayes4

Takže výsledná (posteriórna) pravdepodobnosť je

    \[P(\text{P}|+) = \frac{P(+|P)P(P)}{P(+|P)P(P) + P(+|N)P(N)}.\]

Krásne! Teraz dosaďme čísla a tešme sa, čo nové sme sa naučili (90% nech je 90/100):

    \[P(\text{P}|+) = \frac{\frac{90}{100} \frac{0.7}{100} }{\frac{90}{100} \frac{0.7}{100} + \frac{8}{100}\frac{99.3}{100}} \approx 7.3\%.\]

Na vyriešenie problému teda potrebujeme tri ingrediencie:

  1. Apriórna pravdepodobnosť P(\text{P}) (potom P(\text{N}) = 1 - P(\text{P})),
  2. podmienená pravdepodobnosť P(+|\text{P}) (true positive rate),
  3. podmienená pravdepodobnosť P(+|\text{N}) (false positive rate).

Pravdepodobnosť ako viera

Bayesov prístup nám ponúka nový pohľad na na veci neznáme. Pravdepodobnosť nie je konštantná, ale mení sa v závislosti od našich pozorovaní. Bayes vymyslel recept, ako prispôsobovať naše vnímanie okolitého sveta v závislosti od javov, ktoré pozorujeme a zaznamenávame.

Ak pozmeníme zmysel javov A a B, na mieste P(A) a P(B) uvidíme niečo všeobecnejšie: pravdepodobnosť, že v niečo veríme P(\text{nazor}) a pravdepodobnosť, že niečo iné pozorujeme. P(\text{pozorovanie}).
Potom platí

    \[P(\text{nazor}|\text{pozorovanie}) = \frac{P(\text{pozorovanie}|\text{nazor}) P(\text{nazor})}{P(\text{pozorovanie})}.\]

Takže na základe našich pozorovaní upravujeme svoj názor. To je presne to, čo intuitívne chceme!

Teraz sa pozrime na aplikácie bayesiánskej pravdepodobnosti v reálnom svete.

Reálny príklad — terorizmus

Americký celebritný štatistik (aj také existuje) Nate Silver v knihe (link) prezentuje ako príklad zo života snahu posudzovať teroristické činy.

Predsavte si, že sa ráno 11. septembra 2001 zobudíte a vidíte, ako v New Yorku do jednej z veží WTO narazilo prvé lietadlo. Netušíte, čo sa deje, pretože nemáte ako vedieť, že išlo o teroristický útok. Ako teda odhadnúť, že to naozaj je teroristický útok?

Označme P(\text{T}) pravdepodobnosť teroristických útokov, pri ktorých sú unášané lietadlá (a P(\text{N}) = 1-P(\text{T}) šancu, že nejde o teroristický útok), a P(\text{n}) všeobecnú pravdepodobnosť nárazu lietadla do veže nad Manhattanom.

Potom P(\text{n}|\text{T}) sú všetky útoky, pri ktorých bolo unesené a narazené lietadlo. Takisto ale existuje P(\text{n}|\text{N}), čo je šanca, že sa na lietadle niečo pokazilo, zablúdilo nad Manhattan a narazilo do budovy (také prípady sa v histórii udiali aj pred 11. septembrom). Zosumarizujme si to v tabuľke:

P(\text{T}) podiel teroristických činov s lietadlami 0.005%
P(\text{n}|\text{T}) podiel teroristických útokov, pri ktorých niekde narazilo lietadlo 100%
P(\text{n}|\text{N}) výskyt nárazov lietadiel z iných dôvodov ako terorizmus 0.008%

Počítame P(\text{T}|\text{N}):

    \[P(\text{T}|\text{n}) = \frac{P(\text{n}|\text{T})P(\text{T})}{P(\text{n}|\text{T})P(\text{T}) + P(\text{n}|\text{N})P(\text{N})} = 38\%.\]

Teraz ale vidíme, že do veží narazilo druhé lietadlo. Aká je pravdepodobnosť, že išlo o teroristický útok za predpokladu, že náraz prvého lietadla bol takým útokom? Jednoducho iterujeme ďalej. Vymeníme posteriórnu pravdepodobnosť P(\text{T}|\text{N}) za priórnu

    \[P(\text{T}|\text{n}) \rightarrow P(\text{T})\]

a počítame novú posteriórnu P(\text{T}|\text{n}). Tentokrát nám výjde 99.99%.

Príklad na precvičenie

V krabici máme 3 biele (B) a štyri čierne (C) guličky. Postupne ich vyťahujeme.

  • Aká je pravdepodobnosť P(\text{B}_2), že v poradí druhá gulička bude biela? A P(\text{B}_3) že tretia gulička bude biela?
  • Aká je pravdepodobnosť P(\text{C}_2|\text{C}_3), že druhá gulička je čierna za predpokladu, že tretia gulička je tiež čierna?

Zdroje:

Henderson, Louise M., a kol. „Increased Risk of Developing Breast Cancer after a False-Positive Screening Mammogram.“ Cancer Epidemiology Biomarkers & Prevention 24.12 (2015): 1882-1889.

Na čo sú nám dobré logaritmy na akciových trhoch

O čom asi

O logaritmoch iste už mnohí z vás počuli. Niektorí iba počuli, niektorí s nimi už niečo počítali a nejaké to mizivé percento z nás vrátane mňa ich dokonca aj používa. Rovnakú vetu by som mohol napísať aj o akciách. Teraz nemyslím tie, ktoré svietia v Bille každý utorok, ale tie, ktoré sa obchodujú na burzách po celom svete. Čo sú akcie a ako fungujú si vysvetlíme niekedy nabudúce. Pre dnešok nám bohate postačí ak vieme, že akcie si môžeme kúpiť, majú nejakú cenu a táto cena sa v čase mení. Viacerí z vás isto už počuli o tom ako akcie dokážu veľa zarobiť a možno už aj o tom ako v roku 2008 veľa prerobili. To ako sa nejakej konkrétnej akcii darilo sa vieme veľmi ľahko dozvedieť z grafu vývoja jej ceny.

Prepad akciového indexu S&P 500

Na obrázku dole je graf vývoja ceny azda najznámejšieho akciového indexu na svete, amerického S&P 500 1 od roku 1928 do roku 1996.

vývoj ceny akciového indexu S&P 500 od roku 1928 do roku 1997

vývoj ceny akciového indexu S&P 500 od roku 1928 do roku 1997

Vyobrazený je vývoj počas naozaj dlhého obdobia takmer 70 rokov. Obrázok pripomína exponenciálny rast (teda rast, ktorý je o to silnejší o čo dlhšie trvá). Skutočne, za toto obdobie index zarobil kumulatívne 4094% čo už však na ročnej báze nie je až tak astronomických 5.6% p.a. Skúste sa teraz znova pozrieť na graf hore a tipnúť si kedy podľa vás index zaznamenal svoj najväčší prepad.

Prepad indexu S&P 500 v z noci na pondelkové ráno 19.10.1987

Prepad indexu S&P 500 v z noci na pondelkové ráno 19.10.1987

Čierny pondelok… alebo aj nie?

Prirodzeným tipom mnohých, ktorý nemajú v hlave históriu finančných trhov, je silný a náhly prepad približne v 3/4 grafu znázornený vyššie. Ide o tzv. Čierny pondelok, o ktorom iste mnohí z vás počuli a svoje miesto si našiel napr. aj v nedávnom The Wolf of Wall street. Index S&P 500 sa z noci na pondelkové ráno 19.10.1987 prepadol o vyše 20%2. Celkový pokles (keďže index klesal už aj niekoľko týždňov predtým) činil -33.24%.

Pokles indexu S&P 500 od 25.8.1987 po 19.10.1987

Pokles indexu S&P 500 od 25.8.1987 po 19.10.1987

Prezradím už teraz, že tento tip na najväčší prepad nie je správny. Problémom doteraz uvedených grafov je, že najväčší prepad na nich jednoducho nevidíme. Pretože vyobrazené obdobie je príliš dlhé. No a na to aby sme vedeli správne posúdiť kde nastal najväčší prepad nám poslúžia práve logaritmy.

Logaritmy

mathtee-logarithmMojím cieľom v tomto článku nie je do hĺbky vám objasniť problematiku logaritmov. Vystačíme si len s úplným základom a uvidíme, že už aj ten nám viem pomôcť na akciových trhoch. Na slovenskej wikipédii sa hneď v prvej vete dočítame, že logaritmus alebo logaritmická funkcia je inverznou funkciou k exponenciálnej funkcii . Táto krkolomná veta je kľúčom k rozlúsknutiu vyššie uvedeného grafu akciového indexu S&P 500 a hľadania jeho najväčších poklesov. Keďže na danom grafe zaznamenal akciový index exponenciálny rast, použijeme na neho práve logaritmus, ktorý nám ako inverzná funkcia k exponenciálnej priblíži graf „reálnejšími“ očami.

    \[\log_a x\]

Logaritmus čísla x so základom a je číslo, na ktoré musíme umocniť a, aby sme dostali x. Teda

\log_{10} 100 = 2,      lebo 10^2 = 100
\log_2 2 = 1,      lebo 2^1 = 2
\log_5 1 = 0,      lebo 5^0 = 1

Najpoužívanejšie typy logaritmov dostali svoje mená, konkrétne logaritmus so základom 10 je dekadický logaritmus a zvyčajne sa pri ňom základ 10 ani neznačí, použije sa len \log x. Logaritmus so základom tvoriacim Eulerovo číslo e je tzv. prirodzený logaritmus a značíme ho miesto „log“ ako „ln“.

\ln (e \cdot e) = 2,     lebo e^2 = e \cdot e,     kde e \approx 2.71828

Logaritmy majú veľa užitočných vlastností, mimo iného aj tú, ktorú som už spomínal, že potrebujeme – vedia sa vysporiadať s exponenciálnym rastom. Čo to presne znamená? A prečo je exponenciálny rast problém? Ukážme si to na príklade.

Exponenciálny rast

5
Tento ilustratívny graf znázorňuje exponenciálny rast aj najväčší problém súvisiaci s jeho vyobrazovaním. S každou narastajúcou jednotkou na osi x narastie hodnota grafu na osi y o 10%. Nárast 10% z úrovne 10 nás dostane na hodnotu 11. Nárast 10% z úrovne 1000 nás zas dostane na hodnotu 1100 – proti tomuto by zrejme nikto neprotestoval. Je to však trochu problém, lebo hoci aj z úrovne 10, aj z úrovne 1000 bol nárast (alebo napr. zisk) v percentách taký istý, t.j. 10%, tak ten neskorší nárast z vyššej úrovne je na grafe oveľa viac vidno. Na grafe exponenciálneho rastu vyzerá 10%-ný nárast z úrovne 1000 ako výrazne vyšší ako 10%-ný nárast z úrovne 10, pritom percentuálne sú totožné.

6
Pri dlhodobých (väčšinou viac ako 3-5 rokov) grafoch akciových alebo iných finančných trhov je táto vlastnosť problém. Skrýva totiž to, čo sa vlastne dialo v úvodných, skorších obdobiach. Keďže index zaznamenal exponenciálny rast, z grafu vôbec nevidíme, koľko percent zarobil alebo stratil v prvej polovici vyobrazeného obdobia. Takýto graf je teda dosť klamný, keďže na ňom dobre vidíme iba nedávne, čerstvé obdobia (nárast 20%).

Logaritmy vs exponenciálny rast

Pozrime sa na dekadický logaritmus z lineárne rastúcich čísel.

\log_{10} 100 = 2
\log_{10} 200 = 2.3
\log_{10} 300 = 2.48
\log_{10} 400 = 2.6
\log_{10} 500 = 2.7

Vidno, že hoci zvyšujeme logaritmované číslo stále o 100, výsledok narastá najskôr o 0.3, potom o 0.18, potom o 0.12 a na koniec iba o 0.1. Nárast o rovnakú jednotku (napr. 100) z vyššej hodnoty na osi x (napr. 400) sa pretaví v menší nárast hodnoty na osi y (0.1), v porovnaní s nárastom o 100 z nižšej úrovne na osi x (napr. zo 100 je to 0.3).

7
To isté platí samozrejme pre akýkoľvek logaritmus, aj prirodzený. Rovnaký absolútny nárast (o 100) na osi x spôsobí stále menší nárast na osi y. Vidíme teda, že nárasty na začiatku (skôr) vidno oveľa lepšie ako nárasty na konci (neskôr). To je presne opačná vlastnosť ako v prípade exponenciálneho rastu. A priamo súvisí s tým, že logaritmus je inverzná funkcia exponenciálnej.

 Percento na začiatku vidno rovnako ako percento na konci

Čo je ale pre tento článok najdôležitejšie, logaritmy umožňujú vyobraziť percentuálny rast na začiatku obdobia (t.j. pre malé absolútne hodnoty) úplne rovnako ako percentuálny rast na konci obdobia (pre vysoké absolútne hodnoty). Videli sme, že v prípade exponenciálneho rastu a jeho grafického vyobrazenia vidno oveľa viac 10%-ný nárast (ale aj pokles) na konci ako 10%-ný nárast (ale aj pokles) na začiatku. V prípade logaritmov vidno tieto nárasty úplne rovnako.

Na konkrétnom číselnom príklade:

50% nárast z 10 = 15, t.j. zvýšenie o 5
50% nárast z 2000 = 3000, t.j. zvýšenie o 1000

\ln 10 = 2.303,   a  \ln 15 = 2.708,   t.j. zvýšenie o 0.405
\ln 2000 = 7.601,   a  \ln 3000 = 8.006,   t.j. zvýšenie o 0.405

Matematické vysvetlenie

Nech p je náš percentuálny nárast vyjadrený ako násobok pôvodného čísla (v hornom príklade 50% nárast, t.j.   p=1.5), nech x je číslo, z ktorého tento percentuálny nárast počítame (v hornom príklade 10) a nech n je násobok tohto čísla, ktorým keď pôvodné číslo vynásobíme, dostaneme nové číslo, z ktorého chceme znova spočítať ten istý percentuálny nárast (v hornom príklade chceme počítať percentuálny nárast z 2000, a 10 * 200 je 2000, takže n = 200).

Problém v prípade klasického neupraveného grafu je, že pre n \gg 1

(1)   \begin{equation*}(p \cdot x - x)\text{  } \ll \text{  }(p \cdot n \cdot x - n \cdot x)\end{equation*}

T.j. ľudskou rečou, rovnaké percento nárastu pri vyšších hodnotách vidno oveľa viac ako rovnaké percento nárastu pri nižších hodnotách.  Ak ale aplikujeme na jednotlivé hodnoty logaritmus, napr. prirodzený, tak tento problém opadá:

(2)   \begin{equation*}\ln (p \cdot x) - \ln x \text{  }=\text{  } \ln (p \cdot n \cdot x) - \ln (n \cdot x)\end{equation*}

Prečo platí uvedená rovnosť? Využili sme pri nej nasledovnú vlastnosť logaritmov:

    \[\ln\frac{A}{B} = \ln A - \ln B\text{,    pre  }A, B > 0\]

Pre ľavú stranu vyššie uvedenej rovnice (2) teda platí

    \[\ln (p \cdot x) - \ln x = \ln(\frac{p \cdot x}{x}) = \ln p\]

A pre pravú stranu (2) platí

    \[\ln (p \cdot n \cdot x) - \ln (n \cdot x) = \ln(\frac{p \cdot n \cdot x}{n \cdot x}) = \ln p\]

Teda opäť ľudskou rečou, na grafe rovnaké percento nárastu pri vyšších hodnotách vidno tak isto ako rovnaké percento nárastu pri nižších hodnotách.

Riešenie problému nájdenia najväčšieho akciového poklesu

Späť teraz konečne k nášmu pôvodnému problému hľadania najväčšieho poklesu akciového indexu S&P 500 v období od roku 1928 do roku 1996. Môj (náš) úvodný tip je pripomenutý na grafe dole.

Pokles indexu S&P 500 od 25.8.1987 po 19.10.1987

Pokles indexu S&P 500 od 25.8.1987 po 19.10.1987

Graf je však veľmi dlhý a vyobrazuje exponenciálny rast. Je teda veľmi pravdepodobné, že nárasty (ale aj poklesy) na konci grafu vidíme oveľa výraznejšie ako nárasty (poklesy) na začiatku grafu. Aplikujme teraz na jednotlivé hodnoty grafu na y osi logaritmus. Výsledný graf je uvedený nižšie.

8

vývoj ceny akciového indexu S&P 500 od roku 1928 do roku 1997 s použitím logaritmickej škály

Tento nový (a správny) pohľad na graf odkryl veľa informácií, ktoré na klasickom grafe vidno neboli. A to najmä v jeho prvej polovici. Obrovský, vyše 10 rokov trvajúci prepad z rokov 1929-1942 nie je nič iné ako Veľká hospodárska kríza. Popri nej sa prepad trhov z Čierneho pondelka roku 1987 zdá byť zanedbateľný, alebo aspoň výrazne menší. Skutočne, porovnajme prepady:

Porovnanie prepadov akciového indexu S&P 500 počas Čierneho pondelku roku 1987 a Veľkej hospodárskej krízy v 30tych rokoch 20. storočia

Porovnanie prepadov akciového indexu S&P 500 počas Čierneho pondelku roku 1987 a Veľkej hospodárskej krízy v 30tych rokoch 20. storočia

Skutočne, prepad počas Veľkej hospodárskej krízy bol vyše 2.5 násobne horší ako počas Čierneho pondelku a činil vyše 86% stratu, z ktorej sa index zotavoval neuveriteľných 25 rokov.

Čo teraz? Sme stratení?

Nie sme 🙂 Len treba dať dobrý pozor keď nám niekto ukazuje dlhé grafy alebo hocijaké grafy, na ktorých vidno exponenciálny rast. Často skrývajú veľa dôležitých informácii, ktoré na prvý pohľad nevidno. Môžu byť preto bez správneho škálovania klamné. A logaritmy sú tu na to, aby nám okrem iného aj v takýchto situáciách pomohli interpretovať veci správne.

 


Poznámky

1. Index pozostávajúci z akcií 500 najväčších amerických firiem voľne obchodovateľných na burze.
2. Jednou z príčin bol americký útok na iránsku ropnú plošinu a s ním súvisiaca predchádzajúca ropná kríza.

Narodeninový paradox

Úloha

Predstavte si školskú triedu. Priemerne má tak 30 ľudí. Otázka je, aká je pravdepodobnosť, že aspoň dvaja ľudia majú narodeniny v ten istý deň. Pomyslíte si, že to nebude veľa. Je predsa 365 dní v roku a nás tu je len 30. A ešte tu je problém ako to matematicky dokázať. Je predsa toľko možností – môžu mať presne dvaja ľudia narodeniny v ten istý deň, alebo aj traja a tak ďalej.

Finta

Problém s príliš mnoho možnosťami môžeme elegantne obísť počítaním opačnej pravdepodobnosti. Predstavíme si veľmi jednoduchý príklad, kde pochopíme princíp. Máme šesť-stennú hraciu kocku. Vieme, že pravdepodobnosť, že padne nejaké konkrétne číslo (povedzme 3) je 1/6. Pretože máme spolu 6 možností čo môže padnúť a jedna z toho je „správna“, aspoň pre nás správna keď chceme aby padla 3. Pravdepodobnosť, že padne hocijaké číslo je 1, teda 100%, pretože vždy predsa nejaké číslo padne. Opačná pravdepodobnosť v tomto prípade je, že padne hocičo iné ako 3. Aká je pravdepodobnosť tohoto javu? No, pravdepodobnosť že padne 3 je 1/6 a celková pravdepodobnosť že padne nejaké číslo je 1. Intuitívne vidíme, že pravdepodobnosť toho, že padne hocičo len nie 3 bude doplnok k 1/6 do 1, čiže 5/6. Z tejto úvahy nám vyplynie jednoduchý vzorček

    \[p(A) = 1 - p'(A)\]

,
kde p(A) je pravdepodobnosť nejakého javu a p'(A) je pravdepodobnosť opačného javu. Naša finta teda je, že vypočítame pravdepodobnosť javu, že NIKTO z triedy nemá narodeniny v ten istý deň ako niekto iný.

Počty

Takže, chceme zistiť pravdepodobnosť, že z 30 ľudí v triede má každý narodeniny v iný deň. Začneme prvým človekom, ten ma k dispozícií celý kalendár, má 365 možností na narodeniny. Čo druhý človek? Ten už má len 364 možností, takže pravdepodobnosť je 364/365. Ak by sme v triede mali len dvoch ľudí, tak je to jednoduché:

    \[\frac{365}{365}\cdot\frac{364}{365} = \frac{365\cdot 364}{365^{2}}\]

Práve sme vypočítali pravdepodobnosť, že dvaja ľudia majú narodeniny v iný deň. Pridáme ďalšieho:

    \[\frac{365}{365}\cdot\frac{364}{365}\cdot\frac{363}{365} = \frac{365\cdot 364\cdot 363}{365^{3}}\]

a teraz takto budeme pokračovať až do 30, čiže dostaneme:

    \[\frac{365}{365}\cdot\frac{364}{365}\cdots\frac{336}{365} = \frac{365\cdot 364\cdots 336}{365^{30}}\]

Tak a teraz nám musí pomôcť kalkulačka, toto z hlavy nedávame. Kalkulačka (respektíve Wolfram Alpha, kalkulačky už netreba) však hlási 0.2937. Čo to je za číslo? To je pravdepodobnosť, že z 30 ľudí majú všetci narodeniny v iný deň. Je to opačný jav ako ten v našej otázke, takže len toto číslo odpočítame od 1 a dostaneme 0.7063. Takže pravdepodobnosť, že aspoň dvaja ľudia majú narodeniny v ten istý deň v triede o 30 ľudoch je 70.63%. To by ste nepovedali, je to prekvapujúco veľa.

Poučenia

Čo si z tohoto pekného štatistického príkladu vziať? Tak po prvé, že odmocnina z n – \sqrt{n} je približne počet číslo aby ste mali 50 percentnú šancu zhody medzi n vecami. Ak si vezmeme náš narodeninový paradox, tak u nás je n 365 a odmocnina z toho je približne 19. To znamená, že ak máme 19 ľudí, je približne polovičná šanca, že aspoň dvaja majú narodeniny v ten istý deň. Toto sa používa mimo iného aj v kryptografii – na tomto štatistickom základe pracuje tzv. birthday attack, alebo narodeninový útok, ktorý hľadá zhodu v hashovacích funkciách a veľmi skracuje čas potrebný na brute force (skúšanie všetkých možností).
Ďalšie poučenie môže byť, že potrebujete iba 13 ľudí a ak si každý z nich vyberie jedno písmeno z anglickej abecedy, máte 95% šancu, že dvaja vyberú to isté.
Dúfam, že týmto malým príkladom sa naučíte premýšľať o pravdepodobnosti trochu inak.

Ako otočiť obrázok?

Úloha

Otočiť obrázok o ľubovoľný uhol, napríklad 90 stupňov, proti smeru hodinových ručičiek okolo ľavého dolného rohu.

Pred otočením

Rendered by QuickLaTeX.com

Po otočení

Rendered by QuickLaTeX.com

Riešenie

Posaďme obrázok do súradnicového systému. Na otočenie celého obrázku je potrebné otočit každy jeden bod.

Rendered by QuickLaTeX.com

Zoberme si napríklad bod [1;3]. Vypočítame

    \[\cos(90^{\circ}) \cdot 1 - \sin(90^{\circ}) \cdot 3 = -3\]

    \[\sin(90^{\circ}) \cdot 1 + \cos(90^{\circ}) \cdot 3 = 1\]

a dostaneme súradnice otočeného bodu [-3;1].

Rendered by QuickLaTeX.com

Po otočení všetkých bodov rovnakým spôsobom získame

Rendered by QuickLaTeX.com

Teda všeobecne, ak označíme súradnice bodu, ktorý chceme otočť proti smeru hodinových ručičiek okolo počiatku súradného systému ako [x;y], tak súradnice otočeného bodu [x’;y’] vypočítame ako

    \[x'=\cos(\alpha) \cdot x - \sin(\alpha) \cdot y\]

    \[y'=\sin(\alpha) \cdot x + \cos(\alpha) \cdot y\]

Ako to funguje

Daný je vektor u = (x,y) a chceme získať súradnice otočeného vektora v = (x’,y’). Uhol alfa označuje v stupňoch veľkosť samotného otočenie okolo počiatku súradného systému, proti smeru hodinových ručičiek.

Rendered by QuickLaTeX.com

Matematicky vzaté, chceme nájsť funkciu f ktorá vezme ako parameter vektor u a vráti otočený vektor v

    \[\vec{v} = f(\vec{u})\]

Bez toho aby sme zatiaľ čokoľvek rátali si všimnime dve dôležité vlastnosti otočenia f

Prvá vlastnosť

    \[f(\vec{u_{1}} + \vec{u_{2}}) = f(\vec{u_{1}}) + f(\vec{u_{2}}),\]

pre ľubovoľné dva vektory u1 a u2.

Intuitívny dôkaz. Vidíme, že keď najskôr osobitne otočíme vektory u1 a u2 a potom už otočené sčítame dostaneme to isté, akoby sme rovno otočili u1 + u2.

Rendered by QuickLaTeX.com

sa rovná

Rendered by QuickLaTeX.com

Druhá vlastnosť

    \[f(c\cdot\vec{u})=c\cdot f(\vec{u}),\]

pre všetky skaláry c a vektory u.

Intuitívny dôkaz pre c = 2. vidíme, že keď najskôr otočíme vektor u a potom už otočený vektor f(u) vynásobíme dvomi dostaneme ten istý vektor a keby sme otočili vektor 2.u.

Rendered by QuickLaTeX.com

je to isté ako

Rendered by QuickLaTeX.com

Funkciu, ktorá spĺňa obe vlastnosti nazývame lineárne zobrazenie. Teda otočenie f je lineárne zobrazenie.

S týmto dôležitým poznatkom sa vráťme k pôvodnej úlohe nájsť f také, že

    \[\vec{v}=f(\vec{u})\]

S vlastností vektorov vyplýva

    \[\vec{u}=(x,y)=x\cdot (1,0) + y\cdot (0,1)\]

Ak označíme vektory e1 = (1,0) a e2 = (0,1)

(1)   \begin{align*} f(\vec{u}) & =f(x\cdot \vec{e_{1}} + y\cdot \vec{e_{2}}) \\  & =f(x\cdot \vec{e_{1}}) + f(y\cdot \vec{e_{2}})\quad\text{podla prvej vlastnosti} \\  & = x\cdot f(\vec{e_{1}}) + y\cdot f(\vec{e_{2}})\quad\text{podla druhej vlastnosti} \end{align*}

Kvôli tomu, že f je lineárne zobrazenie, nám teda stačí nájsť iba prepisy f(e1) a f(e2) na otočenie vektorov e1 a e2.

Prepis f(\vec{e_{1}})

Rendered by QuickLaTeX.com

Teda

(2)   \begin{equation*} f(\vec{e_{1}})=(\cos(\alpha),\sin(\alpha)) \end{equation*}

Prepis f(\vec{e_{2}})

Rendered by QuickLaTeX.com

Použili sme

    \begin{align*} \sin(\pi/2 + \alpha) &=\cos(\alpha) \\ \cos(\pi/2 + \alpha) &=-\sin(\alpha) \end{align*}

Teda

(3)   \begin{equation*} f(\vec{e_{2}})=(-\sin(\alpha),\cos(\alpha)) \end{equation*}

Výsledok

Dosadením prepisov (2) a (3) do odvodenia (1) a označením zložiek otočeného vektora v=(x’,y) dostávame

    \begin{align*} (x',y') &= f(\vec{u}) \\ &= x \cdot (\cos(\alpha),\sin(\alpha)) + y\cdot(-\sin(\alpha),\cos(\alpha)) \\ &= (x \cdot \cos(\alpha) - y \cdot \sin(\alpha), x \cdot \sin(\alpha) + y\cdot \cos(\alpha) ) \end{align*}

po zložkách

(4)   \begin{align*} x' &= x\cdot\cos(\alpha) - y\cdot\sin(\alpha)\\ y' &= x\cdot\sin(\alpha) + y\cdot\cos(\alpha)\\ \end{align*}

Bonus

Výsledok (4) možno zapísať pomocou matíc. Odteraz budeme vektory označovať v stĺpcovom tvare s hranatými zátvorkami

    \[\left[\begin{array}{c} x\\ y \end{array}\right] = (x,y)\]

Zadefinujme maticu 2×2 ako objekt so štyrmi čislami

    \[\left[\begin{array}{cc} a & b\\ c & d \end{array}\right]\]

ktorý nasledovne zľava-násobí vektory 2×1

    \[ \left[\begin{array}{cc} a & b\\ c & d \end{array}\right]\left[\begin{array}{c} x\\ y \end{array}\right]=x\cdot\left[\begin{array}{c} a\\ c \end{array}\right]+y\cdot\left[\begin{array}{c} b\\ d \end{array}\right] \]

Všimnime si, že výsledok násobenia je vektor 2×1. S touto definíciou môžeme (4) zapísať ako

    \[ \left[\begin{array}{c} x'\\ y' \end{array}\right]=\left[\begin{array}{cc} \cos(\alpha) & -\sin(\alpha)\\ \sin(\alpha) & \cos(\alpha) \end{array}\right]\left[\begin{array}{c} x\\ y \end{array}\right] \]

Príklady matíc otočenia

o 30 stupňov

    \[A=\left[\begin{array}{cc} \frac{\sqrt{3}}{2} & -\frac{1}{2}\\ \frac{1}{2} & \frac{\sqrt{3}}{2} \end{array}\right]\]

o 45 stupňov

    \[B=\left[\begin{array}{cc} \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2}\\ \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{array}\right]\]

o 90 stupňov

    \[C=\left[\begin{array}{cc} 0 & -1\\ 1 & 0 \end{array}\right]\]

Jednou z výhod tejto notácie je, že otočenia môžeme skladať. Ak chceme napríklad vektor u=(1,2) otočiť o 165 stupňov vyrátame

    \[A(B(C\vec{u}))) = \left[\begin{array}{c} -\frac{-1+\sqrt{3}}{\sqrt{2}}-\frac{1+\sqrt{3}}{2\sqrt{2}}\\ \frac{-1+\sqrt{3}}{2\sqrt{2}}-\frac{1+\sqrt{3}}{\sqrt{2}} \end{array}\right] \approx \left[\begin{array}{c} -1.484\\ -1.673 \end{array}\right]\]

V skutočnosti sa každé lineárne zobrazenie dá zapisať pomocou matíc. Tak môžeme skladať napríklad otočenia s natiahnutiami a reflexiami.

Hlava alebo znak?

Existuje historka o učiteľovi, ktorý zadal svojim žiakom domácu úlohu, nech si každý z nich 500x hodí mincou a zapíše celú postupnosť toho, čo na minci padalo. Samozrejme táto úloha bola pomerne dosť nudná a zdalo sa, že sa dá celkom rýchlo obísť tým, že mincou hádzať nebudeme a výsledok hodov si jednoducho vymyslíme – veď pravdepodobnosť toho, či padne hlava alebo znak v každom hode je vždy úplne rovnaká, je to 50:50. Veľa žiakov zvolilo práve túto druhú cestu a domácu úlohu si vymysleli. Na ich počudovanie učiteľovi sa podarilo takmer s istotou určiť, ktorí zo žiakov podvádzali a ktorí si domácu úlohu naozaj „odhádzali“.  Nemal žiadneho bonzáka a dokonca ani nehádal podľa toho ako žiakov poznal a teda naša otázka znie

Ako to zistil?

Odpoveď je jednoduchá – spoľahol na pravdepodobnosť. Na tú istú pravdepodobnosť, na ktorú sa spoľahli žiaci, ktorí si domácu úlohu vymysleli, avšak učiteľ mal jednu obrovskú výhodu – rozumel tejto pravdepodobnosti o niečo viac ako jeho žiaci. Pozrime sa teda bližšie na to, čo učiteľ na rozdiel od svojich žiakov mohol vedieť. Na začiatok si zoberme dvojeurovú mincu, ktorú hádžeme a zapisujeme si výsledky – vždy nám môže padnúť hodnota 2 alebo rub R mince. Hoďme touto mincou 20x a pozrime sa na výsledok. Môže vyzerať napríklad takto

R R 2 2 R R R R 2 R R R 2 R R R 2 2 2 2

alebo takto

R R 2 R 2 R R 2 2 R 2 R 2 2 R 2 R 2 2 R

alebo….možností ako to mohlo dopadnúť je veľmi veľa (počet možností je vždy presne 2^k, kde k je počet hodov, ktoré zaznamenávame, čiže v našom prípade k=20, čo je 2^{20}=1 048 576 možností.) Každá z týchto možností ako mohli hody po sebe nasledovať má sama o sebe rovnakú pravdepodobnosť (\frac{1}{2^k}). To znamená, že pravdepodobnosť, že pri 20 hodoch dostanem práve niektorú z vyššie spomenutých postupností je úplne rovnaká ako že dostanem napríklad práve postupnosť hodov

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

Mohlo by sa teraz zdať, že je úplne jedno akú postupnosť žiaci učiteľovi odovzdali napísanú na papieriku – pravdepodobnosť, že ju získali hádzaním mince je vždy rovnaká. Táto úvaha nám však vôbec nedáva odpoveď na otázku na základe čoho vedel učiteľ odhadnúť kto podvádzal a kto nie. Na zodpovedanie tejto otázky sa musíme na celý problém pozrieť z trošku inej perspektívy.

Nezávislosť hodov

V prvom rade si treba uvedomiť, že vždy keď hodíme mincou, tak ide o nezávislú udalosť. To znamená, že pri jednotlivých hodoch je pravdepodobnosť vždy 50:50 a nijako nezávisí od toho, čo padlo na minci predtým ani čo padne potom. Táto vec je intuitívne jasná, keďže nikto z nás nepredpokladá, že minca si niečo pamätá. A práve tu prichádzame k prvému rozdielu v postupnostiach, keď si poradie vymýšľame a keď ho naozaj tvoríme hádzaním mince. Tým, že si ľudia často pod náhodnosťou nesprávne predstavia, niečo čo považujú za čo najviac nesúrodé a chaotické, tak pri vymýšľaní poradia hodov majú tendenciu riadiť sa rozhodnutiami typu „už som veľa krát napísal rub R musím to zmeniť na 2“ alebo naopak. A práve tu sa dopúšťame obrovskej chyby – pri tomto zmýšľaní má totiž zrazu naša minca pamäť! Keď takto (celkom prirodzene) zmýšľame pri vytváraní postupnosti hodov, tak naša vymyslená minca chtiac-nechtiac už nie je ako tá naozajstná, pretože keď na nej viac krát po sebe padne rovnaký znak, tak máme tendenciu ho v ďalšom hode zmeniť, čiže pravdepodobnosť pri nasledujúcom hode už nie je 50:50, ale posúva sa v prospech toho, čo nepadlo v predošlom hode. Takto vymýšľané hody nie sú nezávislé a teda postupnosť, ktorú vytvoria sa bude líšiť od tej, ktorú vytvorí naozajstná minca.

Len na základe tohto zásadného rozdielu zatiaľ síce stále nevieme ako postupnosti od seba rozlíšiť, ale už si vieme asi predstaviť, že budú v niečom rozdielne keďže princíp, ktorým sú vytvárané je rozdielny – v prvom (poctivom) prípade máme nezávislé hody reálnou mincou bez pamäte, v druhom prípade máme hody, ktoré postupne na sebe závisia našou snahou vytvárať čo „najnáhodnejší reťazec“, kvôli čomu už pravdepodobnosť v každom hode nie je 50:50.

Pravdepodobnosť sérii

Keby dal učiteľ za úlohu žiakom hodiť mincou iba 10 krát, tak by pravdepodobne mohol naozaj len hádať, kto si hody vymyslel a kto mincou naozaj hádzal. Pri 500 hodoch však už môžme očakávať, že sa prejavia nejaké pravdepodobnostné charakteristiky takto generovanej postupnosti. Zatiaľ o našom hode mincou vieme:

  1. Pravdepodobnosť každej strany mince v každom hode je rovnaká. (0.5)
  2. Pravdepodobnosť, že padne práve daná konkrétna postupnosť 500 hodov je rovnaká pre ľubovoľnú zvolenú postupnosť.

Doposiaľ sme sa teda zaoberali buď samotným hodom alebo celou postupnosťou hodov. Finta, ktorú učiteľ využil ale spočíva v tom, že sa pozrieme iba na krátke časti vzniknutej postupnosti, čo sa najlepšie dá predstaviť na príklade. Zoberme si, že sa pozeráme iba na 4 po sebe idúce hody, ktoré môžu vyzerať takto

2 R R R   alebo   R 2 R R   alebo   2 R R 2   alebo …..

Skúste si vypísať všetky možnosti ako tieto hody môžu vyzerať! Podľa toho, čo už vieme, tak ich je presne 2^4=16. Toto však znamená, že pravdepodobnosť každej takejto štvorice je \frac{1}{16}=0.0625. V praxi to teda znamená, že v priemere 1 zo 16 takto vzniknutých postupností 4 hodov mincou bude séria  rubov R R R R a to isté platí pre sériu 2 2 2 2. Celkovo teda pri 4 hodoch máme pravdepodobnosť, že to bude nejaká séria  

    \[\frac{1}{16}+\frac{1}{16}=\frac{1}{8}=0.125=12.5\%.\]

Podobnú úvahu by sme mohli spraviť postupnosti 5 hodov, kde by sme znova mohli vypočítať aká je pravdepodobnosť takto dlhých sérií. Táto by bola síce nižšia no stále nie zanedbateľná.

Vráťme sa teraz späť k nášmu pôvodnému príkladu s 500 hodmi. Keďže vieme, že všetky hody sú nezávislé, tak si môžme na vzniknuté postupnosti 500 hodov pozrieť ako na veľa postupností s menším počtom hodov (napríklad 125 postupností 4 hodov je to isté ako jedna postupnosť 500 hodov). A práve tu z tejto perspektívy, keď si dáme dokopy všetko, čo bolo doposiaľ povedané sa dostávame na koreň veci tomu ako učiteľ odhalil podvodníkov – vo výsledkoch, ktoré dostal hľadal série rôznej dĺžky, ktoré by sa pri kratších počtoch hodov ako je 4 či 5 mali vyskytovať v tak dlhom reťazci podľa ich vyššie odvodenej pravdepodobnosti výskytu niekoľkokrát. V reťazcoch, ktoré boli vymýšľané z hlavy a teda neboli nezávislé sa takéto série nevyskytovali alebo vyskytovali oveľa menej, keďže tieto postupnosti nevznikali pomocou nezávislých hodov ale pomocou tendencie striedať znaky a tak vytvoriť „nepodozrivú“ náhodnú postupnosť – nuž a nakoniec zdá sa – opak bol pravdou. 🙂

 

Pokračovať v čítaní