Теореми със страшни имена: Doob's optional sampling theorem, или защо не можем да победим казиното
ное 28Математиката не е сложна, тя само се преструва.
Докато в много области на колективните занимания критериите за строгост на изказа са препоръчителни, в математиката са необходимост. Само че доста хора бъркат строгостта на изказа със специфичната терминология - къде с цел да объркат читателя, къде с цел да объркат сами себе си.
Затова реших да започна тематична серия със статии, в които обяснявам сложно звучащи, но прости в същността си теореми, които имат интересни резултати1.
Започваме с въпроса "абе няма ли някоя стратегия в казиното, която да работи", който се отговаря с теоремата на Дуб.
Нека имаме проста игра. В началото имаш лева. Хвърляме монетка, ако се падне ези ти давам 1 лев, ако се падне тура ти ми даваш 1 лев.
Ако приемем монетата за балансирана, тогава количеството пари у теб ще се изменя съобразно резултата от хвърлянето, но и от стратегията ти. Това количество представлява една случайна величина (в интуитивен смисъл), която ще означаваме , където
е момента, в който я мерим (0 за началния, 1 след 1 хвърляне и т.н.).
Математиците дефинират понятието "очакване" (означено с ) на случайна величина, като сумата от размера на величината, умножен с вероятността, с която тя заема този размер. Например нека вземем момента след първото хвърляне. Ако се е паднало ези, ще имаш
пари (със вероятност 1/2), а ако се е паднало тура, ще имаш
пари. Като сумираме получаваме очакването
Нещо повече, ако разгледаме играта две стъпки напред, се оказва, че очакването също е - вероятността за две езита е 1/4, за две турата е 1/4, а за ези и тура, или тура и ези, е 1/2:
Лесно се доказва за колкото стъпки напред искаме. Нещо повече, същото е вярно който и момент от играта да вземем за начален. Тоест, ако сме изиграли игри, и в резултат на тях имаме
пари, то "очакването" на
ще е също
.
Такива игри, в които очаквания брой пари след колкото искаме стъпки напред е равен на сегашния брой пари, се наричат мартингали, по името на една стратегия на залагане във средновековна Франция.2
"Очакването" на една случайна величина е странна концепция, но и адски полезна.
Странна, защото ако забелязахте, очакването след 1 игра е да имаме пари, но това разбира се е невъзможно, тъй като ще имаме или
или
пари! Но "средно"3 ще имаме
пари. Това най добре се илюстрира с факта, че 99.9999% от хората имат повече крака от средното - наистина, ако имаме 1 от милион души с отрязан крак, то средния брой крака е 1.99999, което е по-малко от 2 - броя крака на 99.9999% от хората.
Полезна е, защото ако имаме n човека, които играят тази игра, (т.е. много пъти да почваме от пари), то средно аритметичното на парите, които всички тези хора имат след 1 хвърляне, ще е число, което клони към
с нарастване на броя на хората. Или от 100-те човека някои ще са спечелили, някои ще са загубили, но казиното ще е загубило приблизително 0 пари на човек.
Остава да кажем какво означава момент на спиране. Момент на спиране е момент от време, в който спираме играта. За дефинирането на този момент можем да разчитаме само на информацията, която знаем до момента, тоест в момент при дадено състояние на парите ни до този момент, трябва да кажем дали спираме с играта или не. Например "спирам след 5 хода" е валиден момент на спиране. Обаче "спирам, ако знам че няма да печеля следващите 5 игри" не е, тъй като в определението използваме информация, която не ни е известна до този момент.
Времето на спиране също е случайна величина, понеже зависи от хвърлянето на монетката, така че то има очакване. То обаче може да е безкрайно (например при време на спиране - никога), само че няма особен смисъл от такива моменти на спиране.
Теоремата на Дуб твърди, че ако сме имаме мартингал и момент на спиране с крайно очакване, то очакването на мартингала в момента на спирането е равно на стойността му в началния момент.
Тоест "Казиното Никога Не Губи", или поне "Казиното Не Губи Много Пари При Много Игри и Крайно Време"4.
Вероятно се питате дали не може да приложите момент на спиране "спирам когато имам 1 млн долара". Тогава, тъй като ще имате 1 млн долара всеки път като спрете, то и очакваната стойност на парите ви в момента на спиране ще е 1 млн долара ... само че този момент на спиране има безкрайно очакване, така че дори да имате безкрайно голям бюджет, ще печелите само ако имате и безкрайно много време да играете.5
А ако имате ограничен бюджет, то очакваното време на играта ви ще е крайно, но пък може да фалирате, и магически се оказва, че загубата ви при фалит, умножена с вероятността за него ще компенсира точно очакваната печалба по нейната вероятност.
В реално казино обаче има такси за участие, прибирани като процент от залозите (а когато не прибира процента то играта е нечестна, като рулетката и блекджека, можем да я разделим на две части - честна игра и процент от залога, прибиран от банката). Така че средно казиното не просто не губи, ами и печели в дългосрочен план.
А мартингалната стратегия представлява следното: нека играта ни дава възможност колко пари да залагаме, като печелим 1 лв за всеки заложен лев при ези и губим залога при тура. Залагаме 1 лв. Ако загубим, залагаме 2 лв. Ако загубим пак, залагаме 4 лв и т.н. Надеждата е, че рано или късно ще спечелим поне една игра, при което печелим всичко загубено досега, плюс 1 лев.
Само че играта е маргингал, и теоремата на Дуб ни разваля деня.
При това забележете, че теоремата на Дуб не зависи от стратегията6, а само от играта, което ipso facto обрича всяка страгегия на провал.
- А за новаците (бел. авт. да се чете - наивниците) определено са изненадващи ... [↩]
- Математиците имат и чувство за хумор. [↩]
- Не средноаритметично, а средно претеглено с вероятността! [↩]
- "Tigers are nice", or at least "Tigers are Nice In Moderation and At a Safe Distance.", виж Science of the Discworld [↩]
- Това не значи че играта ви ще отнеме безкрайно много време, а че ако нямате безкрайно много време то ще бъдете ограничени. Съответно това крайно много време може и да не ви стигне да спечелите 1 млн долара и да се задоволите с текущия резултат при който може да сте произволно назад ... Кой казва, че безкрайността трябва да е лесна за разбиране? [↩]
- Стига тя да е с крайно време на очакване, разбира се. [↩]
Comments