RSS
 

Теореми със страшни имена: Doob's optional sampling theorem, или защо не можем да победим казиното

28 Ное.

Математиката не е сложна, тя само се преструва.

Докато в много области на колективните занимания критериите за строгост на изказа са препоръчителни, в математиката са необходимост. Само че доста хора бъркат строгостта на изказа със специфичната терминология - къде с цел да объркат читателя, къде с цел да объркат сами себе си.

Затова реших да започна тематична серия със статии, в които обяснявам сложно звучащи, но прости в същността си теореми, които имат интересни резултати1.

Започваме с въпроса "абе няма ли някоя стратегия в казиното, която да работи", който се отговаря с теоремата на Дуб.

Нека имаме проста игра. В началото имаш x лева. Хвърляме монетка, ако се падне ези ти давам 1 лев, ако се падне тура ти ми даваш 1 лев.

Ако приемем монетата за балансирана, тогава количеството пари у теб ще се изменя съобразно резултата от хвърлянето, но и от стратегията ти. Това количество представлява една случайна величина (в интуитивен смисъл), която ще означаваме X_t, където t е момента, в който я мерим (0 за началния, 1 след 1 хвърляне и т.н.).

Математиците дефинират понятието "очакване" (означено с \mathbb{E}) на случайна величина, като сумата от размера на величината, умножен с вероятността, с която тя заема този размер. Например нека вземем момента след първото хвърляне. Ако се е паднало ези, ще имаш x + 1 пари (със вероятност 1/2), а ако се е паднало тура, ще имаш x-1 пари. Като сумираме получаваме очакването

\mathbb{E}X_1 = 1/2 \times (x + 1) + 1/2 \times (x - 1) = x

Нещо повече, ако разгледаме играта две стъпки напред, се оказва, че очакването също е x - вероятността за две езита е 1/4, за две турата е 1/4, а за ези и тура, или тура и ези, е 1/2:

\mathbb{E}X_1 = 1/4 \times (x + 2) + 1/4 \times (x - 2) + 1/2 \times x = x

Лесно се доказва за колкото стъпки напред искаме. Нещо повече, същото е вярно който и момент от играта да вземем за начален. Тоест, ако сме изиграли t игри, и в резултат на  тях имаме y пари, то "очакването" на X_{t+1} ще е също y.

Такива игри, в които очаквания брой пари след колкото искаме стъпки напред е равен на сегашния брой пари, се наричат мартингали, по името на една стратегия на залагане във средновековна Франция.2

"Очакването" на една случайна величина е странна концепция, но и адски полезна.

Странна, защото ако забелязахте, очакването след 1 игра е да имаме x пари, но това разбира се е невъзможно, тъй като ще имаме или x+1 или x-1 пари! Но "средно"3 ще имаме x пари. Това най добре се илюстрира с факта, че 99.9999% от хората имат повече крака от средното - наистина, ако имаме 1 от милион души с отрязан крак, то средния брой крака е 1.99999, което е по-малко от 2 - броя крака на 99.9999% от хората.

Полезна е, защото ако имаме n човека, които играят тази игра, (т.е. много пъти да почваме от x пари), то средно аритметичното на парите, които всички тези хора имат след 1 хвърляне, ще е число, което клони към x с нарастване на броя на хората. Или от 100-те човека някои ще са спечелили, някои ще са загубили, но казиното ще е загубило приблизително 0 пари на човек.

Остава да кажем какво означава момент на спиране. Момент на спиране е момент от време, в който спираме играта. За дефинирането на този момент можем да разчитаме само на информацията, която знаем до момента, тоест в момент t при дадено състояние на парите ни до този момент, трябва да кажем дали спираме с играта или не. Например "спирам след 5 хода" е валиден момент на спиране. Обаче "спирам, ако знам че няма да печеля следващите 5 игри" не е, тъй като в определението използваме информация, която не ни е известна до този момент.

Времето на спиране също е случайна величина, понеже зависи от хвърлянето на монетката, така че то има очакване. То обаче може да е безкрайно (например при време на спиране - никога), само че няма особен смисъл от такива моменти на спиране.

Теоремата на Дуб твърди, че ако сме имаме мартингал и момент на спиране с крайно очакване, то очакването на мартингала в момента на спирането е равно на стойността му в началния момент.

Тоест "Казиното Никога Не Губи", или поне "Казиното Не Губи Много Пари При Много Игри и Крайно Време"4.

Вероятно се питате дали не може да приложите момент на спиране "спирам когато имам 1 млн долара". Тогава, тъй като ще имате 1 млн долара всеки път като спрете, то и очакваната стойност на парите ви в момента на спиране ще е 1 млн долара ... само че този момент на спиране има безкрайно очакване, така че дори да имате безкрайно голям бюджет, ще печелите само ако имате и безкрайно много време да играете.5

А ако имате ограничен бюджет, то очакваното време на играта ви ще е крайно, но пък може да фалирате, и магически се оказва, че загубата ви при фалит, умножена с вероятността за него ще компенсира точно очакваната печалба по нейната вероятност.

В реално казино обаче има такси за участие, прибирани като процент от залозите (а когато не прибира процента то играта е нечестна, като рулетката и блекджека, можем да я разделим на две части - честна игра и процент от залога, прибиран от банката). Така че средно казиното не просто не губи, ами и печели в дългосрочен план.

А мартингалната стратегия представлява следното: нека играта ни дава възможност колко пари да залагаме, като печелим 1 лв за всеки заложен лев при ези и губим залога при тура. Залагаме 1 лв. Ако загубим, залагаме 2 лв. Ако загубим пак, залагаме 4 лв и т.н. Надеждата е, че рано или късно ще спечелим поне една игра, при което печелим всичко загубено досега, плюс 1 лев.

Само че играта е маргингал, и теоремата на Дуб ни разваля деня.

При това забележете, че теоремата на Дуб не зависи от стратегията6, а само от играта, което ipso facto обрича всяка страгегия на провал.

  1. А за новаците (бел. авт. да се чете - наивниците) определено са изненадващи ... []
  2. Математиците имат и чувство за хумор. []
  3. Не средноаритметично, а средно претеглено с вероятността! []
  4. "Tigers are nice", or at least "Tigers are Nice In Moderation and At a Safe Distance.", виж Science of the Discworld []
  5. Това не значи че играта ви ще отнеме безкрайно много време, а че ако нямате безкрайно много време то ще бъдете ограничени. Съответно това крайно много време може и да не ви стигне да спечелите 1 млн долара и да се задоволите с текущия резултат при който може да сте произволно назад ... Кой казва, че безкрайността трябва да е лесна за разбиране? []
  6. Стига тя да е с крайно време на очакване, разбира се. []
 

Tags: , ,

Остави коментар.

Идеята на коментарът е да има принос към дискусията или да изразява гледна точка. Коментари, несвързани с темата, както и пълни с обидни или вулгарни думи, както и лични нападки, няма как да допринесат за това и ще бъдат трити.

 

*

 
  1. Longanlon

    ноември 28, 2010 at 3:14 pm

    хахахаха баце, опитваш се да стреляш по муха с оръдие

    нима си мислиш, че някой, който не може да разбере, че няма как да надиграе казиното, ще може да разбере математическите ти обяснения? или си мислиш, че някой, който толкова разбира от математика, че да схване какво му казваш, има нужда от съвета ти по въпроса?!?

     
  2. pi314

    ноември 28, 2010 at 6:18 pm

    Добре де, а ти как би обяснил защо не можем да победим казиното?

    Иначе не вярвам математиката на събиране и умножение на рационални числа да е кой знае каква философия, ама след като казваш ...

    А пък мисля да понапиша каква простотия е техническия анализ, за който гледам доволно много реклами (стани Forex трейдър с два клика на мишката и печели РЕАЛНИ пари ;-)), ама не мога да обясня защо е голяма идиотщина без да използвам числа.

     
  3. Божо

    ноември 28, 2010 at 7:25 pm

    Един приятел нарича хазартните игри (вкл. тото, лотария и т.н) "данък математика" 🙂

     
  4. Longanlon

    ноември 28, 2010 at 9:41 pm

    "ако беше възможно, всеки щеше да го прави"?

     
  5. Божо

    ноември 29, 2010 at 12:59 am

    Не - играят ги хора, които много много не разбират от математика 😉
    А ако беше възможно, нямаше да има казина и други организатори на хазартни игри, защото нямаше да имат полза 🙂

     
  6. Чанко

    ноември 29, 2010 at 8:40 am

    "Един приятел нарича хазартните игри (вкл. тото, лотария и т.н) „данък математика“"
    Божо

    Вярно си е.
    Но във всяко конкретно залагане можеш да си повишиш шансовете с правилно избрана стратегия.
    Пример рулетка: Да се играе с три чипа, заложени около едно и също число на: 4 числа, на 6 числа и на редица. След определен брой залози едно изплащане компенсира донякъде загубите до момента.
    Пример тото2: Да се направи числов анализ на излезлите до момента числа, като се определи средният интервал (в брой тегления ) на излизане на всяко едно число. Тогава за всеки последващ тираж има само една комбинация от числа, която би трябвало да 'излезе' с по-голяма вероятност.

     
  7. pi314

    ноември 29, 2010 at 9:48 am

    Лонги, „ако беше възможно, всеки щеше да го прави“? не е много напредничаво ;-). Ако това беше валиден отговор, никой нищо нямаше да се изобрети.

    Чанко, това което описваш за рулетката е по-скоро как да забавиш излизането си от играта. Примено, най-бързия начин да фалираш е да залагаш всички пари накуп, затова е добре да залагаш само с част от парите си, но това е повече управление на залозите измежду игрите. В интерес на истината оптималната стратегия за това се определя с прилагане на теория на информацията.

    При всички положения очакваната печалба на едно залагане е 36/37-ми от залога и нямаш никаквъв шанс да го промениш с една йота.

    За тотото описваш христоматиен пример за Gambler's fallacy. Разбира се, ако числата в тотото не са манипулирани, което в България си е истински риск :).

    Междувпрочем, вероятността за печалба няма да промениш, но можеш да намалиш вероятността да сплитваш джакпота като залагаш само на числа, по-големи от 31 - много хора залагат на дати ;-).

     
  8. Longanlon

    ноември 29, 2010 at 10:46 am

    Чанко, това с "анализа" на изтеглените предишни тиражи числа на Тото 2 е чиста загуба на време - шансът да се паднат някакви числа е абсолютно идентичен всеки път, независимо какво се е падало преди.

    В тоя ред на мисли, шансът да се паднат същите числа като предишния път е абсолютно идентичен с този да се падне каквато и да е друга комбинация.

     
  9. Чанко

    ноември 30, 2010 at 7:53 am

    Точно това описвам pi314. И в студентските години сме го тествали на домашна рулетка, до свършване на запасите ни от коняк....
    Заблудата на комарджията е истина. Но прилагането на каквато и да е стратегия в 'играта' води до промяна на резултата от нея. Другият вариант е да се ползва метода на Станислав Лем от романа "Сенна хрема" - срещу случайността да се бориш само със случайност.....
    🙂

     
  10. Мира

    декември 16, 2010 at 11:46 am

    Лонганлоне, идеята на анализа при тотото е да се установи коя топка се различава от другите така, че вероятността да се падне да е по-висока. 😉 И по-ниска съответно.

     
  11. Longanlon

    декември 16, 2010 at 1:13 pm

    ха, това е интересно 🙂

     
  12. pi314

    декември 16, 2010 at 2:28 pm

    Ако не ги сменяха през време, и ако не ги проверяваха за баланс чат-пат ...

     
  13. Мира

    декември 17, 2010 at 12:55 pm

    Ъъъ, ами това, че ги сменят, не обърква ли и "анализа" на Чанко също така? Защото едно и също число не е едно и също, когато е на различна топка. 😛 😛
    Я Чанко да си каже.

     
  14. Мира

    декември 17, 2010 at 12:59 pm

    "да намалиш вероятността да сплитваш джакпота"
    Или, както някой друг беше предложил, още по-добре е да залагаш с 6 поредни числа, щото почти никой друг не прави така.
    Освен този, който го прави по същите съображения, де. Като в тъпия виц за заразно болния и хипохондрика, дето и двамата в кафенето пиели откъм дръжката на чашата, защото никой друг няма да прави така.

     
  15. NiCodile

    януари 4, 2011 at 10:52 pm

    Страшно добро обяснение, кеф ми беше да го прочета!

     
  16. Гошето

    септември 28, 2011 at 7:10 pm

    Анализът е интересен, но фокусиран основно върху математическото очакване. Например при игра на монета в която залагаш на ези тура 1лв. при равни вероятности за успех при всеки опит, очакваната печалба след n oпита е нула.

    За някои играчи ще бъде интересно обаче да узнаят каква е [b]вероятността[/b] за конкретна печалба. В примера на монетата, вероятността за успех при всяко хвърляне е 1/2, а ни интересува вероятността за к успешни опита при n хвърляния, за да може да сметнем печалбата. Това се представя много удобно с опита на Бернули. Например при 4 хвърляния вероятността да спечелим точно 3 пъти (съответно да спечелим 3.1-1.1=2лв.) е 1/4. Вероятността да спечелим 4 пъти (и съответно 4.1 = 4лв.) е 1/16. Както се вижда, вероятността да спечелим все повече и повече силно намалява. Има формула и за вероятността да спечелим поне k пъти. Така всеки ще знае шанса си да спечели произволни x лв.