Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Stránky: 1
Ahoj,
dva háči hrají tuto hru:
Probíhá v několika (potenciálně nekonečně) kolech, v každém kole náhodný generátor s pravděpodobností p vrátí 1, v opačném případě vrátí 0. Před každým vygenerováním čísla každý hráč řekne, zda končí nebo ne (hráč soupeřovu volbu nezná).
1) Pokud padla 1 a hráč A zvolil, že neskončí a hráč B zvolil, že skončí, tak hráč B vyhrál. (Totéž pro záměnu hráčů A a B.)
2) Pokud padla 1 a oba hráči zvolili, že skonří nebo oba zvolili že neskončí, tak je remíza.
3) Pokud padla 0 a hráč A zvolil, že neskončí a hráč B zvolil, že skončí, tak hráč A vyhrál. (Totéž pro záměnu hráčů A a B.)
4) Pokud padla 0 a oba hráči zvolili, že skončí, tak je remíza.
5) Pokud padla 0 a oba hráči zvolili, že neskončí, tak se hraje další kolo.
Otázka zní jakou zvolit strategii, abych jako hráč (při velkém opakování této hry) dosáhnl co nejlepšího výsledku (co největšího počtu výher - případně jako další alternativa co nejvíce výher a remíz). Strategie je ve tvaru, že s pravděpodobností q zvolím, že skončím. Nabízí se volit q=p, ale otázka je, zda je to optimální strategie.
Offline
↑ check_drummer:
Ahoj, pokud jedničky a nuly nepadají se stejnou pravděpodobností, osobně bych zkusil jako hráč A primitivní strategii:
Když p>0,5 (jedničky jsou častější), budu stále dávat "Končím". Když padne 1, nemůžu prohrát; při 0 prohraju jenom když B dá "Nekončím".
Když p<0,5, budu stále dávat "Nekončím". Když padne 0, vyhrávám nebo je další kolo. Při 1 prohraju jenom když B dá "Končím".
Offline
↑ check_drummer:
Jo a koukám, že jako B bych hrál asi taky tak...
Offline
↑ osman:
Ahoj. Zamyslím se nad tím. A co p=1/2? Asi se nabízí q=p. A nebo třeba volit q v každém kroku náhodně. :-) Ale možná je to ekvivalentní volbě q=1/2...
Offline
↑ check_drummer:
Taky mi to tak vychází - očekávaný zisk je q.(2p-1) (edit: ne úplně, odstranil jsem z toho konstantní členy), takže z toho je to jasně vidět jak volit q.
Takže zbývá případ p=1/2. Tam to skoro vypadá, že lze q volit libovolně, zamyslím se.
Offline
↑ check_drummer:
Jeví se mi to, že v tom případě lze q volit libovolně.
Offline
Stránky: 1