Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Stránky: 1
Ahoj,
mějme hru hru dvou hráčů, kdy každý hráč předem zvolí z daných n symbolů jeden a následně si tyto symboly vzájemně sdělí. Je dáno pravidlo, který symbol porazí který, a pokud to nastane, získává vyhrávající hráč bod. (Může nastat i remíza a za tu se body neudělují.) Chceme navrhnout "co nejlepší" strategii - ve smyslu, že bude sehráno mnoho her a který z hráčů po těchto mnoha hrách získá více bodů, vyhrál.
Přesněji:
1) Strategie spočívá v tom, že každému symbolu je přiřazena nějaká pevná pravděpodobnost, se kterou bude symbol zvolen a při každé hře je nějaký symbol vybrán úměrně této pravděpodobnosti. V příští hře je vybrán symbol nezávisle na volbě symbolu v předchozí hře.
2) Nejlepší strategie je ta, se kterou lze očekávat největší pravděpodobnost výhry při co nejlepší zvolené protistrategii soupeře.
(Lze volit i jiné, alternativní definice strategie, bylo by zajímavé je prozkoumat.)
Např. při hře kámen-nůžky-papír je tedy n=3 a lze ukázat, že nejlepší strategie je přiřadit každému symbolu pravděpodobnost 1/3.
Ve složitější variantě známé z Teorie velkého třesku kámen-nůžky-papír-tapír-Spock (n=5) každý sybol zvítězí i prohraje se dvěma ostatními symboly, takže zde bude ona pravděpodobnost volby každého symbolu také vždy stejná (1/5) (a tedy je celkem nezajímavá), ale by bylo zajímavé tuto hru modifikovat tak, aby některý symbol zvítězil nad třemi a prohrál jen s jedním symbolem.
Otázka je, zda nejlepší strategie vždy závisí jen na "lokálním okolí" danéhu symbolu, tj. že hledané pravděpodobnosti volby symbolu lze vyjádřit pouze ze znalosti, s kolika symboly tyto symboly prohrají/vyhrají a nebo zda je pro stanovení strageie nutná nějaká další znalost "grafu" zachyujícího relaci "vyhrává nad".
(Nejspíš je toto téma teoreticky zpracováno pomocí teorie her, a to pomocí pojmů maticová hra, smíšená strategie, na základě čehož by mělo být možná otázky výše také zodpovědět.)
Online
Podle mě se na tom nic nevymyslí.
Pokud je každá z voleb (kámen-nužky-papír-.....) stejně dobrá, tj má stejnou naději na výhru, tak nejlepší co můžeme udělat je náhodně je střídat. Pokud je nebudeme střídat náhodně, hrozí že protihráč odhalí způsob, jakým střídání provádíme.
Pokud by nějaká volba byla lepší než ostatní, bude nejlepší strategie používat tu nejlepší volbu.
Aspoň mi to tak připadá logické...
Offline
Ahoj
MichalAld napsal(a):
Podle mě se na tom nic nevymyslí.
Pokud je každá z voleb (kámen-nužky-papír-.....) stejně dobrá, tj má stejnou naději na výhru, tak nejlepší co můžeme udělat je náhodně je střídat.
To ano, ale to je speciální případ. Nás zajímá obecné řešení.
MichalAld napsal(a):
Pokud by nějaká volba byla lepší než ostatní, bude nejlepší strategie používat tu nejlepší volbu.
Co myslíš tím, že je nějaká volba lepší než ostatní?
Online
↑ check_drummer:
No kdyby byla třeba hra kámen-nůžky-papír-černá díra, kde černá díra by vítězila nad vším ostatním.
Offline
↑ MichalAld:
To je také pravda, ale nás zajímá obecné řešení, nikoli jen speciální případy.
Online
Já moc nechápu, v čem spočívá ta obecnost.
Ještě jsem koukal, že předpokládáš, že tahy soupeře nemusejí být optimální, ale budou mít předem danou pravděpodobnost.
Ale co se týká vlastní hry - jaké je vlastně to obecné zadání ?
Offline
↑ MichalAld:
Obecnost je v tom, že je dán libovolný počet symbolů a libovolné vztahy mezi nimi - který symbol porazí který.
Tou pravděpodobností je ale dána optimalita - jsou hry, kdy optimální strategie jedána těmi pravděpodobnostmi. Takže předpokládám optimální reakci soupeře. Samozřejmě speciálním případem takové strategie může být hrát pořád jeden symbol.
To obecné zadání popisuji výše hned v prvním příspěvku - je dáno n symbolů a obecné vztahy který symbol vítězí nad kterým.
Online
Stačí zkoumat ty grafy, ve kterých neexistují vrcholy, ze kterých nevedou žádné hrany (šipky) - ty lze odstranit (případně i rekurzivně). Pokud existuje vrchol, do kterého nevede žádná hrana (šipka), pak lze jako strategii volit vždy tento vrchol a vždy alespoň remizujeme.
Tedy zajímavé jsou jen ty případy, kdy je každá hrana součástí nějaké (orientované) kružnice, případně není-li tomu tak, tak se tato hrana nalézá na nějaké cestě spojující dvě kružnice.
Edit: Lze se omezit na maximální podgraf takový, že každá hrana leží na nějaké kružnici a takový, že do žádného vrcholu tohoto podrafu nemíří jiná hrana ležící mimo tento podgraf (tj. hrana spojující dvě kružnice a která sama na kružnici neleží). Stačí to, protože ostatním vrcholům mimo tento podgraf přiřadíme pravděpodobnost 0.
Online
Pozdravujem ↑ check_drummer:
Tu je nieco o tom
https://en.m.wikipedia.org/wiki/Rock–paper–scissors .
Offline
Zrovna jsem o tomto témátu přemýšlel, ale zapoměnl jsem, že už jsem ho zadal. :-)
Jako první iterace mě napadá, že zvolím-li nějaký symbol a soupeř zvolí náhodně se stejnou pravbděpodobností nějaký symbol, tak lze určit pravděpodobnost, s jakou zvítězím. Tuto pravděpodobnost pro symbol i označím pi. To provedu pro každý symbol a to, jaký symbol nakonec zvolím provedu náhodně, ovšem každý symbol nebude mít stejnou pravděpodobnost, že bude vybrán, ale tato pravděpdoobnost bude úměrná hodnotě pi.
To byla první iterace. problém však je v tom, že soupeř nebude vybírat symboly se stejnou pravděpdoobností, ale použije předpokládejme stejný postup jako já. Pak ta úvaha bude složitější a na hodnoty pi budou mít vliv hodnoty pj. Tak získám nějakou soustavu rovnic, tu vyřeším,a získám hodnoty pi. Konkrétně mi vychází, že ta soustava je tvořena rovnicemi tvaru [mathjax]p_i = \frac{\sum{p_j}}{s}[/mathjax], kde sčítáme přes ta j, kde i porazí j a s je součet všech hodnot pj takových, že nějaké k porazí j - tj. v s se vyskytuje pj tolikrát, kolikrát symbol j prohraje s nějakým jiným symbolem.
To by mohlo fungovat, ale např. vůbec nezohledňuju globální strukturu grafu vazeb znázorňující to jaký symbol porazí který, ale jen zkoumám až výsledné pravděpdoobnosti vítězství (tj. jen bezprostřední lokální sousedy). Ale možná to stačí...
Tak na základě experimentů mi vychází, že ten vzorec výše je chybný. Zkusím zkoumat dál.
Online
Možná by bylo dobré zkoumat nějaký modelový příklad, řekněme pro 4 symboly A,B,C,D by relace "X porazí Y" mohla obsahovat dvojice:
AB,AC,BC,BD,CD,DA
Ale už tady mi ta soustava vychází celekm složité, je tam nepříjemný kvadratický člen, a po substitucích se zvyšují mocniny uvedených proměnných....
Např. se tu vyskytují symboly dvou typů - takové, které porazí dva symboly a prohrají s jedním a takové, které porazí jeden symbol a prohrají se dvěma. A ukazuje se, že prvky stejných typů nemají stejné pravděpdoobnosti pi, tedy je vidět, že ten postup nezohledňuje jen vztahy bezprostředních sousedů, ale i hlubší strukturu vazeb.
Experimentálně (nikoli exaktním důkazem) mi vycházejí pravděpdoobnosti:
A - 0,5
B - 0
C - 0
D - 0,5
U A se to dá čekat, porazí dva ze symbolů, u D to lze odůvodnit tak, že D porazí A, a tedy jestliže občas vybereme A, tak by bylo dobré vybrat i někoho, kdo ho porazí, tedy D.
Bylo by zajímavé zjistit, zda je to optimální strategie. Např. zkusit, zda při mnoha opakováních porazí nějakou jinou strategii.
Online
Stránky: 1