Matematické Fórum

Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.

Nástěnka
22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.

Nejste přihlášen(a). Přihlásit

#1 06. 07. 2014 04:48

Bivoj
Zelenáč
Příspěvky: 4
Reputace:   
 

Hra s 1000 Kč odměnou za vyřešení

V rámci vymýšlení systému na řízení přepravy zásilek, který mám jako zábavu, jsem přišel na zadání následující úlohy.

Je hra, kterou hraje jeden hráč. Hra má "kola" a každé kolo má svojí herní dobu.

Během herní doby jednotlivých kol padají s různou četností výhry různých hodnot.

Hráč ví, jaká je relativní četnost jednotlivých výher a jak jsou vysoké. Výhry se nevyčerpávají, stejná výhra může padnout během jednoho kola vícekrát. Hráč vždy ví, kolik času do konce kola mu zbývá.

Pokud padne výhra, musí se hráč rozhodnout, jestli si jí nechá a tím kolo končí, nebo jestli doufá ve zbývajícím času ve vyšší výhru a hraje dál. Poté co vezme výhru, nebo mu uběhne čas a nedosáhne žádné výhry, začíná další kolo.

Hráč tedy nekončí po jednom kole, ale hráč jich hraje tolik, že na výsledku jednoho kola mu nezáleží. Jeho cíl ve hře je co nejvyšší průměrná výhra na jedno kolo. (ne na čas strávený hrou).

Na úplně první pohled mi to přišlo jako úloha, která bude mít nějaké jednoduché řešení. Hráč ví s jakou pravděpodobností padají během kol výhry. Když mu padne nějaká výhra, tak se má rozhodnout jestli výhru vezme a kolo končí, nebo výhru zahodí a zkusí v kole pokračovat. Jeho cíl je co nejvyšší průměrná výhra na jedno kolo.

Jak správně (ve smyslu cíle) rozhodnout, zda výhru která padla vzít a nebo nevzít?

Po několika dnech, co o úloze přemýšlím už mi jednoduchá nepřijde a to ani trochu.

Umíte jí někdo vyřešit? Nebo na ní máte nějaký názor, či k ní máte poznámku, postřeh?

A protože jsem už jí věnoval asi 10 hodin přemýšlení a bez reálného výsledku, tak nabízím odměnu 1000 Kč za vyřešení. Nevím sice, jak dokážeme, že je to správné řešení, ale pro vyplacení stačí, když se v rámci diskuze na nějakém řešení diskutující shodnou. Pokud někdo řekne, že je to nějaká známá úloha a řešení odkáže, tak má odměnu také, odměna je bezpodmínečná, stačí uvést řešení, které dojde v diskuzi konsensu. První, kdo takové řešení ukáže má odměnu.

Offline

 

#2 06. 07. 2014 17:44

Xellos
Příspěvky: 524
Škola: MFF CUNI, Bc. (13-16)
Reputace:   36 
 

Re: Hra s 1000 Kč odměnou za vyřešení

Nemam uplne jasne v tom ako vyhry padaju, tak skusim abstrahovat to co som pochopil.

Ak vieme, ze vyhry $x_{1..n}$ padnu urcite pocas jedneho kola, staci pockat kym padne najvyssia. Takze treba nejaku hustotu pravdepodobnosti $\rho(t)$ ze padne vyhra v case $t$ (resp. $p(t,t+\mathrm{d}t)=\rho(t)\mathrm{d}t$ pravdepodobnost ze padne v danom casovom intervale), taku ze je mozno nenulova pravdepodobnost ze dana vyhra vobec nepadne.

Hlavna otazka je ci tu hustotu pravdepodobnosti pozname. Skusim to najprv popisat vseobecne a potom dosadit konstantnu (s $p_{0,i}$ pravdepodobnostou ze vyhra $x_i$ vobec nepadne).

Hrac by mal chciet zobrat vyhru $x_i$ v case $t$, ak stredna hodnota vyhry v intervale $[t,T]$ ($T$ je cas kola) je $\le x_i$. Z definicie strednej hodnoty potom

$x_i \ge \sum_{i=1}^n\int_{t}^{T}{x_i\rho_i(\tau)\mathrm{d}\tau}=\int_{t}^{T}{\left(\sum_{i=1}^n{x_i\rho_i(\tau)}\right)\mathrm{d}\tau}$

co mozeme vlastne popisat ako jednu vyhru s vlastnou hustotou pravdepodobnosti (ale toto uz su len nahodne kecy, nemyslim ze to velmi pomoze).

Ak je $\rho_i=\frac{1-p_{0,i}}{T}$ (konstantna), tak mame

$\sum_{i=1}^n\int_{t}^{T}{x_i\rho_i(\tau)\mathrm{d}\tau}=\sum_{i=1}^n{x_i(1-p_{0,i})\left(1-\frac{t}{T}\right)}$

Rozhodnutie hraca furt zavisi na tom co sa stane, ale pre kazdu vyhru mozeme aspon povedat najvacsi cas $t$, kedy ju brat este nema zmysel. Aspon toto zatial.

Offline

 

#3 06. 07. 2014 17:53

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Bivoj:
Ahoj,
1) Je možných výher, ze kterých se vybírá, konečně nebo nekonečně mnoho?
2) Trvá každý "výhra" ("tah") stejnou dobu? Tj. umíme předem říci, kolik "her" se ještě sehraje než skončí dané kolo?
3) Tím, že jedno kolo skončí dříve (hráč si vezme výhru), znamená to, že se o tuto dobu prodlouží následující kolo?
Díky za info.


"Máte úhel beta." "No to nemám."

Online

 

#4 06. 07. 2014 23:23

Bivoj
Zelenáč
Příspěvky: 4
Reputace:   
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,

↑ check_drummer:

1) Výher stačí uvažovat konečný počet.
2) Výhry vznikají v kole náhodně s nějakou definovanou průměrnou četností.

Příklad:

Do konce kola zbývá 1 hod. Výhra má průměrnou relativní četnost jednou za hodinu. To znamená, že se může stát, že ještě padne např. 3x, ale nemusí padnout vůbec. Pokud ale odehrajeme dostatečný počet kol, které jsou dlouhé 1 hod. a nebudeme brát žádné výhry(abychom kola předčasně neukončili), tak tato výhra bude padat průměrně jednou za kolo. Některá kola nepadne vůbec, ale může padnout třeba 10x za kolo, pokud tomu náhoda dopřeje.

3) pokud kolo skončí dříve, tak to délku následujícího kola neovlivňuje.

Xellos:

Teď se trochu rozepíšu, abych ukázal, jak je úloha "záludná". Budu to všechno popisovat slovně a budu ukazovat různé zajímavosti, které z téhle na první pohled úplně jednoduché hry vyplývají.

Pokud je výhra jen jedné výše, tak jí musíme vzít vždy, když padne bez ohledu na to jak často padá. Pokud bychom jí nevzali, tak je vždy nějaká pravděpodobnost že už ve zbytku kola nepadne nikdy. Tohle je asi nejjednodušší varianta hry. Tuhle hru (s jednou výší výhry, která má svojí průměrnou četnost padání) umíme rozhodnout a víme jak jí hrát.

Představme si, že máme výhru budeme jí říkat "jednotková", která padá s průměrnou četností 1x za hod., hodnota výhry je 1 a do konce kola zbývá pro zjednodušení jedna hodina.

Jaká je průměrná hodnota výhry? Výhru můžeme vzít v kole nejvýše jednou, protože potom kolo končí. Někdy ale nepadne žádná. Průměrná hodnota výhry na kolo je v tomto případě tedy menší než jedna. Jaká je přesně?

Teď si to zkomplikujme (pořád to je ale jednoduchá varianta hry) a řekněme, že jsou výhry dvě. Jedna nám padla a je to např. 0.7 a řekněme, že tato výhra padá extrémně výjimečně (např. 1 za milion kol) a druhá výhra je ta naše "jednotková". Máme si ponechat 0.7 a nebo jí máme zahodit a čekat že padne naše "jednotková"? (do konce kola zbývá 1 hod.)

("víme" že už nám 0.7 podruhé nepadne, resp. je vidět, že je velmi nepravděpodobné, že by ještě padla. Takže se můžeme soustředit jen na "výtěžnost" výhry, které říkáme "jednotková". Schválně uvádíme takové příklady, aby se nám jednoduše přemýšlelo a nemuseli jsme počítat - příklady jsou volené tak, abychom se mohli rozhodovat ze zkušenosti a nemuseli  jsme počítat)

Tenhle příklad je tedy jen jinak napsaná otázka, kterou jsem psal výše. viz. "jaká je průměrná hodnota výhry?"

A pojďme dál a udělejme hru zase o něco složitější, i když pořád s jednoduchým nastavením.

Můžeme se teď ptát dál, co se stane, když máme hru se dvěma výhrami: První bude naše "jednotková" a druhá bude mít nějakou srovnatelnou četnost padání a podobnou hodnotu výhry. Ta druhá (k té naší "jednotkové") bude mít hodnotu např. 2 a četnost padání 0.3 krát za hodinu.

Řekněme, že nám právě padla jednotková výhra, do konce kola zbývá naše oblíbená jedna hodina.

Tady už to začíná být zajímavé. Pokud zahodíme jednotkovou výhru, tak nám ve zbývající hodině může padnout znovu jednotková výhra a může padnout i druhá výhra. To, že nám může padnout ještě znovu stejná (jednotková) výhra nám tedy umožňuje více riskovat, než kdyby mohla padat už jen ta vyšší.

Tady je zajímavé si ukázat dvě "jasné" nastavení hry, která má dvě výhry (kola jsou pořád 1 hod.).

První nastavení vypadá tak, že máme jednotkovou výhru a výhru s hodnotou 2, který padá s četností 0.01 za hod.

Druhé nastavení je jednotková výhra a výhra s hodnotou 2, která padá s četností 100 x za hod.

Na první pohled je "vidět" že pro první nastavení, pokud nám padla jednotková výhra, tak jí musíme vzít a už nečekat, že padne výhra "2". Pro druhé nastavení naopak můžeme, pokud nám zbývá z kola necelá hodina a padla právě jednotková výhra jí zahodit, protože je "vidět" že druhá výhra ještě padne.

Co je zajímavé, že když teď přidáme třetí výhru, která je menší než obě, tak jí nelze z výpočtu rozhodnutí vyřadit.

Pokud totiž do prvního nastavení přidáme třetí výhru s hodnotou 0.999 a četností milionkrát za hod. tak nám tato výhra "zajistí" že můžeme "vesele" riskovat a čekat až skoro do konce kola na druhou výhru, protože nám téměř neustále padá výhra s hodnotou 0.999. Ztrácíme tedy při zahození jednotkové výhry asi 0.001 (berte tyhle počty sportovně, jsou pro představu), ale máme šanci o něco méně než 1/100 na výhru 2.

Teď už je vidět, že jak větší, tak menší výhry oproti té, která zrovna padla ovlivňují naší ochotu výhru zahodit a čekat na lepší.

Tento příklad jsem uvedl proto, aby bylo vidět, že nejde při rozhodnutí o ponechání si, nebo zahození výhry, která právě padla počítat jen s většími výhrami, ale musíme počítat se všemi.

Snad jsem rozvinul úvahy, které mají sloužit k lepšímu pochopení úlohy dostatečně přehledně a že je to zdroj inspirace, pro zamyšlením se nad řešením úlohy.

Na první pohled mi úloha přišla jednoduchá a myslel jsem si, že jí dokážu rychle vyřešit. Jak jsem ale postupně přemýšlel proto jsem se teď rozepsal, aby bylo vidět přibližně jak, tak jsem zjišťoval, že je úloha mnohem složitější, než jsem si myslel.

Offline

 

#5 08. 07. 2014 22:49

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,
zvol tuto strategii: Padla-li v daném okamžiku výhra s hodnotou v, spočítej střední hodnotu výhry, která může nastat ve zbývajícím čase - ovšem do této střední hodnoty zahrň jen ty výhry, jejichž hodnota je >v.

Tady je ale potřeba blíže specifikovat "střední hodnoty" - a sice i v zadání. Např. to, ž padne výhra průměrně jednou za hodinu - co to znamená? Jsou okamžiky mezi následujícími výhrami velmi blízko k jedné hodině (jednou padne 59 minut po předchozí výhře, jindy za 61 minut) a nebo naopak mají velký rozptyl (jednou je to po 15 minutách a podruhé po 105 minutách). Znalost tohoto rozdělení (pravděpdoobnosti), kdy padne následující výhra po předchozí výhře je dle mého zásadní pro další úvahy (nebo alespoň znalost rozptylu). Např. zbývá-li mi 30min. do konce a zrovna padla výhra, pak je velmi malá pravděpodobnost, že - jedná-li se o první případ - ještě jednou padne, kdežto ve druhém případě je tato pravděpodobnost o mnoho větší - a to může vliv na volbu strategie.

Otázka však je, jak postupovat dále, když výše uvedené rozdělení pravděpodobnosti (resp. roztpyl) neznáme. Lze zvolit nějaký rozumný předpoklad, abychom získali rozumné výsledky? Podle mě to je složité - je to jako bych věděl, že součet dvou čísel je 8 a musím zvolit nějaký rozumný předpoklad týkající se toho, jaká jsou to čísla...

Pokud však máme "nekonečně" mnoho kol, tak můžeme výše uvedené rozdělení pravděpdoobnosti (resp. jeho odhad) zjistit pozorováním doposud padlých výher - a na zákaldě toho postupovat dále.

Myslím, že je to dost náměrů k diskusi, tak budu rád, když se někdo zapojí. O odměnu však zájem nemám, jen o zajímavé přístupy k řešení.


"Máte úhel beta." "No to nemám."

Online

 

#6 09. 07. 2014 21:32 — Editoval Pavel Brožek (10. 07. 2014 19:44)

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,

předpokládám, že pro danou výhru je v každé chvíli stejně pravděpodobné, že padne. Tj. nezáleží na tom, jestli padla před sekundou nebo před hodinou, pravděpodobnost, že padne někdy v příští sekundě, je v obou případech stejná. Za tohoto předpokladu se bude hustota pravděpodobnosti, že daná výhra padne za čas t, odpovídat exponenciálnímu rozdělení s takovým parametrem $\lambda=\frac1T$, že střední hodnota času do padnutí výhry od předchozího padnutí bude $T$. Pro i-tou výhru tak je hustota pravděpodobnosti, že od daného okamžiku padne výhra v čase t, rovna

$\varrho_i(t)=\lambda_i\mathrm{e}^{-\lambda_i t}.$

Rozbor budu provádět jen pro infinitezimálně malé změny, takže mě bude zajímat, jaká bude pravděpdobnost, že výhra padne v čase v intervalu $(0,\varepsilon)$ pro nějaké $\varepsilon$, které pak pošleme do nuly. Tato pravděpodobnost bude

$P_i(\varepsilon)=\int_0^\varepsilon \varrho_i(t)\d t=\ldots=1-\mathrm{e}^{-\lambda_i\varepsilon}=1-(1-\lambda_i\varepsilon+o(\varepsilon))=\lambda_i\varepsilon + o(\varepsilon)$.

Nyní se budeme zabývat tím, jaká je střední hodnota výhry $v(t)$, pokud do konce kola zbývá čas t. Předpokládejme, že ta střední hodnota je spojitá funkce (není důvod, aby nějak skákala) a že $v(0)=0$ (pokud už nezbývá žádný čas, nemůže padnout žádná výhra. $v(t)$ bude rostoucí funkce (čím více času do konce kola zbývá, tím je větší pravděpodobnost, že narazíme na nějakou výhru). Definuju $c_0=0$, $c_i$ je velikost i-té výhry (výhry čísluju vzestupně podle jejich ceny), celkem je $n$ výher a $c_{n+1}=\infty$. Pro $v(t)\in(c_i,c_{i+1})$, kde $i\in\{0, \ldots,n\}$ platí rovnice

$v(t+\varepsilon)=&P\(\text{za interval nepadne vyšší výhra než střední hodnota výhry}\)v(t) +\\ &\sum_{j=i+1}^nP\(\text{za interval padne j-tá výhra, která je vyšší než střední hodnota výhry}\)c_j.$

V předchozím výrazu jsem mohl napsat druhý člen jako sumu díky tomu, že jevy, kde padnou dvě výhry, mají zanedbatelnou pravděpodobnost (řádu $\varepsilon^2$), takže v limitě, kterou provedu, vymizí. Díky tomu můžu psát i

$v(t+\varepsilon)=&\(1-\sum_{j=1}^nP_j(\varepsilon)+\sum_{j=1}^iP_j(\varepsilon)\)v(t)+\sum_{j=i+1}^nP_j(\varepsilon)c_j.$

$\frac{v(t+\varepsilon)-v(t)}\varepsilon=&\(-\sum_{j=i+1}^n\lambda_i\)v(t)+\sum_{j=i+1}^n\lambda_j c_j.$

Pro $\varepsilon\to0$ dostaneme

$v'(t)=&\(-\sum_{j=i+1}^n\lambda_i\)v(t)+\sum_{j=i+1}^n\lambda_j c_j.$

To je jednoduchá diferenciální rovnice, která má pro hodnoty $v(t)\in(c_i,c_{i+1})$ (s počáteční podmínkou $v(t_i)=c_i$) řešení

$v(t)=\(c_i-\frac{\sum_{j=i+1}^n\lambda_jc_j}{\sum_{j=i+1}^n\lambda_j}\)\mathrm{e}^{-\(\sum_{j=i+1}^n\lambda_j\)(t-t_i)}+\frac{\sum_{j=i+1}^n\lambda_jc_j}{\sum_{j=i+1}^n\lambda_j}.\qquad (*)$

Takže pokud jsme v situaci, že do konce kola zbývá čas $T$, my jsme právě vyhráli výhru ceny $C$ a máme se rozhodnout, zda si ji ponechat, tak postupujeme následovně:

1. Nastavíme $i=0$, $c_0=0$ a $t_0=0$.
2. Z rovnice (*) pro aktuální i vypočítáme čas $t=t_{i+1}$, kdy $v(t)=c_{i+1}$ (pokud takové t neexistuje, pak nastavíme $t_{i+1}=\infty$).
3. Pokud $t_{i+1}\ge T$, pak vypočítáme $v(T)$ a porovnáme s $C$. Pokud $v(T)>C$, výhru zahazujeme a čekáme dál, jinak výhru bereme. V obou variantách algoritmus končí.
4. Zvýšíme $i$ o jedna a jdeme na bod 2.

Algoritmus určitě někdy skončí, protože $c_{n+1}=\infty$. O explicitní zapsání výsledku bez algoritmu jsem se nepokoušel, ale to by asi nebylo nic hezkého, pokud to vůbec půjde. Ale algoritmus je to jednoduchý, neměl by být problém to naprogramovat.

Já o odměnu zájem mám, pokud je to správně a ostatní mi to uznají (případně k nejasným částem doplním podrobnosti) :)

Offline

 

#7 10. 07. 2014 10:19

Stýv
Vrchní cenzor
Příspěvky: 5710
Reputace:   215 
Web
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek: kolik dáš, když ti to uznám?:D

Offline

 

#8 10. 07. 2014 16:46

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Stýv:

:D

Zatím počkám, jestli mi to uzná někdo jiný zadarmo :D (Zaplacené uznání by asi ani nepůsobilo moc důvěryhodně :D)

Offline

 

#9 10. 07. 2014 18:09

Stýv
Vrchní cenzor
Příspěvky: 5710
Reputace:   215 
Web
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek: říkejme tomu "nezávislý audit";)

Offline

 

#10 10. 07. 2014 18:44

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
Ahoj,
nechť p(t) je pravděpodobnost toho, že Ti toto řešení někdo uzná v během času t zadarmo... :-) Ale teď vážně:

1) Vypadá to rozumně - je to rozvedená podobná myšlenka jako sjem měl já - je tam pěkné to, jak jsi se vyhnul zkoumání toho, že výhry padnou současně (v malém inetrvalu), něco podobného  jsme kdysi řešili na kursu pravděpodobnosti.
2) Nejsem si jist, zda můžeš předpokládat exponenciální rozdělení - tady měl asi autor upřesnit o jaké výhry přesně jde a tedy zda je tento předpoklad o rozdělení pravděpodobnosti oprávněný.
3) Není mi jasné, co rozumíš pod v(t) - zda opravdu střední hodnotu výhry, pokud do konce zbývá čas t. Pokud ano, pak bys na všech intervalech (ci;c(i+1)) měl uvažovat i výhry cj<ci, protože i ty, dle mého mají na střední hodnoty vliv (přestože jsou menší než hodnoty z tohoto intervalu) - ovšem potom by nám takto získaná hodnota v(t) k ničemu nebyla - takže není to spíše tak, že na každém intervalu (ci;c(i+1)) zkoumáme spíše střední hodnotu výhry za předpokladu, že tato výhra je alespoň ci? Pokud ano, pak sice v(t) bude na tomto intervalu rostoucí a spojitá, ovšem dle mého to nemusí platit na sjednocení těchto intervalů - což může zkomplikovat následující algoritmus volby výhry.

Řekl bych, že Pavel si odměnu zaslouží, pokud sám autor uzná jeho řešení jako správné. :-) I když čím více autorit jeho myšlenku podpoří, tím větší jistotu správnosti získáme.


"Máte úhel beta." "No to nemám."

Online

 

#11 10. 07. 2014 20:30

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ check_drummer:

Ahoj, díky za posudek :)

(Trochu jsem předchozí příspěvek upravil, měl jsem tam některé věci zbytečné, ale nemění to nic na podstatě, ani to neřeší tvé poznámky.)

1) Díky :)

2) To je skutečně na autorovi, aby to upřesnil. Já ten předpoklad stejné pravděpodobnosti v každou chvíli použil, protože mi přišel nejpřirozenější a nic lepšího k dispozici nebylo, a pokud je nesprávný, pak mám holt asi smůlu :D

3) Ano, pod v(t) skutečně myslím střední hodnotu výhry, pokud do konce zbývá čas t. Nemám ale pocit, že bych výhry menší než $c_i$ neuvažoval, ony prostě z řešení samy vypadnou. Možná pomůže pro vzájemné pochopení, když víc rozeberu, jak jsem došel k rovnosti

$v(t+\varepsilon)=&\(1-\sum_{j=1}^nP_j(\varepsilon)+\sum_{j=1}^iP_j(\varepsilon)\)v(t)+\sum_{j=i+1}^nP_j(\varepsilon)c_j.$

Výraz

$1-\sum_{j=1}^nP_j(\varepsilon)$

v první závorce na pravé straně odpovídá pravděpodobnosti, že za interval délky $\varepsilon$ nepadne žádná výhra. V tomto případě výhra bude odpovídat střední hodnotě výhry v(t) (tj. za čas $\varepsilon$ se výhra nezmění) – to souhlasí s tím, že závorku násobím v(t).

Výraz

$\sum_{j=1}^iP_j(\varepsilon)$

v první závorce na pravé straně odpovídá pravděpodobnosti, že za interval délky $\varepsilon$ padne nějaká výhra menší než v(t). tomto případě si výhru nevezmeme a proto očekávaná výhra bude opět v(t) – to souhlasí s tím, že závorku násobím v(t).

Suma $\sum_{j=i+1}^nP_j(\varepsilon)c_j$ pak už po jednom (protože v každém případě je jiná výhra) řeší možnosti, že padne nějaká větší výhra než je v(t). Pravděpodobnost padnutí j-té výhry je $P_j$ a očekávaný zisk je $c_j$ (protože výhru bereme a nehrajeme dál).

Výrazy v první sumě se pěkně odečtou tak, že závislost na nižších výhrách vymizí. :)

Ono by se mohlo zdát, že takhle ty nižší výhry moc neovlivňují řešení. Jenže ono to řešení může být hodně ovlivěné tím, jak se funkce v(t) chová než nabude těch větších hodnot, protože tam ty nižší výhry vstupují do hry.

Např. pro „jednotkovou výhru“ a výhru ceny 0.8, která padá v průměru 10x za hodinu, vypadá graf v(t) takto:

//forum.matweb.cz/upload3/img/2014-07/16312_graf.png

Svislá šedá čára odděluje časy, kdy se vyplatí vzít výhru 0.8 (nalevo od čáry, v(t)<0.8) a časy, kdy se ji vzít nevyplatí (napravo od čáry, v(t)>0.8).

Pro ten samý případ akorát s výhrou ceny 0.8, která padá v průměru 100x za hodinu, vypadá graf takto:

//forum.matweb.cz/upload3/img/2014-07/16558_graf2.png

Nižší výhru se tedy v tomto případě vyplatí brát teprve až mnohem blíže konci kola, což bychom očekávali, když padá tak často.

Offline

 

#12 10. 07. 2014 22:26

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
Ještě mi není jasné, proč při počítání $v(t+\varepsilon)$ provádíš násobení pravděpodobností $&\(1-\sum_{j=1}^nP_j(\varepsilon)+\sum_{j=1}^iP_j(\varepsilon)\)$ a hodnoty $v(t)$ - tedy jaká má smysl součin "pravděpodobnost" krát "střední hodnota na počátku intervalu".
Díky za objasnění.


"Máte úhel beta." "No to nemám."

Online

 

#13 10. 07. 2014 22:34

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

... ještě je také otázka, kolik kol se hraje - pokud málo, pak by se asi vyplatila větší sázka na jistotu - např. vím-li, že s pravděpodobností jedna milióntina vyhraju sto miliard korun a nebo, že s pravděpodobností jedna desetina vyhraju sto tisíc korun, pak z hlediska střední hodnoty je výhodnější první možnost, ale z hlediska jistoty (bude-li proveden jen malý počet pokusů) ta druhá. Dokonce paradoxně bude méně výhodná než první možnost i možnost, že v každém tahu získám (s pravděpodobností 1) 10tisíc korun (ovšem z dlouhodobého hlediska a nikoli jen při malém počtu pokusů).


"Máte úhel beta." "No to nemám."

Online

 

#14 10. 07. 2014 23:16 — Editoval Pavel Brožek (10. 07. 2014 23:17)

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ check_drummer:

Pro náhodnou veličinu X a jevy A a B, pro které platí $A\cup B =\Omega$ ($\Omega$ je množina všech možných výsledků) a $A\cap B=\emptyset$, platí

$\langle X\rangle &=\sum_{\omega\in\Omega}P(\omega)X_\omega=\sum_{\omega\in A}P(\omega)X_\omega+\sum_{\omega\in B}P(\omega)X_\omega=\\
&=P(A)\sum_{\omega\in A}P(\omega|A)X_\omega+P(B)\sum_{\omega\in B}P(\omega|B)X_\omega=\\
&=P(A)\langle X\rangle_A+P(B)\langle X\rangle_B,$

kde $\langle X\rangle_A$ a $\langle X\rangle_B$ jsou střední hodnoty, ale už jen v podmnožině výsledků.

Tak v podstatě tohle jsem použil.

Bivoj napsal(a):

Hráč tedy nekončí po jednom kole, ale hráč jich hraje tolik, že na výsledku jednoho kola mu nezáleží. Jeho cíl ve hře je co nejvyšší průměrná výhra na jedno kolo.

Tohle je podle mě celkem jednoznačně napsané, takže bych se nezabýval tím, co je výhodné při malém počtu kol.

Offline

 

#15 11. 07. 2014 22:35

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,
zkusím rozvést svůj nápad výše:
Očíslujme jako Pavel vzestupně výhry $c_i$ (i od 1 do n). Nechť padla hodnota výhry $c_j$ a do konce kola zbývá čas t. Tedy zkoumejme, jaká je střední hodnota $s(t)$ výhry - kde uvažujeme jen ty $c_i$ pro $c_i>c_j$, nechť jsou jejich indexy m až n.
Nyní označme $p_i(t)$ pravdpodobnost toho, že během doby t padne výhra $c_i$. Potom tedy střední hodnota výhry $c_n$ je $s_n(t):=c_n.p_n(t)$. Při výpočtu střední hodnoty výhry $c_{n-1}$ musíme vzít v úvahu, že k této výhře dojde jen v případě, kdy nedojde k výhře $c_n$ - tedy pravděpodobnost, že (nejvyšší) výhrou bude $c_{n-1}$ je $(1-p_n(t)).p_{n-1}(t)$ (tady předpokládám, že padání různých výher jsou nezávislá) a tedy hledaná střední hodnota je $s_{n-1}(t):=c_{n-1}.(1-p_n(t)).p_{n-1}(t)$.
Podobně lze postupovat dále a získat $s_i(t):=c_i.(1-p_n(t)).(1-p_{n-1}(t))..(1-p_{i+1}(t)).p_i(t)$ a $s(t)=\sum_{i=m}^{n}{s_i(t)}$. A pokud tedy $s(t)>c_j$, tak výhru $c_j$ nebereme a v opačném případě ji bereme.

Nyní je nutné zvolit (najít) $p_i(t)$ - a to buď na základě bližší znalosti hry (jakým způsobem "padají" výhry) a nebo stejně jako Pavel volit exponenciální rozdělení a získat $p_i(t)=1-e^{-\lambda_i.t}$, $\lambda_i:=\frac{1}{T_i}$. kde $T_i$ je střední hodnota padnutí dvou po sobě následujících výher $c_i$. (Pozn.: V textu ztotožňuji pojem "výhra" a "výše výhry" - obojí nazývám $c_i$ - k nedorozumění by nemělo dojít.)


"Máte úhel beta." "No to nemám."

Online

 

#16 11. 07. 2014 22:46 — Editoval check_drummer (11. 07. 2014 22:58)

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
Díky za objasnění - v tuto chvíli nevidím žádný problematický bod (numerické výpočty jsem nekontroloval, jen "myšlenky"), zkousím o tom ještě o víkendu přemýšlet.
Předpokládáš tedy, že padání jednotlivých výher o různých velikostech je nezávislé, že? (To plyne asi z toho, jak volíš pravděpodobnostní rozdělení.)

Jinak pokud by náhodou nešlo o exponenciální rozdělení, tak svůj postup můžeš zopakovat - ovšem možná se nevyhneš numerické integraci - např. půjde-li o normální rozdělení. To ale na principu řešení nic nemění.


"Máte úhel beta." "No to nemám."

Online

 

#17 11. 07. 2014 22:55

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Bivoj:
Ahoj,
potřebovali bychom upřesnit zadání:
1) Jak si lze představit výhry a jejich "padání"? Jde o to, že abychom mohli hry přesněji modelovat, musíme mít o tomto padání nějakou znalost. O jakou jde situaci, když řekneš, že padla výhra? Co je to "výhra"? A co je to její cena? Nejlepší by bylo uvést nějaký typický příklad výher a toho, jak mohou tyto výhry "padnout".
2) Jsou jednotlivé různé výhry nezávislé? Tzn. když padne/nepadne např. výhra č.1, má to vliv na to, kdy padne/nepadne např. výhra č.2? (Odpověď na tuto otázku nejspíš vyplyne z odpovědi na otázku č. 1)
3) Jaké jsou "běžné" časy mezi jednotlivými výhrami? Jsou u jednotlivých výher přibližně stejné a nebo se mohou pro různé výhry lišit i o několik řádů? (Tento pod není pro řešení úplně podstaný, spíš mě zajímá z "praktického" hlediska.)


"Máte úhel beta." "No to nemám."

Online

 

#18 12. 07. 2014 17:18

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ check_drummer:

Ahoj,

myslím, že už rovnost $s_n(t):=c_n.p_n(t)$ není správně (teda pokud dobře rozumím tomu, co je $s_n(t)$ a $p_n(t)$).

Náhodný pokus v této hře odpovídá tomu, že máme danou strategii a hrajeme jedno kolo touto strategií. Získaná výhra je pak náhodná veličina, jejíž střední hodnotu se snažíme určit (a chceme najít takovou strategii, abychom jí maximalizovali).  Pokud tomu dobře rozumím, tak $s_n(t)$ je střední hodnota náhodné veličiny (zvolím označení) $S_n(t)$ odpovídající tomu, že hrajeme kolo dlouhé $t$ a pokud v tomto kole zvolenou strategií vezmeme i-tou výhru a skončíme, pak $S_n(t)=c_n$, jinak $S_n(t)=0$. Pak by mělo platit $s_n(t)=p_n(t)\cdot c_n+(1-p_n(t))\cdot0$, kde ale $p_n(t)$ je pravděpodobnost, že n-tou výhru v kole skutečně vyhrajeme. Ale abychom ji vyhráli, tak nestačí, aby výhra padla, nesmí se také stát to, že by před ní padla jiná výhra, kterou bychom vzali. Kdyby $p_n(t)$ byla pravděpodobnost toho, že výhra $c_n$ během doby t padne, pak by to znamenalo, že bychom všechny jiné výhry vždy zahazovali, což určitě není obecně optimální strategie.

Podle mě by to, co píšeš, bylo správné, jen pokud by $t$ bylo infinitezimálně malé, aby se výhry vzájemně neovlivňovaly (tím nemyslím, že by padání výher bylo na sobě závislé, to předpokládám, že není, ale myslím tím, že se výhry vzájemně ovlivňují tím, že když vezmu jednu, už nemůžu vzít jinou). Ale tím bychom se dostali k tomu mému řešení (ono vlastně nějak takhle vzniklo :) ).

Nedokážu si moc představit, jak by se mé řešení dalo upravit na jiné než exponenciální rozdělení. To exponenciální rozdělení totiž využívá toho, že „nemá paměť“, takže můžu výpočet provádět „lokálně“ a dostanu tak diferenciální rovnici. S jiným rozdělením by to asi takhle nešlo.

Offline

 

#19 14. 07. 2014 03:23

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
Ahoj, zní to rozumně - máš nějaký protipříklad, kdy moje strategie nezafunguje? Tedy "poradí" hrát dál, ale lepší bude vzít stávající výhru (nebo naopak)?


"Máte úhel beta." "No to nemám."

Online

 

#20 14. 07. 2014 18:31

Bivoj
Zelenáč
Příspěvky: 4
Reputace:   
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,

díky za příspěvky, výborně se diskuze posunula, odpovídám na otázky:

V každém okamžiku je stejná pravděpodobnost výhry. Jde o exponenciální rozdělení.

Výhry se nijak vzájemně neovlivňují, jsou na sobě zcela nezávislé.

Ovlivňuje se pouze vzetí výhry. Pokud už jednou v kole výhru vezmeme, další už nesmíme i kdyby padaly výhry dál.

Z tohoto pohledu je padání výher na hře nezávislé.

Kolo si můžeme představit jako časové okno, ve kterém smíme hrát a na pozadí kontinuálně probíhá padání výher.

To nic na předchozí diskuzi nemění, je to jen druh pohledu na hru, nemění se tím nic na zadání.

Dejte mi teď několik dní, potřebuju se probrat skrz řešení a pochopit je.

Zatím mi přijde (emotivně / dojmem) Pavlovo řešení jako správné.

Jen v rychlosti, prosím pavle pokud přidáš do simulace k "jednotkové" a 10x za hod. výhra 0.8 ještě 90x za hod. výhru 0.799.., tak graf bude vypadat jako ten druhý (0.8, 100x za hod.). Ve správném řešení by to tak bylo. To je jen jedna z potencionálních zkoušek, která řešení testuje a umíme jí vyhodnotit bez počítání.

Případně pokud bys takovou situaci (přidání této menší výhry k 0.8) popsal z pohledu tvého řešení, tak to bude také výborné a pomůže to pochopení.

Díky ještě jednou za dosavadní příspěvky.

Offline

 

#21 14. 07. 2014 20:00

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
Ahoj, přesněji jsem jako s(t) zamýšlel střední hodnotu toho, že během času t padne nějaká výhra větší než $c_{j}$ (a nikoli, že ji skutečně zvolím). A nesmím do té střední hodnoty započítat dvě nebo více výher. Ono je jedno jestli v úvahách nepočítám s tím, že padne nějaká výhra větší než $c_j$ a já ji nevezmu - protože už to samo, že taková výhra padne, znamená, že jsem dosáhl lepšího stavu než výhra $c_j$ - a jakmile ho dosáhnu, tak se budu opět dále rozhodovat, zda výhru vzít nebo ne.

Ty tedy argumentuješ, že je chybně i případ, kdy existuje jen jediná výhra větší než $c_j$ (tj. m=n)? Pokud ano, máš na mysli to, že $c_j$ může padnout velmi zřídka a pokud bude $p_n(t).c_n$ jen velmi blízko $c_j$, pak při větším opakování pokusů bude tato strategie nevýhodná?

Tvůj postup tedy obecně uvažuje pro C i interval (do kteréhpo padne v(t)) $(c_i;c_{i+1})$, pro který může být $c_{i+1}<C$? Pokud ano, tak je to royumné - je nutné uvažovat i strategie s menší hodnotou výhry - což já nedělám (asi chybně).


"Máte úhel beta." "No to nemám."

Online

 

#22 16. 07. 2014 05:22 — Editoval vnpg (16. 07. 2014 05:28)

vnpg
Příspěvky: 36
Reputace:   
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,
přečetl jsem si tuhle diskusi a musím říct, že to pro mě bylo dost poučné čtení. Líbí se mi Pavlovo odvození $v(t)$ pomocí diferenciální rovnice.

Zkoušel jsem ještě jiný způsob, který by mohl být použitelný. Nejprve značení:

   1) $t$ ... čas do konce kola;

   2) $N_t$ ... náhodná proměnná s Poissonovým rozdělením s parametrem $t \lambda$, představující počet výher, které padnou v časovém intervalu délky $t$. Pro $k \in \mathbb{N}$ označíme

               $p_t(k) = \mathbb{P}(N_t = k) = \frac{(t\lambda)^k e^{-t\lambda}}{k!}$;

   3) $X_1, X_2, X_3, \dots$ ... nezávislé náhodné proměnné s identickým rozdělením, $X_i$ je hodnota $i$-té výhry v intervalu délky $t$ (která opravdu spadne právě tehdy, když $i \leq N_t$). Předpokládáme $X_i \geq 0$. Označme

               $F_X(s) = \mathbb{P}(X_i \leq s)$.

   4) $Z_t = \max \{X_1, \dots, X_{N_t}\}$ ... nejvyšší výhra, která spadne v intervalu délky $t$. Položíme $\max \varnothing = 0$, aby byl ošetřen případ, kdy $N_t = 0$. Označíme

              $F_{Z_t}(s) = \mathbb{P}(Z_t \leq s)$.

   5) Jako $M_{N_t}$ označíme momentovou vytvářející funkci náhodné proměnné $N_t$, tj. $M_{N_t}(x) = \mathbb{E}[e^{xN_t}]$ pro všechna reálná $x$.


Nyní vyjádříme $F_{Z_t}$ pomocí $F_{X}$:

     $F_{Z_t}(s)
= \sum_{k=0}^\infty p_t(k) F_X(s)^k
= \mathbb{E} [F_X(s)^{N_t}]
= \mathbb{E} [e^{N_t \ln(F_X(s))}]
= M_{N_t}(\ln(F_X(s)))$,

nyní použijeme skutečnost, že momentová vytvářející funkce náhodné proměnné s Poissonovým rozdělením s parametrem $t\lambda$ má tvar $M_{N_t}(x) = e^{t\lambda(e^x-1)}$, a tím dostaneme vztah

(*)     $F_{Z_t}(s) = e^{t\lambda (F_X(s)-1)}$.


Bylo by zajímavé, kdyby se podařilo použít (*) k odvození vzorce pro střední hodnotu náhodné proměnné $Z_t$. To se mi bohužel napodařilo. Ale v některých konkrétních případech, kdy je funkce $F_X$ hezky zadaná, můžeme spočítat $\mathbb{E}[Z_t]$ rovnou na základě (*).

Uvažujme stejné příklady jako Pavel. Tj. nejprve předpokládejme, že padá průměrně 1 jednotková výhra za hodinu a 10 výher v ceně 0,8 = 4/5 za hodinu. Potom $\lambda = 11$ a

      $F_X(s) = \begin{cases} 0, & s < 4/5; \\ 10/11, & 4/5 \leq s < 1; \\ 1, & 1 \leq s. \end{cases}$,

takže z (*) dostaneme

      $F_{Z_t}(s) = \begin{cases} 0, & s < 0; \\ e^{-11t}, & 0 \leq s < 4/5; \\ e^{-t}, & 4/5 \leq s < 1; \\ 1, & 1 \leq s. \end{cases}$

a následně

      $\mathbb{E}[Z_t]  = \int_0^\infty 1 - F_{Z_t}(s) \,\mathrm{d}s = 1 - 4/5 e^{-11t} - 1/5 e^{-t}$.

Graf funkce $t \mapsto \mathbb{E}[Z_t]$ vypadá takto:

      //forum.matweb.cz/upload3/img/2014-07/78216_Ez1.PNG

V případě, že každou hodinu spadne průměrně jedna jednotková výhra a 100 výher v hodnotě 4/5, obdržíme

      $\mathbb{E}[Z_t]  = 1 - 4/5 e^{-101t} - 1/5 e^{-t}$

a graf vypadá následovně:

      //forum.matweb.cz/upload3/img/2014-07/78539_Ez2.PNG


Grafy vypadají podobně jako v Pavlově řešení, ale zdá se mi, že na základě těch mých by hráč měl čekat déle, než začne přijímat tu nižší výhru. Tj. vypadá to, že $v(t) < \mathbb{E}[Z_t]$.

Jako možné vyvětlení mě napadá, že hodnotu $\mathbb{E}[Z_t]$ táhnou nahoru případy, kdy ta vyšší výhra spadne až těsně na konci kola a hráč z toho nic mít nebude, protože už si předtím (s vysokou pravděpodobností) vybere nižší výhru. Takže se pak nabízí otázka, zda je použití střední hodnoty $\mathbb{E}[Z_t]$ vhodné k určení správné strategie.

Offline

 

#23 16. 07. 2014 18:29 — Editoval Pavel Brožek (16. 07. 2014 18:45)

Pavel Brožek
Místo: Praha
Příspěvky: 5694
Škola: Informatika na MFF UK
Pozice: Student
Reputace:   194 
 

Re: Hra s 1000 Kč odměnou za vyřešení

V programu Mathematica jsem sestavil něco, co dokáže najít funkci $v(t)$ (ve zdrojáku je značená G…). Můžete si tam zadat libovolné vstupní hodnoty a vyjede vám to graf funkce $v(t)$. :)

https://dl.dropboxusercontent.com/u/5906979/Vyhry.nb

↑ check_drummer:

Myslím, že už líp chápu, jak to myslíš. Ale tvoje řešení v případě nějaké výhry vůbec neuvažuje nižší výhry a to je podle mě chyba, proč, to už popsal dřív Bivoj:

Bivoj napsal(a):

Pokud totiž do prvního nastavení přidáme třetí výhru s hodnotou 0.999 a četností milionkrát za hod. tak nám tato výhra "zajistí" že můžeme "vesele" riskovat

Jiný argument – tvoje hodnota $s(t)$ závisí na tom, jakou výhru jsme právě vyhráli. To by neměla. $s(t)$ má přece představovat střední hodnotu výhry po tom, co aktuální výhru zahodíme (proto porovnáváme $s(t)$ s aktuální výhrou). No ale když už výhru zahodíme, tak nezáleží na tom, jaká výhra to byla, naše strategie bude ve všech případech stejná, takže na té zahozené výhře nezávisí a tedy na ní nemůže záviset ani $s(t)$.

A ještě jinak – tvé rozhodování odpovídá podle mě jiné, malinko pozměněné hře (o které na konci odstavce prohlásím, že má jiné řešení než naše hra a proto tvá strategie neřeší naši hru). Jediný rozdíl je v tom, že pokud v té pozměněné hře padne výhra a ty ji zahodíš, pak se dozvíš (to ti řekne někdo, kdo ví dopředu, jaké výhry v budoucnosti padnou), jaká nejvyšší výhra v daném kole ještě padne. Po zahození výhry je tak rozhodování jasné, jen si počkáš na tu nejvyšší výhru, která má padnout, a tu vezmeš. (To znamená, že v každém kole se rozhoduješ maximálně jednou, při prvním padnutí nějaké výhry, v ostatních případech je braní výhry určeno triviálně.) Přesně tuhle hru by podle mě ideálně řešila tvoje strategie. Ale přijde mi zřejmé, že tahle pozměněná hra je jednodušší než ta, kterou řešíme, protože informaci o tom, jaká nejvyšší výhra padne ve zbytku kola po zahození výhry nemáme a tím očekávaný zisk bude určitě v některých případech menší (ne vždy se nám povede vzít tu nejvyšší výhru, která by padla) a může vést k tomu, že první výhru spíše vezmeme.

check_drummer napsal(a):

Tvůj postup tedy obecně uvažuje pro C i interval (do kteréhpo padne v(t)) $(c_i;c_{i+1})$, pro který může být $c_{i+1}<C$?

Nevím úplně jak to myslíš. Můj postup postupně počítá časy, ve kterých $v(t)$ nabude hodnoty různých $c_i$ (od nejmenších po největší, je to rostoucí funkce). Pokud jsme ještě ani nedostali hodnotu času, který zbývá do konce kola, a přitom už je $v(t)\in(c_i;c_{i+1})$, kde $c_{i}>C$, pak nemusíme dál počítat a je jasné, že máme výhru zahodit (to jsem výše nepsal, to je jen drobné vylepšení algoritmu). Ale hlavní cíl je vyhodnotit funkci $v(t)$ v hodnotě času $T$, který zbývá do konce kola a tu hodnotu porovnat s $C$. Hodnota $v(T)$ může být z libovolného intervalu $(c_i;c_{i+1})$.

Bivoj napsal(a):

Jen v rychlosti, prosím pavle pokud přidáš do simulace k "jednotkové" a 10x za hod. výhra 0.8 ještě 90x za hod. výhru 0.799.., tak graf bude vypadat jako ten druhý (0.8, 100x za hod.). Ve správném řešení by to tak bylo. To je jen jedna z potencionálních zkoušek, která řešení testuje a umíme jí vyhodnotit bez počítání.

Můžeš buď zkusit ten skript, co jsem poslal, a hrát si, nebo pokud stačí jen tenhle konkrétní případ, tak ten vyjde skoro k nerozeznání od toho, co jsem posílal výše (použil jsem 0,799). Oranžový graf je ten starý, modrý s šedýma čárama je nový. Aby byl vůbec vidět rozdíl, tak jsem z grafu vyřízl jen zajímavou oblast.

//forum.matweb.cz/upload3/img/2014-07/28982_graf4.png

Pokud bych to měl popsat z pohledu mého řešení, tak asi takhle: funkce $v(t)$ bude v oboru hodnot $(0;c_1)$ vypadat prakticky stejně, protože v jejím tvaru (*) se všechny hodnoty změní jen minimálně (díky tomu, že v sumě bude $90\cdot 0,799+10\cdot0,8\approx100\cdot0,8$). Takže $v(t)$ nabude hodnoty $c_1$ skoro ve stejném čase. Pak následuje interval hodnot $(0,799;0,8)$, který je ale velmi úzký a proto ho rostoucí funkce $v(t)$ překoná ve velmi krátkém čase. Čas $t_2$, kdy funkce $v(t)$ vstupuje do intervalu hodnot $v(t)\in(c_1,c_2)$ je tak prakticky stejný jako předtím, tvar funkce (*) je proto také prakticky stejný (už se liší jen v hodnotě $t_2$, a proto vypadá skoro stejně jako dřív.

↑ vnpg:

Pěkný způsob výpočtu. :) Ale bohužel počítáš střední hodnotu největší výhry, která padne za časový interval. Nezohledňuješ to, že se někdy musíme rozhodnout vzít z nouze menší výhru, i když by větší ještě padla, kdybychom nechali hráče hrát dál.

Offline

 

#24 17. 07. 2014 16:09 — Editoval check_drummer (22. 07. 2014 23:07)

check_drummer
Příspěvky: 5506
Reputace:   106 
 

Re: Hra s 1000 Kč odměnou za vyřešení

↑ Pavel Brožek:
(Edituji některá nekorektní data)
Ahoj,
konečně jsem měl trochu času nad tím přemýšlet.
1) Proč má strategie není správná: Je to tak, jak píšeš. Chybně jsem totiž předpokládal, že když padne výhra c, tak již dále nemusím uvažovat výhry nižší - ovšem není to pravda, ty mi umožní čekat na výhru vyšší (jak píšeš).
2) (Tento bod obsahuje chybnou edukci - z toho, že padne nižší výhra nemohu usoudit zda padne i výhra vyšší.) Moje strategie je dle mého trochu obecnější - umožňuje (dle mého optimálně) hrát hru, při které nesmím vzít výhru stejnou nebo nižší, která již v daném kole padla - jen je potřeba tu sumu upravit a nezačínat od pn.cn,ale od i takového, že pi.ci je maximální ze všech takových - a dále postupovat analogicky.
3) Sice jsi ukázal, že moje strategie popisuje jinou hru - to ovšem neznamená, že by nemohla být optimální i pro naši hru (víme, že není, ale prováděím obecné úvahy) - např. pokud by byly dvě hry "izomorfní", apod.


"Máte úhel beta." "No to nemám."

Online

 

#25 19. 07. 2014 13:42

Bivoj
Zelenáč
Příspěvky: 4
Reputace:   
 

Re: Hra s 1000 Kč odměnou za vyřešení

Ahoj,


Děkuju Pavlovi za jeho řešení, došel jsem k závěru, že postupu řešení, který navrhl rozumím a je správně.

Mám potvrzení od dvou svých kolegů, kteří s Pavlovým postupem řešení také souhlasí.


Díky Pavle za řešení a spojím se s Tebou přes PM kvůli odměně.


Děkuju check_drummerovi, za významnou pomoc při udržování diskuze, zajímavé příspěvky a dotazy na Pavlovo řešení, které vedly k dalším vysvětlení.

Offline

 

Zápatí

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson