Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Dobrý den,rád bych poprosil o radu při řešení tohoto příkladu, s nímž si nevím vůbec rady i když jisté řešení mám.Příklad zní:Filtr nevyžádané pošty obsahuje databázi frází,které se ve spamu vyskytují s vysokou četností.Každý příchozí email je filtrem označen jako spam právě tehdy,když obsahuje frázi z databáze. Testy bylo zjištěno,že pokud je daný email spam,pak s pravděpodobností 0,8 obsahuje nějakou frázi z databáze.V případě,že se nejedná o spam,je v těle emailu nějaká fráze z databáze s pravděpodobností 0,05.Dále je známo,že 70% emailů,které přicházejí na server,tvoří spam.
1.Jaká je ppst,že příchozí email bude označen jako spam?
2.Jaká je ppst,že příchozí email je spam,byl-li označen jako spam?
3.Jaká je ppst,že příchozí email je filtrem správně identifikován(spam je označen jako spam,běžný email není označen jako spam)?
Mé řešení:
ad 1.P1=0,7
ad2.P2=0,8*0,05=0,04
ad.3.P3=0,8*0,05/0,7=0,04/0,7=0,057
Pozn.:neumím zavést a označit náhodné jevy obecně a výpočet provést obecně a až nakonec dosadit příslušné hodnoty ze zadání.
Děkuji každému za podněty a pomoc.
Offline
↑ stenly:
Hezký den,
tohle je přímo ukázkový příklad na podmíněnou pravděpodobnost (Bayesova věta). Tedy ne že by to nešlo řešit bez symboliky, možné to je, ale bez symboliky je to trochu komplikovanější. Totiž celá finta podmíněné pravděpodobnosti spočívá v tom, P(A|B), tedy pravděpodobnost jevu A za předpokladu, že již nastal jev B, je vlastně pravděpodobnost, že nastal jev A v případě, že jevové pole omezíme na B a příslušně upravíme pravděpodobnostní míru, tj. vydělíme ji P(B), aby platilo P(B) = 1. Používané definice jsou trochu jiné, ale tohle je dle mého takový snadno uchopitelný náhled na problematiku. Formálně zapsáno:
Zde konkrétně jde o jevy:
A = je spam
B = obsahuje frázi z databáze
Zadáno pak je (opačný jev značím apostrofem)
P(A) = 0,7 - pravděpodobnost, že náhodně vybraná/došlá zpráva je spam
P(A|B) = 0,8 - zpráva je spam (A) za předpokladu, že obsahuje frázi (B)
P(A'|B') = 0,05 - zpráva není spam (A') ta předpokladu, že neobsahuje frázi (B')
Pak je to jen poměrně jednoduché využití Bayesovy věty, ptáš se postupně (pokud jsem se to toho už nezamotal) na P(B), P(B|A) a P(B|A)+P(B'|A').
Takže doporučuji na symbolice zapracovat. Velmi hezky je symbolika vysvětlena ve knize A. Rényi: Teorie pravděpodobnosti. Academia 1972, dokonce bych řekl, že mnohem lépe než ve většině současných učebnic a skript.
Pokud se chceš obejít bez podmíněné pravděpodobnosti, jde to také. Jen si musíš dávat velký pozor na to, co skutečně víš a co skutečně počítáš. Např. první otázku můžeš formulovat tak, že se ptáš, jaká je pravděpodobnost, že je v příchozím mailu fráze, jestliže víš, že s pravděpodobností 0,7 je to spam, kde je fráze s pravděpodobností 0,8, a s pravděpodobností 0,3 je to korektní zpráva, kde je závadná fráze s pravděpodobností 0,05, tj. p = 0,8*0,7 + 0,3*0,05. U složitějších variant jde velmi snadno ztratit nit i když si např. kreslíš strom možností.
Offline
[re]p510718|Formol[/reDobrý večer,bohužel se mi nedaří dosadit jednotlivé pravděpodobnosti do vzorce Bayesovy věty.Mohu požádat o pomoc.Děkuji.
Offline
↑ Formol:Děkuji Vám za odborný popis celé problematiky,ale nemohu si sám poradit s dosazením jednotlivých dílčích ppstí a odpovědět na otázky.1.Jaká je ppst,že příchozí email bude označen jako spam?
2.Jaká je ppst,že příchozí email je spam,byl-li označen jako spam?
3.Jaká je ppst,že příchozí email je filtrem správně identifikován(spam je označen jako spam,běžný email není označen jako spam)?
.Můžete mi poradit?Děkuji a přeji pěkné Velikonoce.
Offline
↑ stenly:
Omlouvám se, ale nebyl jsem online... Záměrně jsem navedl jen na první krok z Bayesovského přístupu, v zásadě všechno jde odvodit od výše uvedeného vzorce.
Tak například první úloha, tj. P(A), lze řešit tak, že si najdete vztah pro úplnou pravděpodobnost:
Druhý sčítanec jde ale upravit. První krok je jednoduchý:
Tvar P(A|B') ale znamená "pravděpodobnost, že nastane A za předpokladu, že nenastane B". Jaká je "pravděpodobnost, že nenastane A za předpokladu, že nenastane B"? Ano, komplementární. Tedy:
A to už obsahuje jen výrazy se zadání, tedy stačí jen dosadit.
Druhá úloha se tím stává jen dosazením do vzorce.
Třetí úloha je jen početně pracnější variantou první úlohy.
Offline