Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Stránky: 1
Zdravím, prosím potřebovala bych poradit s příkladem, který řeším ve statistice. Dává tento příklad a jeho řešení smysl? řešila jsem to v programu R. Díky moc všem, co mi pomohou nebo potvrdí mé řešení :)
Př: Na začátku roku 2020 jsem si dala osobní novoroční předsevzetí, že moje měsíční výdaje v následujících letech nepřekročí 10 000 Kč měsíčně. Pro sledování dat jsem použila aplikaci Spendee, do které jsem v průběhu roku 2020 zapisovala své výdaje řazené do kategorií. Aktuálně tedy datový soubor obsahuje data z období leden - říjen 2020. Jedná se kvantitativní, spojitý znak.
Měsíc Celkové výdaje
I.20 12 749,00 Kč
II.20 14 973,00 Kč
III.20 7 521,00 Kč
IV.20 7 392,00 Kč
V.20 9 418,00 Kč
VI.20 11 210,00 Kč
VII.20 10 519,00 Kč
VIII.20 4 090,00 Kč
IX.20 24 364,00 Kč
X.20 6 430,00 Kč
Statistický znak X: měsíční výdaje (v korunách)
Statistická jednotka: výdaj za 1 měsíc (v korunách)
Základní soubor Z: všechny měsíce od začátku roku 2020
Výběrový soubor: 10 měsíců
Příklad nadále počítám ve statistickém programu R s komentářem postupu a závěrem.
> x=c(12749, 14973,721,7392,9418,11210,10519,4090,24364,6430)
> length(x) = délka výběrového souboru
[1] 10
> mean(x) = průměr výběrového souboru
[1] 10186.6
> median(x) = střední hodnota výběrového souboru
[1] 9968.5
> sd(x) = směrodatná odchylka výběrového souboru
[1] 6505.645
> shapiro.test(x) = test normality dat pomocí Shapiro-Wilkova testu normality
Shapiro-Wilk normality test
data: x
W = 0.94892, p-value = 0.6557
Postup na základě výsledků testu v programu R:
a) formulace H0: sledovaný znak (měsíční výdaje) má normální rozdělení
formulace H1: sledovaný znak nemá normální rozdělení
b) testové kritérium W = 0,94892
c) volím hladinu významnosti α = 0,05
- p-hodnota 0,6557
- p-hodnota je větší než 0,05
d) ponecháme H0
e) sledovaný znak má normální rozdělení
- měsíční výdaje mají normální rozdělení
5) základní soubor můžeme popsat normálním rozdělením
Přejdeme k testování pomocí jednovýběrového parametrického testu. Volíme parametrický test, protože jsme zjistili, že datový soubor má normální rozdělení, tedy je lepší použít parametrický test, který je silnější, tady s větší pravděpodobností zamítneme nulovou hypotézu, když platí alternativní hypotéza.
Formulujeme hypotézy:
formulace H0: průměrné měsíční výdaje jsou ve výši 10 000
formulace H1: průměrné měsíční výdaje jsou větší než 10 000
> t.test(x,alternative="greater",mu=10000)
One Sample t-test
data: x
t = 0.090703, df = 9, p-value = 0.4649
alternative hypothesis: true mean is greater than 10000
95 percent confidence interval:
6415.4 Inf
sample estimates:
mean of x
10186.6
>
Porovnávám dále p hodnotu, která je spočítána v programu R.
- porovnám p-hodnotu s hladinou významnosti Alfa
- p-hodnota je větší než hladina významnosti Alfa
P-hodnota je větší než hladina významnosti, proto nezamítám hypotézu HO a tedy na hladině významnosti 5% přijímám nulovou hypotézu. Průměrné měsíční výdaje tedy odpovídají 10 000 korun.
Offline
Stránky: 1