Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Stránky: 1
Měl bych několik dotazů týkajících se t-testů. Pokoušel jsem se hledat ve starších příspěvcích, ale nenašel jsem nic, co by mi dávalo smysl, tak prosím o vysvětlení jako pro někoho, kdo statistice příliš nerozumí.
První dotaz - když mám úlohu, kde testuji 2 hypotézy - nulová říká, že s něčím začínají lidé od 18 let věku, z dat, která mám ale vychází průměr 17 let (nemám k dispozici jednotlivá data, pouze že výběrový soubor byl 48 lidí) s odchylkou 4,5 roku. Je těch 17 let i výběrový průměr (
)? Pokud ne, jak ho z toho zjistím?
Další dotaz je: jak se liší jednostranný a dvoustranný t-test a jak poznám, který používám? Jak se liší levostranný/oboustranný/pravostranný?
Pokud potřebuji vyvrátit nebo potvrdit nulovou hypotézu, vypočítám si t-test a porovnám ho s kritickou hodnotou, pokud bude větší než kritická hodnota, nulová hypotéza neplatí? A je to tak vždy, nebo ne?
A asi dost hloupý dotaz, ale co je to t ve vzorci pro výpočet kritické hodnoty
nebo
, n-1 by ve zmíněné úloze s věkem označoval 48 - 1, nebo ne? (A pokud ne, tak co?) Jak do výpočtu zohledním to
nebo
?
Pokud mám zadanou odchylku, průměr, počet nabídek (n?), jak z toho vytvořím interval, který bude obsahovat 99% a 95% nabídek? Jedná se o konfidenční interval a procenta udávají, že hladina významnosti bude 0,01 a 0,05? Co přesně mi vlastně konfidenční interval říká?
A taková hloupá otázka na závěr - pokud nemám zadanou hladinu významnosti, mohu si ji zvolit, nebo se také musí nejprve nějak vypočítat? Například kdybych měl výběrový soubor o 35 lidech?
Offline
Je těch 17 let i výběrový průměr (
)?
Ano.
jak se liší jednostranný a dvoustranný t-test a jak poznám, který používám?
Při oboustranném t-testu alternativní hypotéza říká, že nulová hypotéza neplatí na jednu nebo na druhou stranu.
Příklad:
Označ si střední hodnotu náhodné veličiny, kterou testuješ (a která splňuje předpoklady t-testu) jako
, a označ nějakou konstantu jako
, pak
.
Při jednostranném testu říká alternativní hypotéza, že nulová hypotéza neplatí jen v jednom konkrétním směru. Jednostranný t-test může vypadat takto:

Ten je pravostranný, protože
říká, že
se nachází vpravo od
.
Nebo takto:

Levostranný.
Který test použít poznáš z formulace zadání.
Pokud potřebuji vyvrátit nebo potvrdit nulovou hypotézu
Nulovou hypotézu nemůžeš potvrdit ani vyvrátit - nikdy nevíš s jistotou, jestli platí, nebo ne.
(Výjimkou by byl třeba případ, kdy testuješ, zda data pocházejí z rozdělení s definičním oborem na
a alespoň jeden datový bod máš mimo tento interval - pak bys věděl s jistotou, že nulová hypotéza neplatí. Ale obecně to nikdy s jistotou nemůžeš zjistit.)
Můžeš ji jenom zamítnout nebo nezamítnout.
pokud bude větší než kritická hodnota, nulová hypotéza neplatí? A je to tak vždy, nebo ne?
Pro t-test ano, pro jiné testy zamítáš
např. pokud není v určitém intervalu, atd. To se vždycky dozvíš ze skript.
Důležité: To, že
zamítáš, neznamená, že neplatí, znamená to, že sis dostatečně jistý, že neplatí.
A asi dost hloupý dotaz, ale co je to t ve vzorci pro výpočet kritické hodnoty
nebo
To je percentil t-rozdělení.
Např.
je
percentil t-rozdělení o
stupních volnosti.
n-1 by ve zmíněné úloze s věkem označoval 48 - 1
Ano.
Obrázek tady. (Najdi na stránce obrázek s nadpisem "obor hodnot pro testovací kritérium t".)
Jedná se o konfidenční interval a procenta udávají, že hladina významnosti bude 0,01 a 0,05?
(Edit: Opraveno.)
Není to konfidenční interval.
Pokud je to normální rozdělení pravděpodobnosti a ty hledáš interval, v jakém se nachází
nabídek, je to interval
, kde
je neznámé číslo (není to počet nabídek).
Najdeš ho tak, že
, kde
je distribuční funkce normovaného normálního rozdělení, jejiž hodnoty najdeš v tabulkách.
Počet nabídek podle mě k tomu vůbec nepotřebuješ.
Taky to podle mě není možné určit, pokud neznáš rozdělení, z jakého nabídky pocházejí.
Co přesně mi vlastně konfidenční interval říká?
konfidenční interval (česky interval spolehlivosti) parametru znamená, že existuje
pravděpodobnost, že tento interval bude uzavírat skutečnou hodnotu parametru.
pokud nemám zadanou hladinu významnosti, mohu si ji zvolit, nebo se také musí nejprve nějak vypočítat
To je buď zadané, nebo 0,05.
Například kdybych měl výběrový soubor o 35 lidech?
Počet datových bodů na hladinu významnosti nemá vliv.
Offline
Stránky: 1