Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Stránky: 1
Obě definice jsou téměř stejné, akorát u směrodatné odchylky se dělí číslem N-1, kdežto u střední kvadratické odchylky se dělí číslem N, kde N je počet vzorků. Můžu se zeptat, jaká byla motivace pro zavedení toho "N-1" ve vzorečku pro směrodatnou odchylku? Díky moc!
Offline
↑ Stýv: Proč by měl být ten s 1/N vychýlený, když máme N dat? Já bych třeba spíš za vychýlený považoval ten s 1/(N-1). Ptám se spíš na to, co kdysi dávno statistiky motivovalo zavést výběrovou směrodatnou odchylku právě tak, jak ji zavedli (a ne jinak).
Možná se nabízí tu otázku formuloivat ještě jinak: vzorec vychýlený od čeho? (od jakého platonského ideálu?)
Stačí hodit odkaz.
Offline
Vychýlený znamená, že není nestranný. To nejsou nějaké filozofické pindy, ale statistické pojmy.
Viz https://en.wikipedia.org/wiki/Standard_ … Estimation
Trochu jsem to popletl, ten odhad směrodatné odchylky je vychýlený i s 1/(n-1), ale vychází alespoň z nestranného odhadu rozptylu.
Offline
↑ Stýv: Díky, počtu si. :-)
Offline
↑ Anonymystik:
Já teda nevím, jestli to chápu úplně přesně, ale zhruba to tak bude.
Totiž - kdybys ta náhodná čísla znal všechna (jenže ono jich může být nekonečno), a nebo jich znal alespoň velké množství, tak je ten vztah obsahující jen 1/N správný.
Problém je, když těch čísel znáš jen pár, třeba 10-30, potom by ti směrodatná odchylka vypočtená dle vztahu 1/N... vycházela (v průměru) menší. Zatímco když použiješ vztah obsahující 1/(N-1), bude ti vycházet (v průměru) správně.
Je to ovšem třeba zase chápat statisticky, když si vybereš 20 čísel z nějaké veké množiny, vypočtená hodnota odchylky je zase náhodná (a můžeš mít štěstí/smůlu, že sis vybral zrovna nejvíce "rozlítaná" čísla). Ale když to uděláš mnohokrát - budeš se pohybovat okolo té správné hodnoty.
Samozřejmě, pokud bys měl k dispozici hodnot velmi málo (jako třeba 2, 3, 4, 5) je to stejně všechno na nic, ale pokud jich budeš mít třeba 10, 20, 30...tak ten vzorec obsahující 1/N-1 ti dá (s pravděpodobností větší než jakýkoliv jiný vzorec) hodnotu která odpovídá směrodatné odchylce když je N nekonečné.
==================================================================
Představi si praktický případ, kdy máš stroj, ze kterého padají výrobky, a zajímá tě třeba, jak jsou velké. Nemůžeš ovšem čekat, až stroj vyrobí 1000 těch věcí - protože jich dělá třeba jen 10 za den. A čekal bys na to půl roku. A ty můžeš čekat jen pár dní, pak to musíš začít prodávat. A chceš odhadnout, co z toho stroje bude padat během následujícího roku...tak to je přesně ten případ pro použití výběrové směrodatné odchylky (vztah s 1/N-1).
Za rok to budeš vědět přesně, co ze stroje vypadlo, ale to už ti to nepomůže...to už bude pozdě.
Offline
↑ MichalAld: Ahoj, díky moc za objasňující odpověď. Už jsem se v tom trochu zorientoval. Já směrodatnou odchylku (a varianci) potřebuju k účelům testování hypotéz v biomedicínském prostředí, kde se testuje na 20ti pacientech a 8mi zdravých lidech (kontrolní skupina), tak to se určitě hodí použít spíš ten vztah pro N-1.
Offline
Stránky: 1