Matematické Fórum

Romanm745 · 02. 02. 2016 22:09

Pomáham manželke so štatistickým spracovaním dát v diplomovej práci. Jedná sa o súbor dát s 30-timi pacientami, ktorým sa okrem iného sledoval rozsah pohybu pred a po aplikovaní fyzioterapie. Alternatívna hypotéza je, že dôjde k signifikantnému zlepšeniu rozsahu pohybov - teda priemerná hodnota rozsahov sa signifikantne zlepší. Predpokladal som, že urobím najskôr F-test pre zistenie, či sú rozptyly oboch prípadov rovnaké a potom použijem párový studentov T-test, ktorým potvrdím hypotézu H0 alebo alternatívnu hypotézu H1. Problémom je, že tento parametrický test sa môže použiť iba pre dáta, ktoré majú normálne Gausovo rozdelenie. Teda dáta pred aj po liečbe by mali byť v normálnom rozdelení. Dáta som otestoval a ani jeden súbor nie je v normálnom rozdelení. Pozeral som nejaké hotové diplomové práce - podotýkam, že obhájené minulý rok - a tam veselo použili párový T-test. Kontrolou som zistil, že ani tie dáta neboli v normálnom rozdelení, tým pádom majú celé overovanie hypotéz špatne.
Aké mám teraz ďalšie možnosti? Pre ilustráciu sem dávam súbor dát. 1.stĺpec je vek pacienta, 2.stĺpec je rozsah pohybu v stupňoch pred liečbou a 3. stĺpec je rozsah pohybu po liečbe. Sú to reálne dáta, nie sú vymyslené. Napr. taký vek pacientov je v normálnom rozdelení a nerozumiem prečo ostatné dáta nie sú?
Vďaka za nápady, čo s tým ďalej.

68 50 70
77 50 80
68 50 70
76 50 75
72 30 60
63 70 90
71 50 90
70 30 65
52 30 60
64 50 70
68 50 70
63 60 85
67 50 70
76 30 65
73 50 90
53 45 75
63 45 90
60 50 80
67 35 70
75 20 50
49 30 70
71 20 60
70 40 70
64 50 65
61 50 70
56 50 80
71 40 70
83 50 75
73 70 90
55 70 90

Stýv · 02. 02. 2016 23:14

viz např. https://en.wikipedia.org/wiki/Student%2 … n_problems

Romanm745 · 03. 02. 2016 08:59

Ano, alternatívou je neparametrický Wilcoxov test. Môže zostať hypotéza v rovnakom znení. Všade som videl, že sa v prípade tohoto testu pracuje s hypotézami okolo mediánu, tak neviem, či to ovplyvní pôvodné hypotézy.
Ďalej som vygooglil, že pôvodne uvažovaný párový T-test môžem použiť aj na dáta, ktoré nespĺňajú normalitu, presnejšie povedané, že sa len miene "odkláňajú" od normality. Čo však znamená, že sa mierne odkláňajú, to som sa už nedočítal. Test normality som robil online na webe a tam mi vypísalo iba, či súbor spĺňa alebo nespĺňa normalitu. Viete mi niekto pomôcť posúdiť, či na tie moje dáta môžem použiť parametrický párový T-test?

emsinko

v Rku staci dat wilcox.test(x,y,alternative="less",paired=TRUE) , lde x je pred a y je po liecbe

//forum.matweb.cz/upload3/img/2016-02/93592_forum.png

emsinko · 04. 02. 2016 14:30

Tak to je vidno uz na prvy pohlad ze nejsu normalne :) Skuste si dat histogram v Rku :
hist(x) , kde x je nejaky subor a uvidite ze to nebude pekna gausova krivka . A este ktomu co ste spominal ,ze ste nasli obhajene zle prace . Tak nas ucitel povedal ze po svete beha tak vela "statistikov", ktory absolutne nekontroluju normalitu dat a robia hypotezy :) Takze som rad ze sa najdu aj ludia ako vy co ich testuju

Romanm745 · 04. 02. 2016 20:19

OK, vďaka. Ešte mi však nie je jasná vec s tými hypotézami. Chcem teda dokázať alternatívnu hypotézu H1, že dôjde k signifikantnému zlepšeniu rozsahu pohybu v končatine. Prečo sa všade v súvislosti s Wilcoxovým testom uvádza ako hypotéza H0 , že mediány párových súborov sú rovnaké? Prečo mediány a prečo nie stredné hodnoty, ako je tomu pri párovom T-teste? Mám tam aj ja uviesť rovnakú hypotézu H0? Pokiaľ výjde P< $\alpha$ , zamietam H0 a tým pádom platí, že mediány sú rôzne a platí moja alternatívna hypotéza?
A ešte taká vec, čo sa týka rozdielu medzi 1-tail a 2-tail (neviem slovenský/český ekvivalent). Pokiaľ chcem teda dokázať, že sa zlepší rozsah pohybu po liečbe - teda medián v súbore y bude významne väčší, tak mám uvažovať s 1-tail wilcoxovým testom?

emsinko

↑ Romanm745:

Vase tusenie co by ste rad dokazal sa dava do H1 ale je pravidlo ze ak ide o ROVNOSTNU hypotezu tak ta sa vzdy dava do H0 , t.j nikdy nemame v H0 ze : stredna hodnota sa nerovna 5 (napr.)

Bezne sa to robi tak ze si nakreslite boxploty ( to co som dal vykreslit ja na obrazku) a tie hrube cierne ciary su mediany , ktore su troska horsie vidiet kvoli farbe a z obrazka je vidno jasne ze median je vyssi po liecbe . Preto testujeme v H1 ze $\mu (pred)<\mu (po)$ -t.j chceme otestovat strednu hodnotu a nie ze ci median je vacsi. Median sa pouziva kvoli robustnosti , t.j. keby sme kukali na priemery tak tie su citlive na extremne dáta ( ta gulicka co je pod modrym obdlznikom), zatialco median nema problem s extremnymi honotami. Cize mediany su len taky kvazi pred test aby sme mali nejake tusenie ze co ist testovat

A nam ucitel nikdy nespominal ze v hypoteze su mediany , o tom neviem nic . My sme stale stredne hodnoty testovali co sme potom odhadovali nejakymi velicinami.

Vasa otazka : Prečo sa všade v súvislosti s Wilcoxovým testom uvádza ako hypotéza H0 , že mediány párových súborov sú rovnaké? Prečo mediány a prečo nie stredné hodnoty, ako je tomu pri párovom T-teste? Mám tam aj ja uviesť rovnakú hypotézu H0? Pokiaľ výjde P< $\alpha$ , zamietam H0 a tým pádom platí, že mediány sú rôzne a platí moja alternatívna hypotéza?

Odpoved : Pokial davate rovnostnu hypotezu tak sa v alternativne H1 udava "two sided" tj < alebo > resp. nerovnajuce. Preto vo vasom pripade je lepsia hypoteza H1: stredna hodnota (pred)<stredna hodnota (po) v H0 to iste len >= a ano ak P-value vam vyjde mensia ako $\alpha$ % kvantil resp. (1- $\alpha$ )% kriticka hodnota tak zamietame H0 a rozdiel z danych dat je statisticky vyznamny .

Romanm745 · 20. 02. 2016 23:19

↑ emsinko:
Hypotézy mám otestované, len teraz ich musím sformulovať.
Hypotéza H0 bude: rozsah pohyblivosti pred liečbou a po ličbe sa nezmení, teda $\mu$ 1= $\mu$ 2
Alternatívna hypotéza H1: po liečbe dôjde k významnému zvýšeniu rozsahu pohyblivosti, teda $\mu$ 1< $\mu$ 2
Jedná sa teda o ľavostrannú hypotézu. Výsledky z wilcoxonovho testu som volil z tohoto dôvodu ako 1-tail. Je to takto správne, alebo aj v tomto prípade mám uvažovať 2-tail test? Hladinu významnosti som volil 0.01. Mimochodom od čoho závisí, či volím $\alpha$ = 0.05 alebo 0.01?
Hodnota P mi vyšla oveľa menšia , ako 0,01 , tým pádom som H0 zamietol a prijal som H1. Toto bude možno primitívna otázka, ale nejde mi celkom do hlavy to, prečo by som mal prijať hypotézu H1. Čo ak by som volil H1 úplne opačne teda $\mu$ 1> $\mu$ 2? Taktiež by som predsa dokázal, po zamietnutí H0, že platí H1, ale úplne opačná, teda, že došlo k zhoršeniu pohyblivosti po liečbe. Závisí to iba od nameraných dát?

emsinko · 22. 02. 2016 20:46

↑ Romanm745:

V prvom rade tie dve hypotezy musia tvorit celu mnozinu. Teda ak do H0 date rovnost tak v H1 je nerovnost.
Ak do H0 date < tak do H1 musite dat doplnok tj. >= . Takze vo vasom pripade je H0: mu1>=mu2 vs. H1: mu1<mu2 . Kedze ide o nerovnostnu hypotezu tak sa rata iba z jednej strany , co je asi to 1-tail (nestretol som sa este stymto nazvom) a v pripade rovnostnej hypotezy sa pocita 2*pravdepodobnot co by mala byt to vase 2-tail. Tá hladina vznamnosti sa voli podla toho ako si chcete byt isty tym zamietnutim. V medicine sa pouziva 1% aby nedoslo k falosnemu zamietnutiu. Lebo moze sa stat ze H0 plati ale test ju zamietne (falosne zamietnutie) a cim je mensia hladina vyznamnosti tak tym mensia sanca ze test zamietne.

Keby ste zvolil opacne H1 tak by vam ten test nezamietol , to suvisi stym ze nemozete davat do H0 rovnost a do H1 nerovnost.

Romanm745 · 22. 02. 2016 21:42

↑ emsinko:
Ja som bol stále v tom, že Wilcoxonov test dokazuje/vyvracia rovnosť priemerov/mediánov. Teda hypotéza H0 by mala byť postavená na rovnosti priemerov. Ak teda postavím hypotézu H0 tak, že $\mu 1$ = $\mu 2$ , teda že priemery rozsahov pohyblivostí budú rovnaké pred liečbou a po liečbe, tak alternatívna hypotéza bude, že priemery budú rôzne. Teda ak zamietnem H0, tak potvrdím, že priemery sú rôzne. Nedokážem len to, či sú rozne, ale viem z hodnôt , či sa zlepšil alebo zhoršil priemer.
Už som totálne z tých hypotéz popletený.

emsinko · 22. 02. 2016 21:58

Ano presne ... ak date H0: mu1=mu2 a test H0 zamietne tak potom mozete tvrdit ze rozdiel medzi tymi dvoma strednymi hodnotami je statiticky vyznamny ( nerovnaju sa). A preto ked chcete ukazat ze mu(pred)<mu(po) tak to davame do H1 , nakolko do H1 sa dava to co chcete ukazat a tym padom doplnkok dame do H0: mu(pred)>=mu(po).

Jedina vynimka je ak chcete ukazat ze sa rovnaju. Ak chceme nejak ukazat ze u1=u2 tak to sa vzdy dava do H0
V skratke ak ide o hypotezy typu rovna sa vs nerovna sa tak v H0 je vzdy rovna sa a v H1 je vzdy nerovna sa.

Test samostatny len potvrdzuje alebo zamieta H0 , to ze ako postavime test je uz na nas.
Ked sa pozriete hore na moj obrazok tak tam mam:
Wilcox.test(pred,po,alternative=less,paired=TRUE) to znamena ze alternative-> H1: pred je less ako po tj . pred<po
P-value vysla mala ( mensia ako 0,05 -> 5% hladina vyznamnosti) a teda zamietame H0 => stredna hodnota po je vacsia , je to statisticky vyznamne.

Vo vasom pripade ak H0 zamietneme, avsak neukazali sme ze PO>PRED . Ak by sme to chceli statisticky ukazat tak by sme museli postavit tie nerovnostne hypotezu. Rozumiem vam ze to vidite z priemerov resp. z medianov, ale to ste v podstate videl aj to ze sa nerovnaju a nemusel ste to ani testovat. Preto hovorim : treba si zistit median/priemer a nejak odhadnut ze co je podla vas pravda a to teraz dame do H1 a otestujeme.

Romanm745 · 22. 02. 2016 23:22

↑ emsinko:
Teda nulovú hypotézu mám slovne formulovať takto? Rozsah pohyblivosti bude po liečbe rovnaký alebo menší ako po liečbe?
Ja na výpočet používam online výpočet wilcoxonovho testu a tam sa neudáva, či je alternatívna hypotéza less or more. Ja som bol presvedčený, že wilcox počíta automaticky, že sú rôzne.

Rozumiem vam ze to vidite z priemerov resp. z medianov, ale to ste v podstate videl aj to ze sa nerovnaju a nemusel ste to ani testovat. Áno, vidím, že priemer je väčší, ale neviem to, že je to štatisticky významný rozdiel. To práve dokážem výpočtom. A na ktorú stranu sa prikloním, vidím z tých priemerov. Takto som pôvodne uvažoval. Čo som na nete videl nejaké vypočítané príklady, tak v nulovej hypotéze boli vždy rovnajúce sa priemery a na konci len stroho vyhlásili, že pred < po. Nedávali do H0 , že pred=po
Ale ako som už písal, už sa v tom dosť zamotávam.

Matematické Fórum

#1 02. 02. 2016 22:09

Studentov párový T-test testovania hypotéz

#2 02. 02. 2016 23:14

Re: Studentov párový T-test testovania hypotéz

#3 03. 02. 2016 08:59

Re: Studentov párový T-test testovania hypotéz

#4 04. 02. 2016 14:24 — Editoval emsinko (04. 02. 2016 14:46)

Re: Studentov párový T-test testovania hypotéz

#5 04. 02. 2016 14:30

Re: Studentov párový T-test testovania hypotéz

#6 04. 02. 2016 20:19

Re: Studentov párový T-test testovania hypotéz

#7 04. 02. 2016 21:27 — Editoval emsinko (04. 02. 2016 21:32)

Re: Studentov párový T-test testovania hypotéz

#8 20. 02. 2016 23:19

Re: Studentov párový T-test testovania hypotéz

#9 22. 02. 2016 20:46

Re: Studentov párový T-test testovania hypotéz

#10 22. 02. 2016 21:42

Re: Studentov párový T-test testovania hypotéz

#11 22. 02. 2016 21:58

Re: Studentov párový T-test testovania hypotéz

#12 22. 02. 2016 23:22

Re: Studentov párový T-test testovania hypotéz

Zápatí