Matematické Fórum

student103 · 10. 03. 2016 20:18

Ahojte,

môže mi niekto, prosím, (nie cez matematické vzorce a vety) vysvetliť čo presne znamená viacrozmerné normálne rozdelenie? Pýtam sa, pretože napríklad pri aplikácií viacrozmernej diskriminačnej analýzy sa vyžaduje splnenie predpokladu viacrozmerného normálneho rozdelenia. Ako laik som si najprv myslel, že to znamená to, že proste každá jedna premenná musí pochádzať z normálneho rozdelenia a ak každá jedna premenná naozaj pochádza z normálneho rozdelenia, tak potom môžeme povedať, že ide o viacrozmerné normálne rozdelenie. Ale asi to tak nie je :)

natrafil som totiž na jednu prácu, kde je spomenuté: "Ak sú jednotlivé znaky normálne rozložené, nemôžeme s istotou povedať, že nimi tvorený vektor pochádza z mnohorozmerného normálneho rozloženia."

Ako to je potom? Zaujíma ma to len tak pre vlastnú potrebu, keďže sa trošku zaoberám diskriminačnou analýzou. Ďakujem

Stýv · 10. 03. 2016 20:32

matematika se bez vzorců a vět dělá dost blbě

check_drummer · 12. 03. 2016 12:22

↑ Stýv:
Ahoj, bez vzorců to jde, ale bez vět už moc ne. I když jak která oblast, většina oblastí potřebuje i ty vzorce.

student103 · 13. 03. 2016 15:33

páni, ale nedá sa to proste nejak popísať? Keby príde za mnou človek a spýta sa ma, že čo je to normálne rozdelenie a ako viem na prvý pohľad zistiť, či súbor má normálne rozdelenie alebo nie, tak by som mu vedel v pár vetách podať odpoveď? Tu sa to nedá?

Stýv · 13. 03. 2016 15:52

↑ student103: těch pár vět bych rád viděl

student103 · 17. 03. 2016 21:06

Stýv, ak mi nevieš pomôcť, tak nerozumiem k čomu sú dobré tieto pripomienky...

Rád by si tých pár viet videl? Ak by sa ma niekto spýtal, čo je normálne rozdelenie, tak mu nakreslím graf hustoty pravdepodobnosti normálneho rozdelenia a vysvetlím mu nejaké pravidlo 3 sigma. Zároveň by som dodal, že ak máme nejaký rozsiahli súbor a vidíme, že jeho smerodajná odchýlka je 50-krát vyššia ako priemer súboru, tak určite súbor nebude mať normálne rozdelenie.Každý by to asi pochopil.

Takže nedalo by sa to "polopate" vysvetliť? ...ja si myslím, že dalo

Samozrejme, teraz už buď neodpíšeš, alebo napíšeš, že sa úplne mýlim :)

Stýv · 17. 03. 2016 22:30

↑ student103: máš pravdu v jednom – úplně se mýlíš.
1) hustotu, které na pohled vypadá podobně jako hustota normálního rozdělení, má spousta (někonečně mnoho) jiných rozdělení
2) "nějaké pravidlo 3 sigma" taky bude platit pro spoustu jiných rozdělení
3) normální rozdělení může mít libovolnou střední hodnotu i směrodatnou odchylku, tkaže podle toho nepoznáš vůbec nic

student103

Ak sú charakteristiky súboru (vo veľkosti napr. 100 000 pozorovaní) určitej premennej napríklad nasledovné:

mean: 1,90
stdev: 802

tak premenná môže mať normálne rozdelenie???

Stýv · 19. 03. 2016 20:45

samozřejmě. proč si myslíš, že by to nemohlo být třeba z rozdělení N(1,9; 640000)?

student103 · 19. 03. 2016 21:15

Vlastne máš pravdu. Poplietla ma trochu tá velká variabilita. Ale keby som doplnil ešte jednu charakteristiku a to napríklad takú, že 75. percentil je 500, tak už je možné predpokladať, že súbor nebude mať normálne rozdelenie, že? (...stále sa bavíme o dostatočne veľkom súbore)

jarrro · 20. 03. 2016 08:15 — Editoval jarrro (20. 03. 2016 08:20)

↑ student103:
ak vieš čo znamená normálne jednorozmerné rozdelenie tak môžeš povedať, že (to je tuším aj definícia), že
náhodný vektor $\mathbf{x}=$x_1, \cdots , x_n$$ má mnohorozmerné normálne rozdelenie s vektorom stredných hodnôt $\mathbf{\mu}$ a variačnou maticou $\mathbb{V}$ práve vtedy keď pre ľubovoľný n-rozmerný vektor $\mathbf{c}=$c_1, \cdots , c_n$$ je
$\mathbf{c}\mathbf{x}^{T}\sim N{$\mathbf{c}\mathbf{\mu}, \mathbf{c}\mathbb{V}\mathbf{c}^{T}$}.$
dúfam, že sa nemýlim, ale každý test normality na dostatočne dlhých dátach a dostatočne malej hladine významnosti zamietne normalitu aj keby boli dáta naozaj normálne rozdelené čo v reálnom prípade nenastane podľa mňa nikdy preto sa mi nepáči, že sa matematická štatistika aplikuje v normálnej nematematickej praxi
prečo odmietaš matematické vety?

student103

Jarro, ja neodmietam matematické vety. To v žiadnom prípade. Problém je, že ja neviem takúto vetu preložiť/prečítať: $\mathbf{c}\mathbf{x}^{T}\sim N{$\mathbf{c}\mathbf{\mu}, \mathbf{c}\mathbb{V}\mathbf{c}^{T}$}.$

Neštudujem matiku, aj keď k nej mám blízko. Ale na tom, čo píšeš ma ihneď zaujalo toto tvrdenie: "ale každý test normality na dostatočne dlhých dátach a dostatočne malej hladine významnosti zamietne normalitu aj keby boli dáta naozaj normálne rozdelené"

To akože ak mám naozaj veľký súbor pozorovaní, tak vôbec nemusím riešiť nejaké testovanie normality dát? To sa mi nejak nepozdáva, pretože ja takým podobným súborom disponujem, kde sú desiatky tisíc pozorovaní. Ak by som na súbore chcel realizovať nejaké štatistické metódy - napríklad zrealizovať test zhody dvoch stredných hodnôt, tak je pre mňa otázkou, či použiť parametrické alebo neparametrické testy. Pretože čítal som, že napríklad klasický t-test pre dva nezávislé súbory je možné použiť iba v prípadoch, ak skúmaná premenná pochádza z normálneho rozdelenia. Inak je vraj potrebné použiť neparametrickú obdobu - Wilcoxonov test (tuším)

Takže v mojom prípade by postup mal byť nasledovný:
1. najprv otestovať či skúmaná premenná pochádza z normálneho rozdelenia
2. ak áno, použiť t-test. Ak nie, tak neparametrický test

To isté platí aj pre iné metódy - napríklad pri skúmaní korelácií medzi premennými. Ktoré použiť? Pearsonove alebo Spearmanove? Opäť to závisí vraj od toho, či skúmané premenné pochádzajú z normálneho rozdelenia (aspoň tak som si to naštudoval)

Ty však tvrdíš, že pri naozaj veľkom súbore pozorovaní vôbec nemusím riešiť nejaké testovanie normality, pretože tak či tak bude hypotéza o normalite zamietnutá. Tak ako potom postupovať?

Ďakujem

jarrro · 20. 03. 2016 11:08 — Editoval jarrro (20. 03. 2016 11:19)

samozrejme som myslel $\mathbf{c}\mathbf{x}^{T}\sim N{$\mathbf{c}\mathbf{\mu}\color{red}^{T}\color{black}, \mathbf{c}\mathbb{V}\mathbf{c}^{T}$}$
znamená to, že skalárny súčin s ľubovoľným vektorom je normálne rozdelený s danými parametrami
môžeš si vykreslť odhad hustoty alebo histogram a podľa toho sa rozhodnúť nikdy som nebol dobrý v analýze konkrétnych dát. vždy záleží na konkrétnej situácii a aj na tom akej povahy sú tie dáta čo sa testuje kvôli čomu sa testuje atď. nie je všetko len o matematike preto som písal, že sa mi nepáči aplikovanie štatistiky
často o kvalite metódy testovania rozhodne až vývoj udalosti v čase
mimochodom desať tisíce dát nie je málo ale niekedy na zamietnutie by muselo byť možno quadriliarda dát ak sú (skoro)normálne

Matematické Fórum

#1 10. 03. 2016 20:18

Čo presne znamená viacrozmerné normálne rozdelenie?

#2 10. 03. 2016 20:32

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#3 12. 03. 2016 12:22

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#4 13. 03. 2016 15:33

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#5 13. 03. 2016 15:52

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#6 17. 03. 2016 21:06

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#7 17. 03. 2016 22:30

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#8 19. 03. 2016 15:26 — Editoval student103 (19. 03. 2016 15:29)

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#9 19. 03. 2016 20:45

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#10 19. 03. 2016 21:15

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#11 20. 03. 2016 08:15 — Editoval jarrro (20. 03. 2016 08:20)

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#12 20. 03. 2016 10:44 — Editoval student103 (20. 03. 2016 10:45)

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

#13 20. 03. 2016 11:08 — Editoval jarrro (20. 03. 2016 11:19)

Re: Čo presne znamená viacrozmerné normálne rozdelenie?

Zápatí