Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Ahojte,
môže mi niekto, prosím, (nie cez matematické vzorce a vety) vysvetliť čo presne znamená viacrozmerné normálne rozdelenie? Pýtam sa, pretože napríklad pri aplikácií viacrozmernej diskriminačnej analýzy sa vyžaduje splnenie predpokladu viacrozmerného normálneho rozdelenia. Ako laik som si najprv myslel, že to znamená to, že proste každá jedna premenná musí pochádzať z normálneho rozdelenia a ak každá jedna premenná naozaj pochádza z normálneho rozdelenia, tak potom môžeme povedať, že ide o viacrozmerné normálne rozdelenie. Ale asi to tak nie je :)
natrafil som totiž na jednu prácu, kde je spomenuté: "Ak sú jednotlivé znaky normálne rozložené, nemôžeme s istotou povedať, že nimi tvorený vektor pochádza z mnohorozmerného normálneho rozloženia."
Ako to je potom? Zaujíma ma to len tak pre vlastnú potrebu, keďže sa trošku zaoberám diskriminačnou analýzou. Ďakujem
Offline
↑ Stýv:
Ahoj, bez vzorců to jde, ale bez vět už moc ne. I když jak která oblast, většina oblastí potřebuje i ty vzorce.
Offline
páni, ale nedá sa to proste nejak popísať? Keby príde za mnou človek a spýta sa ma, že čo je to normálne rozdelenie a ako viem na prvý pohľad zistiť, či súbor má normálne rozdelenie alebo nie, tak by som mu vedel v pár vetách podať odpoveď? Tu sa to nedá?
Offline
↑ student103: těch pár vět bych rád viděl
Offline
Stýv, ak mi nevieš pomôcť, tak nerozumiem k čomu sú dobré tieto pripomienky...
Rád by si tých pár viet videl? Ak by sa ma niekto spýtal, čo je normálne rozdelenie, tak mu nakreslím graf hustoty pravdepodobnosti normálneho rozdelenia a vysvetlím mu nejaké pravidlo 3 sigma. Zároveň by som dodal, že ak máme nejaký rozsiahli súbor a vidíme, že jeho smerodajná odchýlka je 50-krát vyššia ako priemer súboru, tak určite súbor nebude mať normálne rozdelenie.Každý by to asi pochopil.
Takže nedalo by sa to "polopate" vysvetliť? ...ja si myslím, že dalo
Samozrejme, teraz už buď neodpíšeš, alebo napíšeš, že sa úplne mýlim :)
Offline
↑ student103: máš pravdu v jednom – úplně se mýlíš.
1) hustotu, které na pohled vypadá podobně jako hustota normálního rozdělení, má spousta (někonečně mnoho) jiných rozdělení
2) "nějaké pravidlo 3 sigma" taky bude platit pro spoustu jiných rozdělení
3) normální rozdělení může mít libovolnou střední hodnotu i směrodatnou odchylku, tkaže podle toho nepoznáš vůbec nic
Offline
Ak sú charakteristiky súboru (vo veľkosti napr. 100 000 pozorovaní) určitej premennej napríklad nasledovné:
mean: 1,90
stdev: 802
tak premenná môže mať normálne rozdelenie???
Offline
Vlastne máš pravdu. Poplietla ma trochu tá velká variabilita. Ale keby som doplnil ešte jednu charakteristiku a to napríklad takú, že 75. percentil je 500, tak už je možné predpokladať, že súbor nebude mať normálne rozdelenie, že? (...stále sa bavíme o dostatočne veľkom súbore)
Offline
↑ student103:
ak vieš čo znamená normálne jednorozmerné rozdelenie tak môžeš povedať, že (to je tuším aj definícia), že
náhodný vektor
má mnohorozmerné normálne rozdelenie s vektorom stredných hodnôt
a variačnou maticou
práve vtedy keď pre ľubovoľný n-rozmerný vektor
je
dúfam, že sa nemýlim, ale každý test normality na dostatočne dlhých dátach a dostatočne malej hladine významnosti zamietne normalitu aj keby boli dáta naozaj normálne rozdelené čo v reálnom prípade nenastane podľa mňa nikdy preto sa mi nepáči, že sa matematická štatistika aplikuje v normálnej nematematickej praxi
prečo odmietaš matematické vety?
Offline
Jarro, ja neodmietam matematické vety. To v žiadnom prípade. Problém je, že ja neviem takúto vetu preložiť/prečítať: 
Neštudujem matiku, aj keď k nej mám blízko. Ale na tom, čo píšeš ma ihneď zaujalo toto tvrdenie: "ale každý test normality na dostatočne dlhých dátach a dostatočne malej hladine významnosti zamietne normalitu aj keby boli dáta naozaj normálne rozdelené"
To akože ak mám naozaj veľký súbor pozorovaní, tak vôbec nemusím riešiť nejaké testovanie normality dát? To sa mi nejak nepozdáva, pretože ja takým podobným súborom disponujem, kde sú desiatky tisíc pozorovaní. Ak by som na súbore chcel realizovať nejaké štatistické metódy - napríklad zrealizovať test zhody dvoch stredných hodnôt, tak je pre mňa otázkou, či použiť parametrické alebo neparametrické testy. Pretože čítal som, že napríklad klasický t-test pre dva nezávislé súbory je možné použiť iba v prípadoch, ak skúmaná premenná pochádza z normálneho rozdelenia. Inak je vraj potrebné použiť neparametrickú obdobu - Wilcoxonov test (tuším)
Takže v mojom prípade by postup mal byť nasledovný:
1. najprv otestovať či skúmaná premenná pochádza z normálneho rozdelenia
2. ak áno, použiť t-test. Ak nie, tak neparametrický test
To isté platí aj pre iné metódy - napríklad pri skúmaní korelácií medzi premennými. Ktoré použiť? Pearsonove alebo Spearmanove? Opäť to závisí vraj od toho, či skúmané premenné pochádzajú z normálneho rozdelenia (aspoň tak som si to naštudoval)
Ty však tvrdíš, že pri naozaj veľkom súbore pozorovaní vôbec nemusím riešiť nejaké testovanie normality, pretože tak či tak bude hypotéza o normalite zamietnutá. Tak ako potom postupovať?
Ďakujem
Offline
samozrejme som myslel 
znamená to, že skalárny súčin s ľubovoľným vektorom je normálne rozdelený s danými parametrami
môžeš si vykreslť odhad hustoty alebo histogram a podľa toho sa rozhodnúť nikdy som nebol dobrý v analýze konkrétnych dát. vždy záleží na konkrétnej situácii a aj na tom akej povahy sú tie dáta čo sa testuje kvôli čomu sa testuje atď. nie je všetko len o matematike preto som písal, že sa mi nepáči aplikovanie štatistiky
často o kvalite metódy testovania rozhodne až vývoj udalosti v čase
mimochodom desať tisíce dát nie je málo ale niekedy na zamietnutie by muselo byť možno quadriliarda dát ak sú (skoro)normálne
Offline