Matematické Fórum

Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.

Nástěnka
22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.

Nejste přihlášen(a). Přihlásit

#1 12. 10. 2021 14:44 — Editoval Karmanova cesta (12. 10. 2021 18:35)

Karmanova cesta
Příspěvky: 62
Reputace:   
 

Problematika krabicového grafu a rozptyl ve statistice

Dobrý den,
nejsem odborník přes statistiky, ale dělal jsem průzkum ohledně duševního zdraví a dal jsem lidem možnost známkovat jednotlivá období, které prožili v období 03/2020-05/2021. První obrázek je náhled na tabulku se známkami. Známkování je podobné jako ve škole ale naopak, vyšší stupeň znamená, že člověk se měl dobře. Takže ve sloupci BK je průměrná změna nálady pro daného respondenta za týden, v období březen až srpen 2020. Mě konkrétně teď zajímá světle zelený podklad, ř. 4-14. Na druhém obrázku jsem spočítal data potřebné pro boxový/krabicový graf: "minimum", Q1, Q2, Q3 a "maximum". Upozorňuji, že min/max se nepočítá podle funkce MIN() a MAX() v Excelu/Libreofficu, ale jak je to vyobrazeno zde: https://towardsdatascience.com/understa … 8d78ad9d19. S tvorbou boxového grafu se zdržím, je to trochu náročnější, ale vypadá to podobně jako na tom odkazu, jen to mám svisle. Když tedy vezmeme první 3 sloupec pro známku - Min je -11,09 a max je 15,16. Když se podíváme na data tak nejnižší hodnota ze vzorků v kategorii stupně 3 je -3,96 a nejvyšší 9,58. Průměr 2,17 ; median je 2,7. Mě se ale zdá, že min a max u boxového grafu je velmi daleko od průměru/středu 2,17 resp. 2,7. Jak by se dalo vyjádřit - myslím praktickým grafem - že rozptyl* hodnoty je v tomto případě malý? Slyšel jsem o nějakém termínu modus ang. mode, který se pro to možná používá? Existuje způsob jak to do grafu zakreslit? Jde mi o to, aby čtenář neměl dojem, že rozptyl* je velký, když je malý.

Pozn.
* rozptylem zde ale myslím rozdíl mezi Q1 a nejnižší hodnotou, a rozdíl mezi nejvyšší hodnotou a Q3. Tedy maximální vzdálenost hodnot od Q1 nebo Q3.

https://1.bp.blogspot.com/-D2EK5PYz25w/YWV8PzZDo5I/AAAAAAAAEVA/jFtBzbrGX70wGQp7Ov_9jkXZKz_kmmxvQCNcBGAsYHQ/w629-h507/img01.png

https://1.bp.blogspot.com/-hzKFGFoDZfw/YWV9EtFqGvI/AAAAAAAAEVI/Fh9Qc3gKgXQPfCtkOyHsNEHRl3O3tE1KACNcBGAsYHQ/w690-h353/img02.png

Třetí obrázek boxový graf úplně vlevo, vyjadřuje výše uvedené kvartily, "minima" a "maxima" pro kategorii stupeň 3. Tmavěji červená oblast jsou záporné hodnoty.
https://1.bp.blogspot.com/-zC6KuZN1fgQ/YWW48vlQ5HI/AAAAAAAAEVY/tSgylIVIhjA_-NchJFg7XXFDgTGdl4oSACNcBGAsYHQ/w613-h314/graf.png

Offline

 

#2 13. 10. 2021 14:57 — Editoval Richard Tuček (13. 10. 2021 14:57)

Richard Tuček
Místo: Liberec
Příspěvky: 1269
Reputace:   19 
Web
 

Re: Problematika krabicového grafu a rozptyl ve statistice

↑ Karmanova cesta:
Rozptyl je průměr kvadrátů odchylek od průměru.  Tamto je rozpětí.
V krabicovém grafu se zobrazí medián (50% kvantil) a dolní (25%) a hodní kvartil (75%).
Data mimo "krabici" jsou odlehlá pozorování.
Nejsem si úplně jistý, jestli je to na konci největší a nejmenší hodnota.
Nebo je snad délka čáry 1,5 násobek kvartilového rozpětí (hodní - dolní kvartil).

Offline

 

#3 13. 10. 2021 18:50

Karmanova cesta
Příspěvky: 62
Reputace:   
 

Re: Problematika krabicového grafu a rozptyl ve statistice

"Nebo je snad délka čáry 1,5 násobek kvartilového rozpětí (hodní - dolní kvartil)."
Ano. Nejmenší hodnota je spodní hrana tmavého čtverce, který má průhlednost 95% a ukazuje záporné hodnoty.
Já už vymyslel jak ty průměrné hodnoty (data) zobrazím pomocí teček nebo puntíků, ale musím si na to napsat VBA script.

Offline

 

Zápatí

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson