Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
Zdravím,
potýkám se s problémem pro vytvoření tabulky, na níž může být použit chí-kvadrát test. Konkrétně mám za úkol v rámci sériové komunikace analyzovat závislost rychlosti příjmu na parametrech, jako je parita, řízení toku apod. Jsem si vědom toho, že při použití chí-kvadrát testu je nutné zjistit četnosti, které musí být nějak kategoricky rozděleny, avšak to pro mě právě představuje problém. Co je v případě analýzy sériové komunikace vhodné zvolit jako tu "podmínku"?
Např. v nějakém vzorovém příkladu, kde by se zjišťovala závislost vystudované školy na úspěšnosti u přijímacích zkoušek by bylo v prvním sloupci např. SOŠ, SOU a gymnázium a v prvním řádku naopak, zdali zkoušku složil úspěšně, pouze složil či neuspěl. Zde mi dochází, že na místě toho sloupce by byla ta právě zkoumaná proměnná, např. bez parity a sudá parita, avšak co bych měl uvést do onoho prvního řádku? Napadlo mě pouze uvést jistou hranici, tudíž by tam bylo např. že rychlost příjmu překročila či nepřekročila danou hranici rychlosti, třeba 20 000 b/s, avšak nevím, zdali by toto bylo nejvhodnější.
Zde vkládám krátký úryvek získané tabulky při měření. Barevně označené buňky reprezentují měřenou hodnotu, avšak rozdílné barvy pouze sloužily jako pomůcka při orientaci v měření - na samotný výpočet vliv nemají. Důvod, proč je v každé buňce napsáno více získaných hodnot je z toho důvodu, abych zjistil tendenci kolísání rychlosti příjmu v dané situaci. Při výpočtu budu samozřejmě pracovat s poslední naměřenou hodnotou. https://cdn.discordapp.com/attachments/ … 27366&
Pro další přiblížení byly kombinace následující: linková rychlost mohla nabývat hodnot 2 400, 19 200, 57 600, 115 200 (vše v b/s); parita mohla být buď vypnuta či nastavena na sudou; řízení toku mohlo být buď vypnuté či nastavené na hardwarové (nerozlišovalo se mezi variantami DTR/DSR a RTS/CTS); použité protokoly mohly být XMODEM, ZMODEM, YMODEM a KERMIT; soubory mohly reprezentovat buď binární 1, binární 0 či náhodné kombinace; a nakonec použitý kabel mohl býti buď krátký či s připojenou prodlužkou.
Předem velice děkuji.
Offline
chi kvadrat test pracuje vylucne s kategorickymi premennymi
myslim ze vsetky parametre co ste opisali su kategoricke, problematicky je asy len ten hlavny "rychlost"
da sa zmenit na kategoricku premennu takto: povedzme, ze mozne rychosti su z intervalu [a,b] tak si ten interval nasekate na niekolko podintervalov, len sa musite rozhodnut na kolko.
kvoli presnosti by sme chceli cim viac, ale na druhu stranu treba dbat na to aby v kazdej kategorii bolo dost merani inak chi kvadrat test nefunguje dobre co zase tlaci idealny pocet kategorii dole
su aj uplne ine pristupy, napr linearna regresia vie mat napr spojite hodnoty a mix spojitych a kategorickych prediktorov. ale ona nevypoveda o "zavislosti/nezavislosti" ale skor o "linearnej zavislosti/nezavislosti"
snad niekto zbehlejsi v statistike da aj nejaku praktickejsiu radu. odporucam aby ste povedali na co to potrebujete. konkretne je to nejake skolske zadanie, resp. bakalarka, alebo sa to objavilo normalne v praxi? totizto v skolskom zadani nema zmysel rozmyslat nad alternativnymi pristupmi, v praxi zase ano.
Offline
↑ Brano: Děkuji za nápad, zkusím tento přístup použít. Jen mi přijde, že takovéto stanovení intervalů by mohlo výsledky závislosti či nezávislosti v jistém smyslu zkreslit a bohužel nevím, zdali budu mít v rámci výpočtů k dispozici tolik četností, neboť kdybych např. při analýze závislosti na paritě započetl do empirických četností i měření např. se zapnutým řízením toku, tak by to také asi neposkytlo úplně objektivní výsledek, ale výrazně by to navýšilo četnosti pro lepší výpočet.
Jedná se pouze o školní praktickou úlohu, avšak právě chí-kvadrát test nám byl pro zpracování výsledků doporučen, byť tedy můžeme použít i jiné statistické metody, avšak zrovna tato mi přijde taková nejjednodušší na uchopení na středoškolské úrovni.
Offline