Nevíte-li si rady s jakýmkoliv matematickým problémem, toto místo je pro vás jako dělané.
Nástěnka
❗22. 8. 2021 (L) Přecházíme zpět na doménu forum.matweb.cz!
❗04.11.2016 (Jel.) Čtete, prosím, před vložení dotazu, děkuji!
❗23.10.2013 (Jel.) Zkuste před zadáním dotazu použít některý z online-nástrojů, konzultovat použití můžete v sekci CAS.
Nejste přihlášen(a). Přihlásit
ahoj, mořím se teď s jednou vzorovou písemkou do statistiky a mám tu takovou otázku, můžete mi s tím prosím někdo pomoci? Mám nějaké svoje nápady, ale vůbec nevím, jestli je to dobře
Jaké důsledky by v lineárním regresním modelu LRM měly tyto „poruchy“ v předpokladech?
a) LMR by neobsahoval jako jednu z vysvětlujících proměnných jedničkový vektor?
b) Do regresní rovnice bychom zařadili „vysvětlující proměnnou“, která by byla zcela nekorelovaná s vysvětlovanou proměnnou? Jaký by byl dopad na koeficient determinace?
c) Náhodné složky regresní rovnice by měly místo normálního rozdělení chí-kvadrát rozdělení?
d) Směrodatné odchylky náhodně složky budou rovny pořadovému číslu příslušného pozorování?
e) V modelu s 5 vysvětlujícími proměnnými (včetně jedničkového vektoru jako první) bude čtvrtá vysvětlující proměnná přesným aritmetickým průměrem druhé a třetí vysvětlující proměnné a pátá vysvětlující proměnná bude mít všechna pozorování stejná s hodnotou 6?
f) „Náhodné“ složky lichých pozorování by měly hodnotu -1 a „náhodné“ složky sudých pozorování hodnoty +2. O jaké rozdělení by v tomto případě šlo? Jaká by byla střední hodnota náhodných složek, pokud by počet pozorování byl sudý?
Myslím si, že odpovědi jsou tyto:
a) pak by při nulových nezávislých proměnných byla nulová i závisle proměnná. Zcela by chyběla konstanta, která udává výši závisle proměnné, kdyby všechny nezávisle proměnné nabývali hodnoty 0.
b) taková proměnná by způsobila, že závislost mezi těmito proměnnými by byla velmi slabá či žádná. Model by tak nebyl dostatečně spolehlivý. Koeficient determinace by byl nižší než kdyby tato proměnná v modelu nebyla.
c) tohle fakt nevím??? ... že by odhad parametrů pomocí metody nejmenších čtverců měl taktéž rozdělení chí-kvadrát a testy statistických předpokladů by mohly být zavádějící??? Pro výpočet modelu by bylo nutné použít jiné metody než metodu nejmenších čtverců???
d) to je heteroskedasticita???
e) multikolinearita??? a s tou pátou proměnnou, že by bylo nejlepší ji z modelu "odstranit"?? nebo spíše přidat do vlivu úrovňové konstanty?
f) je to rovnoměrné rozdělení se střední hodnotou 0,5???
díííky moc, jestli tomu někdo rozumíte a uděláte si na mě chvilku čas :)
Offline
a) je pravda, že y(0)=0, ale to může mít i smysl. já bych za závažnější považoval třeba to, že koeficient determinace přestane mít smysl
b) koeficient determinace se zařazením další proměnný nikdy nesníží. ale můžou se zvýšit rozptyly odhadů, pokazí (zvýší) se odhad 
c) bodový odhady metodou nejmenších čtverců by byly správný, ale intervalový odhady ne, všelijaký testy hypotéz by nefungovaly
d) ano, to je heteroskedasticita
e) ano, to je multikolinearita
f) rovnoměrné rozdělení na množině .... střední hodnota 0,5 souhlasí
Offline
↑ Stýv:
Prosím o pomoc s podobnou úlohou - tedy Jaké důsledky by v LRM měly tyto poruchy v předpokladech:
a) do regresní rovnice bychom zařadili "vysvětlující proměnnou", která by byla rozdílem dvou vysvětlujících proměnných? Jaký by byl dopad na koeficient determinace?
b) Náhodné složky regresní rovnice by měly místo normálního Studentovo t-30 rozdělení?
c) Náhodné složky rr by měly místo normálního rovnoměrné SPOJITÉ rozdělení?
d) V modelu s 5 vysvětlujícími proměnnými (včetně jedničkového vektoru jako první) bude třetí vysvětlující proměnná přesným aritmetickým průměrem první a čtvrté vysvětlující proměnné a druhá vysvětlující proměnná bude mít všechna pozorování stejná s hodnotou 5?
e) Jedničkový vektor bychom nahradili jeho desetinásobkem (tj. vektorem desítek).
Předem moc děkuji za jakoukoliv pomoc s řešením.. Sára.
Offline