Extras din proiect
I. Scurtă introducere teoretică
Modelul de regresie multiplă este folosit pentru a a descrie relaţia dintre mai multe variabile (cel puţin trei), dintre care una este considerată dependentă şi celelalte explicative. Ceea ce investighează în mod specific analiza de regresie este modul în care variaţia unui set de variabile influienţează variaţia altor variabile, scopul analizei fiind de a dezvălui forma şi intensitatea relaţiilor multiple dintre variabile şi de a le interpreta intr-o manieră substanţială .Astfel, considerând Y un fenomen care trebuie explicat, iar X1, X2, ..... factorii explicativi potenţiali (variabile independente), prin intermediul procedurii de regresie multiplă putem răspunde la mai multe întrebări :care este efectul independent la fiecărui Xi asupra lui Y? Care este iererhia importanţei variabilelor X1, X2,.... în explicarea lui Y? Cât la sută din varianţa lui Y este explicată de variaţia variabilelor Xi? În ce măsură variabilele independente sunt semnificativ diferite de zero în explicaţia variabilei dependente?În ce măsură putem generaliza rezultatele la nivelul întregii populaţii? Răspunsurile la aceste întrebări sunt obţinute printr-o modelare matematică a fenomenului care testează legătrura dintre variabila dependentă şi cele independentă. Astfel, se porneşte de la următoarea relaţie în populaţie:
Y= α+ β1 X 1+β2 X 2+.....+βi Xi+U
Ceea ce se obţine printr-o procedură de regresie multiplă este o estimare a parametriilor α, β1,β2,………βi cu ajutorul unor statistici a, b1, b2,……bi ,ecuaţia devenind:
Y*= a+ b1 X 1+b2 X 2+.....+bi Xi+U
Astfel, coeficientul b1, b2,...bi , numit pantă asociată variabilei X1, X2,.....Xi reprezintă numărul de unităţi cu care variază Y* atunci când X1 sau X2 sau Xi variază cu o unitate iar celelalte variabile independente sunt menţinute constatnte. În ceea ce priveşte sensul variabilei U, se poate spune că reprezintă partea pur aleatoare a lui Y* care nu este explucată de variaţia variabilelor independente, înglobând pe de o parte o eroare de măsură în evaluarea variabilei Y* şi pe de altă parte o variabilitate intrinsecă totdeauna prezentă în fenomenele sociale .
II. Aplicarea modelului de regresie multiplă
Problema (Laboratorul 22, problema 1)
1. Folosiţi regresia liniară pentru a prezice nivelul de educaţia al unei persoane (variabila educ) pe baza nivelului de educaţie al tatălui (variabila paeduc) si a numărului orelor destinate urmăririi programele de televiziune pe zi (variabila tvhours). Salvaţi reziduurile studentizate, valorile prezise nestandardizate şi modificările coeficienţilor de regresie când un caz este eliminat din analiză.
a. Scrieţi ecuaţia dreptei de regresie.
b. Se poate respinge ipoteza nulă că în populaţie toate valorile coeficienţilor de regresie sunt 0 ? Justificaţi afirmaţia.
c. Se poate respinge ipoteza nulă că în populaţie proporţia variaţiei în varia¬bila dependentă explicată de variabilele independente este 0 ? Pe eşantion, ce proporţie din variaţia educaţiei persoanei este explictă de cele două variabile independente ?
d. Se poate respinge ipoteza nulă că nu există o relaţie liniară între nivelul de educaţie al persoanei, nivelul de educaţie al tatălui ei şi numărul orelor destinate urmăririi programelor de televiziune pe zi ? Justificaţi afirmaţia.
e. Se poate respinge ipoteza nulă că în populaţie coeficientul parţial de regresie pentru nivelul de educaţie al tatăui este 0 ?
f. Se poate respinge ipoteza nulă că în populaţie coeficientul parţial de regre¬sie pentru orele destinate zilnic urmăririi programelor de televiziune este 0 ?
g. Preziceţi numărul anilor de educaţie ai unei persoane a cărui tată are 14 ani de şcoală şi care urmăreşte zinic timp de 3 ore emisiunile de la televizor.
h. Valoarea prezisă a nivelului de educaţie al persoanei creşte sau descreşte când orele zilnice destinate programelor de televiziune creşte ? Dar atunci când creşte nivelul de educaţie al tatălui persoanei ?
i. Cu cât se modifică valoarea prezisă a nivelului de educaţie al persoanei când nivelul de educaţie al tatălui creşte cu un an, iar numărul orelor zinice afectat urmăririi progamelor de televiziune rămâne constant ?
Preview document
Conținut arhivă zip
- Regresia Liniara Multipla.doc