Extras din curs
Fenomenele si procesele economico-sociale sunt influentate de diferiti factori cu actiune concomitenta. Pentru a pune in evidenta masura in care unul sau mai multi factori sau chiar o combinatie de asemenea factori influenteaza in mod esential una dintre caracteristicile rezultative se foloseste analiza dispersionala.
Analiza dispersionala, cunoscuta si sub numele de analiza de varianta (Anova), a fost introdusa de statisticianul R. A. Fisher. Prin aceasta metoda se verifica masura in care valorile reale ale unei caracteristici se abat de la valorile teoretice, calculate de regula sub forma de marimi medii sau ecuatii de regresie, precum si masura in care aceste variatii sunt dependente sau nu de factorul de grupare.
Pe baza interpretarii logice a variatiei celor doua sau mai multe variabile luate in studiu se constata ca se pot stabili relatii ca de la cauza la efect; atunci, prin analiza dispersionala trebuie sa se verifice dependenta variabilei rezultative (y) de factorul (factorii) de grupare si atunci ea este considerata ca o metoda auxiliara utilizata inainte si dupa aplicarea metodelor corelatiei si regresiei statistice. Daca insa trebuie verificata independenta variabilei rezultative de o variabila de sistematizare a datelor, atunci analiza dispersionala este considerata ca o metoda independenta, cu rezultate finale.
Analiza dispersionala are la baza metoda gruparii. Prin aceasta se separa influenta asupra caracteristicii rezultative, a factorilor inregistrati ca esentiali (determinanti) de influenta factorilor intamplatori (accidentali).
In functie de numarul factorilor (unu, doi sau mai multi) care exercita o influenta asupra variatiei caracteristicii rezultative, avem modele de analiza dispersionala unifactoriala, bifactoriala sau multifactoriala.
Modelul de analiza dispersionala are la baza ipoteza ca mediile conditionate de factorul de grupare yi reprezinta valorile tipice care se formeaza la nivelul fiecarei grupe, in timp ce media generala y este valoarea tipica pentru intreaga colectivitate. Masura in care valorile individuale se abat de la aceste valori tipice reprezinta rezultatul modului de asociere a factorilor care determina variatia caracteristicii y.
Se stie ca dispersia teoretica (generala) so se poate estima cu ajutorul functiei de selectie:
1/(n-1)S(yij-y) = s ,
s fiind, in acest caz, un estimator nedeplasat al dispersiei teoretice so.
Ideea de baza a analizei dispersionale consta in impartirea acestei sume de patrate intr-un anumit numar de componente, fiecare componenta corespunzand unei surse reale sau ipotetice de variatie a mediilor.
Ipoteza nula pe care urmeaza sa o discutam la analiza dispersionala este legata de egalitatea mediilor:
Ho : m1=m2=...=mi=...mr ,
cu alternativa:
H1 cel putin doua medii difera intre ele.
Mediile teoretice mi se estimeaza cu ajutorul mediilor de grupa empirice sau de selectie simbolizate in continuare yi, adica:
Ho : y1=y2=...=yi=...=yr .
Testul sau criteriul egalitatii celor r medii sau selectii are la baza presupunerea ca dispersiile de selectie s1 , s2 , sr sunt omogene, adica sunt estimatii ale uneia si aceleiasi dispersii generale.
De aceea, ori de cate ori exista dubii in legatira cu omogenitatea celor r dispersii, se trece la verificarea egalitatii lor folosind testele l , Cochran si altele.
Modelul de analiza dispersionala unifactoriala
Consideram ca datele de observatie au fost repartizate in r grupe, iar fiecare grupa contine n variabile care urmeaza o distributie normala.
Grupa Valorile caracteristicii rezultative Media grupei
unde: 1<i<r, 1<j<ni.
Rezulta ca media grupei i este:
yi = 1/niSyij ,
iar media tuturor valorilor yij este data de relatia:
y = 1/nSyij = 1/nS yini ,
unde: n=Sni.
Suma abaterilor de la media aritmetica S(yij-y) se poate scrie astfel:
S(yij-y) = S[(yij-yi)+(yi-y)] = S[(yij-yi)+S(yi-yi)(yi-y)+2S(yij-yi)(yi-y)]
insumand in raport cu j, rezulta:
Preview document
Conținut arhivă zip
- Analiza Dispersionala.doc