Extras din proiect
Partea I: analiza dispersională ANOVA
Potrivit Institutului Naţional de Statistică, în România, în perioada 1990-2006 s-a recoltat un volum de 139668,7 mc de lemn. http://www.insse.ro/ cms/rw/pages/statRegionale.ro.do Grupăm setul de date după tipul de lemn recoltat şi aplicăm ANOVA pentru a vedea dacă există diferenţe semnificative între volumul de lemn recoltat în medie din cele 5 categorii.
Ipotezele:
H0: µ1 = µ2 = µ3 = µ4 = µ5 ;
H1: cel puţin două medii sunt diferite.
Volum de lemn recoltat în România 1990-2006
Răşinoase Fag Stejar Diverse specii tari Diverse specii moi
5813,4 4957,8 2045,4 2070,7 1761,7
4973,1 4214,7 1550,5 1774,4 1300
5346,1 4508,4 1333 1731 1366,2
4915,3 4260,1 1287,8 1673,3 1273,8
7165,6 4439,2 1494,8 1805,2 1478,3
7139 4747,7 1531,6 1823 1450,2
6356,6 5412 1694,4 2030,5 1588,6
6060,5 4794,2 1586,1 1852,1 1378,4
5765 4997,2 1632,2 1914,6 1375
Folosind Excel se obţin rezultatele:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Răşinoase 9 53535 5948,2889 688928,66
Fag 9 42331 4703,4778 150816,01
Stejar 9 14156 1572,8667 48606,287
Diverse specii tari 9 16675 1852,7556 17404,158
Diverse specii moi 9 12972 1441,3556 23476,96
În tabelul SUMARY sunt trecute date despre cele 5 populaţii:
- Numărul de unităţi din fiecare populaţie: 9;
- Volumul total de lemn recoltat în perioada 1990-2006 pentru fiecare populaţie;
- Volumul mediu de lemn recoltat în fiecare an pentru fiecare populaţie;
- Dispersia populaţiilor.
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 155904090 4 38976022 209,72168 3E-26 2,606
Within Groups 7433856,59 40 185846,41
Total 163337946 44
În tabelul ANOVA este calculată statistica F:
Putem afirma cu o probabilitate de 95 % ca tipul de lemn are o influenţă semnificativa asupra volumului de lemn recoltat, deoarece statistica calculată F=209,72168 este mult mai mare decât Fcritic=2,606. Mai mult decât atât, P-value=3*10-26 ne garantează rezultatele până la o probabilitate de (1 – 3 * 10 – 26 ) * 100.
Aşadar se respinge ipoteza nulă conform căreia mediile populaţiilor sunt egale şi se acceptă ipoteza alternativă conform căreia cel puţin două medii sunt semnificativ diferite.
Partea II: modele econometrice de regresie unifactorială
Pentru un set de 17 valori, reprezentând numărul de cinematografe din România din anii 1990-2006 şi numărul de spectatori din aceeaşi perioadă (http://www.insse.ro/cms/files/pdf/ro/cap9.pdf), se va testa dacă există o legătură liniară simplă între cele două variabile. Datele de intrare sunt:
Ani Cinematografe Spectatori (mii)
1990 4637 130144
1991 3222 67444
1992 1771 46086
1993 1470 33720
1994 713 25915
1995 626 17007
1996 484 12639
1997 468 9422
1998 313 6834
1999 321 4196
2000 279 4450
2001 264 5728
2002 230 5317
2003 191 4527
2004 151 4002
2005 85 2830
2006 73 2777
Considerăm X, variabila independentă numărul de cinematografe şi Y, variabila dependentă numărul de spectatori. Propunem următorul model: Y= a + b*X căruia îi vom testa validitatea folosind Reggression din Excel. Obţinem următorul rezultat:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0,986836265
R Square 0,973845813
Adjusted R Square 0,972102201
Standard Error 5527,569203
Observations 17
Preview document
Conținut arhivă zip
- Proiect Econometrie - Anova, Regresie Unifactoriala, Serii Cronologice.doc