Extras din proiect
Introducere
În cadrul acestui proiect vom prezenta distribuția orașelor României după câțiva indicatori socio-economici, în anul 2016.
În prima parte a acestui proiect vom realiza analiza componentelor principale (ACP) cu ajutorul indicatorilor economici și orașele din România. Vom testa ipotezele de independență dintre variabile, vom alege numărul de axe factoriale și vor fi interpretate. De asemenea vom realiza analiza corelațiilor dintre variabile, vom identifica grupele de unități statistice care se aseamănă și care se deosebesc.
În a doua parte vom realiza analiza factorială a corespondențelor (AFC). Analiza factorială a corezondențelor va fi efectuată pe distribuția populației ocupate pe diferite domenii de activitate , pe regiuni ale României. Vom testa ipotezele de independență și vom lua o decizie. Vom descrie asocierile dintre categoriile celor două variabile, vom alege numărul de axe factoriale care vor fi interpretate, vom analiza contribuția punctelor la inerția unui ax și contribuția axului la inerția unui punct. De asemenea vom interpreta rezultatele punctelor linie și punctelor coloană.
Analiza componentelor principale
Distribuția orașelor din România după indicatori socio-economici , în anul 2016.
Descriptive Statistics
Mean Std. Deviation Analysis N
Rata_șomajului 5,6095 2,68626 42
Populația_activă 207,9952 171,46394 42
Emigranți 543,02 566,257 42
Imigranți 663,38 1416,026 42
Nr_mediu_salariați 113319,50 132793,259 42
Correlation Matrix
Rata_șomajului Populația_activă Emigranți Imigranți Nr_mediu_salariați
Correlation Rata_șomajului 1,000 -,376 -,342 ,080 -,411
Populația_activă -,376 1,000 ,941 ,508 ,992
Emigranți -,342 ,941 1,000 ,620 ,939
Imigranți ,080 ,508 ,620 1,000 ,487
Nr_mediu_salariați -,411 ,992 ,939 ,487 1,000
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. ,738
Bartlett's Test of Sphericity Approx. Chi-Square 280,639
df 10
Sig. ,000
Testarea ipotezelor de independență dintre variabile.
Formularea ipotezelor
H0: ipoteza de independență
H1: ipoteza de dependență
Decizia
Sig=0,000< α=0,05 , rezultă că se respinge ipoteza H0. Cu o probabilitatea de 95% putem garanta că există legătură între variabile, descrierea acestor legături are loc prin aplicarea ACP.
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared Loadings
Total % of Variance Cumulative % Total % of Variance Cumulative %
1 3,431 68,614 68,614 3,431 68,614 68,614
2 1,085 21,707 90,320 1,085 21,707 90,320
3 ,418 8,353 98,674
4 ,059 1,177 99,851
5 ,007 ,149 100,000
Extraction Method: Principal Component Analysis.
Varianța explicată de primul ax factorial este: 3,431/5=0,6861. Primul ax factorial explică 68,614% din varianța totală.
Varianța explicată de al doilea ax factorial este: 1,085/5=0,217. Al doilea ax factorial explică 21,707% din varianța totală.
Conform criteriului lui Benzecri, alegem să explicăm primele două axe factoriale deoarece explică 90,321% din varianța totală. Criteriul lui Kaiser ne permite să alegem tot primele două axe factoriale deoarece λ_1=3,431, λ_2=1,085 sunt mai mari ca 1 (λ_k>1).
Component Score Coefficient Matrix
Component
1 2
Rata_șomajului -,126 ,761
Populația_activă ,284 -,031
Emigranți ,284 ,060
Imigranți ,184 ,577
Nr_mediu_salariați ,284 -,068
Extraction Method: Principal Component Analysis.
Component Scores.
Component Matrixa
Component
1 2
Rata_șomajului -,431 ,826
Populația_activă ,973 -,034
Emigranți ,975 ,065
Imigranți ,633 ,627
Nr_mediu_salariați ,973 -,073
Extraction Method: Principal Component Analysis.
a. 2 components extracted.
Analiza corelațiilor dintre variabile.
Ecuația primului ax factorial
F1=-0,431* rata_șomajului+ 0,973* populație_activă+0,975* emigranți+0,633* imigranți + 0,973* nr_mediu_salariați
Preview document
Conținut arhivă zip
- Statistica multivariata.docx