Cuprins
- Introducere 3
- 1. Definirea datelor . 3
- 2. Analiza variabilității datelor ... 5
- 2.1 Analiza matricei de corelație 5
- 2.2 Analiza valorilor proprii. Varianta componentelor principale . 6
- 3. Calculul corelatiilor dintre variabilele observate si componentele principale ... 7
- 4. Calculul scorurilor .. 9
- 5. Valorile cosinus .. 11
- 6. Contributia instantelor la varianta componentelor . 11
- 7. Comunalitățile ... 12
Extras din proiect
Introducere
Analiza în componente principale (ACP) este cea mai utilizată metodă de analiză a datelor. A fost propusă de Hotteling în 1938, dar necesitând numeroase și laborioase calcule s-a impus în practică abia începând cu anii 70 odată cu apariția calculatoarelor. ACP sintetizează informația conținută în tabelele de date cantitative de mari dimensiuni, cu un mare număr de instanțe și de variabile. O colectivitate statistică descrisă printr-un număr mare de variabile este greu de studiat.
ACP determină un număr mai mic de variabile noi, numite componente principale, care concentrează informația, variabilitatea existentă la nivelul colectivității studiate. Componentele principale sunt construite sub formă de combinație liniară de variabile inițiale, care concentrează o cât mai mare parte din varianță. Astfel, prima componentă principală preia maximul din varianța variabilelor originale, a doua componentă preia maximul de varianță rămasă, neexplicată de prima componentă principală, a treia componentă preia maximul din varianța rămasă, neexplicată de primele două componente, șamd.
ACP se utilizează ca instrument de analiză statistică în multe domenii de activitate, inclusiv în recunoașterea formelor sau în scalarea multidimensională din grafică. În recunoașterea de forme, prin ACM se asigură selectarea caracteristicilor esențiale, semnificative ale formelor analizate, caracteristici care asigură puterea cea mai mare de discriminare. În grafică se asigură reprezentarea în 2D sau 3D a unor obiecte aflate in spații multidimensionale .
1. Definirea datelor
Avem un set de 10 indicatori prezentati in tabelul 1, avand fiecare un set de 30 de observatii. Obiectele au fost preluate de pe http://epp.eurostat.ec.europa.eu și reprezintă 30 de țări de pe continentul European. Acestea sunt caracterizate de următorul set de variabile luate pentru anul 2016.
Datele prelucrate sunt preluate dintr-un fișier text de tip csv anexate proiectului, DateTari.csv
Preview document
Conținut arhivă zip
- .idea
- encodings.xml
- misc.xml
- modules.xml
- ProiectADIonut.iml
- workspace.xml
- ACP
- __pycache__
- ACP.cpython-37.pyc
- ACP.cpython-38.pyc
- __init__.cpython-37.pyc
- __init__.cpython-38.pyc
- ACP.py
- __init__.py
- ACP-Results
- C.csv
- Contributii.csv
- Cosinus.csv
- Eigen_Vects.csv
- R.csv
- R_fact.csv
- S.csv
- Varianta.csv
- classes
- __pycache__
- graphics.cpython-37.pyc
- graphics.cpython-38.pyc
- __init__.cpython-37.pyc
- __init__.cpython-38.pyc
- graphics.py
- __init__.py
- Date
- DateEFA.csv
- DateTari.csv
- tabelIndicatori.xlsx
- EFA-Results
- Fa_FactVar.csv
- Fa_Loadings.csv
- Fa_loadings_varimax.csv
- Scoruri_Factoriale.csv
- Scoruri_Factoriale_Rotatie.csv
- EFAutils
- __pycache__
- EFA.cpython-37.pyc
- EFA.cpython-38.pyc
- __init__.cpython-37.pyc
- __init__.cpython-38.pyc
- EFA.py
- __init__.py
- Screens
- EFA
- Cerc Coef Fact 1.3.png
- Cerc Coef Factoriali.png
- Coeficientii Factoriali.png
- Corelatie Factoriala Varimax.png
- Factorial Coeef Varimax 1.2.png
- Factorial Coeef Varimax 1.3.png
- KMO Indices.png
- Plot Scoruri Rotati 1.23.png
- Plot Scoruri1.23.png
- PCA
- CerculCorelatiilor.png
- Corelatii Factoriale.png
- Corelograma Comunalitati.png
- PCA-Corelograma.png
- Plot Componente.png
- Plot Scoruri.png
- Valori-Proprii Varianta Comp.png
- Varianta-Excel.png
- DateEFA.png
- DateTariUe.png
- TabIndicatori.png
- .idea
- ACP_main.py
- Analiza Componentelor Principale - Studiu de caz - legatura dintre forta de munca, preturi si cercetare-dezvoltare si inovatie.docx
- EFA_main.py