Analiza multidimensională a datelor

Proiect
8.7/10 (3 voturi)
Domeniu: Calculatoare
Conține 1 fișier: doc
Pagini : 20 în total
Cuvinte : 3364
Mărime: 370.79KB (arhivat)
Publicat de: Nelu Nechifor
Puncte necesare: 9
Academia de Studii Economice

Cuprins

  1. I.Descrierea datelor
  2. II.Analiza componentelor principale
  3. III.Analiza factoriala
  4. IV.Metode nesupervizare de recunoastere a formelor
  5. A. Clusterizare prin metoda Ward
  6. B. Algoritmul de partitionare K-means
  7. V.Metode de recunoastere a fomelor supervizate.Analiza discriminanta
  8. VI.Concluzii

Extras din proiect

I.Descrierea datelor

Analiza datelor are ca obiectiv principal extragerea informatiei relevante , semnificative care este continuta in informatia primara, in date.Aceasta informatie este utilizata in continuare in interpretare, testatare, estimare, predictie fenomenelor economico-sociale sau financiare.

Datele pentru acest studiu sunt preluate de pe site-ul http://www.sci.usq.edu.au/staff/dunn/Datasets/applications/popular/countries.html si furnizeaza informatii despre 38 de tari cu privire la urmatoarele variabile :

Suprafata-masurata in km patrati

Irigatii-suprafata irigata in km patrati

Pop-populatia tarii respective in milioane

Pers14-populatia care are sub 14 ani in milioane

SV-speranta de viata la nastere

Alfabet-gradul de alfabetizare

Someri-rata somajului

ISP-Internet Service Provider la un milion de persoane

TVS-numarul televizoarelor pe persoana

Caleferata-lungimea caiilor ferate in km

Aeroporturi-numarul de aeroporturi din tara respectiva

Aceste date sunt utile pentru modelarea unor fenomene economico-sociale, asupra carora vom aplica diverse tehnici de analiza multidimensioanala in scopul reducerii numarului de variabile, pentru determinarea unor cauze , a unor factori latenti care influentaza aceste date, a stabilirii cauzalitatii si legaturilor intre ele.De asemenea vom incerca sa le grupam , in functie de anumite variabile care o au putere de discriminare mai mare, sa determinam anumite clase de apartenenta pentru fiecare dintre variabile prin intemediul tehnicii de recunoastere a formelor nesupervizata, de determinarea unor functii de clasificare si in cele din urma de testarea calitatii acestor indicatori .

I.Analiza componentelor principale

Aceasta tehnica are ca scop determinarea unor noi variabile numite componente principale si exprimate sub forma combinatiilor liniare de varibile originale astfel incat aceste noi combinatii sa aiba o variabilitate maxima, ceea ce se traduce prin faptul ca ele vor aduce un maxim de informatie posibila, fara sa existe informatie redundanta.

Astfel in loc de 13 variabile originale vom incerca sa obtinem un nr mai mic (de regula 2-4) de noi variabile construite in asa fel incat ele sunt necorelate intre ele 2 cate 3 si suma patratelor coeficientilor este egala cu unitatea .

Privite din punct de vedere geometric, componentele principale definesc un nou spatiu al obiectelor in care axele sunt componentele principale iar valorile sunt coordonatele acestor in spatiu numite si scoruri.

Pe langa celelalte proprietati noile componente au si proprietatea ca suma variantelor este egala cu suma variantelor variabilelor originale.

Inainte de a face aceasta analiza este de preferat ca variabilele sa fie standardizate

proc distance data =work.prog method = euclid outsdz = work.fis;

var ratio ( suprafata irigatii Pop Pers14 SV Alfabet Someri ISP TVS Caleferata Aeroporturi/std=std);

run;

Determinam matricea de corelatie a indicatorilor si observam cuplurile de variabile puternic corelate care in cazul variabilelor standardizate este aceeasi cu matricea de covarianta.Aceasta ne va ajuta sa stabilim in continuare numarul de componente pricipale necesare, care mai pot fi privite si ca un numar de grupe de variabile puternic corelate intre ele.

proc princomp data=work.fis cov out=Scoruri n=11 outstat=rez_ACP;

var suprafata irigatii Pop Pers14 SV Alfabet Someri ISP TVS Caleferata Aeroporturi;

title 'rezultate Analiza Componentelor Principale';

run;

Preview document

Analiza multidimensională a datelor - Pagina 1
Analiza multidimensională a datelor - Pagina 2
Analiza multidimensională a datelor - Pagina 3
Analiza multidimensională a datelor - Pagina 4
Analiza multidimensională a datelor - Pagina 5
Analiza multidimensională a datelor - Pagina 6
Analiza multidimensională a datelor - Pagina 7
Analiza multidimensională a datelor - Pagina 8
Analiza multidimensională a datelor - Pagina 9
Analiza multidimensională a datelor - Pagina 10
Analiza multidimensională a datelor - Pagina 11
Analiza multidimensională a datelor - Pagina 12
Analiza multidimensională a datelor - Pagina 13
Analiza multidimensională a datelor - Pagina 14
Analiza multidimensională a datelor - Pagina 15
Analiza multidimensională a datelor - Pagina 16
Analiza multidimensională a datelor - Pagina 17
Analiza multidimensională a datelor - Pagina 18
Analiza multidimensională a datelor - Pagina 19
Analiza multidimensională a datelor - Pagina 20

Conținut arhivă zip

  • Analiza Multidimensionala a Datelor.doc

Alții au mai descărcat și

Arhitectura calculatoarelor - Intel vs AMD

Rezultatele din testul 3DS Max 7 SPECapc Test Testul alaturat consta in crearea modelelor 3D, modificarea si randarea scripturilor. Conform...

Autentificarea prin semnătură digitală

Introducere O semnatura digitala reprezinta o informatie care il identifica pe expeditorul unui document. Semnatura digitala este creata prin...

Sistem de Prognosticare a Unei Avarii

Acest sistem calculeaza gradul de avariere a unei cladiri în cazul unui cutremur, precum si posibila necesitate a reconstructiei cladirii (partiala...

Managenmentul și Proiectarea Sistemelor Informatice

1.1.Sisteme, sistemul informational si abordarea sistemica V.M. Gluseav spune ca, expresia neuniformitatii distributiei substantei si energiei în...

Te-ar putea interesa și

Modelarea aplicațiilor financiar contabile

SISTEME INFORMAŢIONALE FINANCIAR-CONTABILE Modelarea aplicaţiilor financiar-contabile utilizând tehnici moderne de programare 1.1. Structura...

Stocarea Datelor în Baze de Date

Activitatea umană include o mulţime de activităţi desfăşurate pentru a satisface diverse necesităţi, fie ele de natură materială sau spirituală....

Sisteme Informatice pentru Asistarea Deciziei

Sistemul informational cuprinde ansamblul mijloacelor si procedurilor de preluare, clasare, stocare, prelucrare, transmitere si valorificare a...

Impactul Metodei ABC în Practicarea Gestiunii Costurilor. Studiu Privind Aplicarea Metodei

I. Introducere Schimbarile survenite in mediul economic, modernizarea tehnologiei (automatizare si robotizare), nevoia de informatii pertinente in...

Analiza multidimensională a datelor

Pentru exemplificarea acestui algoritm vom presupune că managerul unei firme de transport doreşte să afle cum sunt grupate autoturismele pe piaţă,...

Analiza multidimensională a datelor

1. Analiza corespondențelor Scopul acestei analize este de a descrie legăturile dintre două variabile, respectiv de a studia simultan liniile și...

Analiza Multidimensională a Datelor

Analiza Cluster În cele ce urmează am încercat o clasificare a variabilelor pe clase utilizând o metodă neierarhică de clasificare, respectiv...

Soluții Business Intelligence pentru Managementul Modern al Organizațiilor

Introducere Sistemele Business Intelligence au un impact puternic asupra calităţii deciziilor strategice prin reducerea timpului necesar pentru a...

Ai nevoie de altceva?