Analiza componentelor principale

Referat
7/10 (1 vot)
Domeniu: Statistică
Conține 1 fișier: ppt
Pagini : 9 în total
Mărime: 88.71KB (arhivat)
Publicat de: Lore D.
Puncte necesare: 6

Extras din referat

Analiza componentelor principale (PCA – Principal Component Analysis) face parte din categoria tehnicilor multivariate care permit reducerea dimensiunii datelor.

În termeni matematici, analiza pe componente principale (ACP) asigură transformarea unui set de date corelate din spaţiul cu p dimensiuni, într-un set de date necorelate în spaţiul cu q dimensiuni (q≤p).

Variabilele necorelate, numite componente principale, constituie combinaţii liniare ale mărimilor originale corelate (variabile initiale).

În felul acesta, ACP reprezintă un procedeu simplu pentru procesarea, compresia şi vizualizarea datelor.

Altfel spus, ACP permite micşorarea dimensiunii datelor în vederea unei descrieri compacte şi optimale a acestora.

Trei moduri de prezentare, în funcţie de contribuţiile în timp la dezvoltarea ei:

K. Pearson (1901) a considerat inerţia ca fiind criteriul de identificare a componentelor principale.

Inerţia totală este suma varianţelor celor p variabile. În cazul datelor centrate şi reduse, inerţia totală este egală cu p. Se proiectează norul de puncte al indivizilor pe un subspaţiu de dimensiune fixă, trecând prin origine (punctul mediu, centrul de greutate, ale cărui coordonate sunt mediile fiecărei variabile).

Căutarea variabilor care maximizează criteriile de dipersie sau de corelaţie.

Harold Hoteling - căutarea combinaţiilor liniare de varianţă maximă a celor p variabile iniţiale. Vectorii care cuprind cei p coeficienţi ai combinaţiilor liniare, sunt factorii principali, sunt vectorii proprii ai matricei de corelaţie R, (descrescător după valorile lor proprii). Aceste combinaţii se numesc componente principale. Suma primelor k valori proprii este egală cu inerţia norului proiectat pe subspaţiul de dimensiune k.

De la p variabile cantitative, se caută noi variabile notate Fk , necorelate între ele, dar cât mai corelate cu cele p variabile iniţiale în sensul că:

max .

Conținut arhivă zip

  • Analiza Componentelor Principale.ppt

Alții au mai descărcat și

Analiza statistică a seriilor cronologice

DEFINITIE: SERIA CRONOLOGICA este un sir ordonat de valori ale unei variabile aferente unor momente sau perioade de timp succesive. Exista...

Cercetare Asupra Vopselei Lavabile Superweiss

Düfa ROMÂNIA SRL este una dintre cele mai dinamice companii ce opereaza pe piata de lacuri si vopsele din România. Compania a fost fondata în anul...

Program de Reabilitare

Spitalul de Boli Infectioase „Sf.Cuvioasa Parascheva „ este situat in partea de nord a orasului Galati pe strada Traian nr.393 ,în cartierul numit...

Centralizarea și Analiza Datelor

Q1+Q2. La aceste intrebari filtru, nici unul dintre cei 1000 de respondenti nu a fost eliminat Valoarea modala (Mo – cea mai mare frecventa de...

Statistică Economică

Obiectul principal în evolutia repartitiei bidimensionale îl reprezinta determinarea legaturii statistice dintre aceste doua variabile. În orice...

Te-ar putea interesa și

Analiza Datelor

I. Analiza componentelor principale 1.1. Standardizarea datelor 1.2. Matricea de corelaţie 1.3. Vectorii şi valorile proprii 1.4. Reprezentarea...

Analiza Componentelor Principale - Studiu de caz - legătura dintre forța de muncă, prețuri și cercetare-dezvoltare și inovație

Introducere Analiza în componente principale (ACP) este cea mai utilizată metodă de analiză a datelor. A fost propusă de Hotteling în 1938, dar...

Analiza multidimensională a datelor

I.Descrierea datelor Analiza datelor are ca obiectiv principal extragerea informatiei relevante , semnificative care este continuta in informatia...

Analiza Datelor - Proiect SAS

Introducere In cele ce urmeaza am realizat o canaliza a ofertei de autoturisme a unui dealer. Scopul final este acela de a stabili care sunt...

Analiza componentelor principale (ACP)

Descrierea datelor Proiectul își propune să analizeze un eșantion de dimensiune n=42, ce reprezintă județele României, datele fiind culese de pe...

Analiza Ofertei de Credite și Prelucrarea Datelor în SPSS

Considerente generale: Prognozele legate de volumul creditelor în 2008 au fost modificate pe parcursul anului. Evoluţia rapidă a creditului în...

Statistici descriptive și analiza componentelor principale în cadrul pieței forței de muncă

1. Obiectivul analizei Realizarea acestui proiect are în vedere analiza dezvoltării forței de muncă în diferite țări ale lumii. Analiza pieței...

Analiza componentelor principale

Obiectivele acestui studiu sunt: - compararea unui număr de 25 de firme ce activează pe piaţa bunurilor de consum şi servicii după anumite...

Ai nevoie de altceva?