Analiza Cluster - Gruparea Cazurilor sau a Variabilelor

Proiect
8/10 (1 vot)
Domeniu: Economie
Conține 1 fișier: ppt
Pagini : 33 în total
Mărime: 184.24KB (arhivat)
Publicat de: Teea Demeter
Puncte necesare: 8
Profesor îndrumător / Prezentat Profesorului: D. Roman
Proiectul Statistica economica a fost prezentat in FSEGA, UBB CLuj, nota 10.

Extras din proiect

Definitii-

Cluster: o colectie de obiecte

Similare intre ele

Nesimilare obiectelor din alte clustere

Analiza cluster:

Gruparea unei multimi de obiecte in clustere

Se bazeaza pe instruire nesupervizata (nu exista

clase predefinite)

Valorificare:

Metoda autonoma pentru caracterizare date

Etapa de preprocesare pentru alte prelucrari

Când utilizăm această metodă?

Avem un set de date şi vrem să ştim cum anume se grupează cazurile sau variabilele

de ex. vrem sa ştim cum anume se grupează oraşele Romaniei în funcţie de cateva variabile demografice (mortalitate infantilă, natalitate, speranţa de viată la naştere)

de ex. vrem să ştim ce variabile demografice au valori asemănătoare pentru cazurile cu care lucrăm

Specificul acestei metode

Dorim să detectăm clasele “NATURALE” în care itemii sau variabilele se plasează nu să creem noi o ordine în structura datelor

Clasele nu sunt date din punct de vedere statistic, precum se întâmplă în alte metode (de ex. analiza discriminantă), ci trebuie descoperite

Tipuri de analiză cluster

Metode non-ierarhice

cea mai cunoscută metoda de acest fel este k-means (metoda celor k-medii): se porneşte de la k valori (de obicei aleatoare) şi în functie de ele se construiesc clusterele

Metode ierarhice

aglomerative: se porneşte de la n clase (câte cazuri avem) şi se ajunge la o clasă care le cuprinde pe toate celălate anterioare ei

divizive: se porneşte de la o clasă şi se ajunge la n clase (câte cazuri avem) cuprinse în clasa de pornire

Algoritm ierarhic aglomerativ

Algoritm ierarhic aglomerativ

1. Calcularea distanţelor între itemi

2. Selectarea perechii de itemi care este cea mai apropiată şi unirea acelei perechii într-o clasă

3. Recalcularea distantelor faţă de celelte clase, itemi

4. Se reia punctul (2.) până când se obţine o singură clasă (cluster)

Calcularea distantelor- partea I

Calcularea distanţelor între itemi se poate face în mai multe moduri:

Euclidienă ( (xi-yi)2)1/2

Calcularea distantelor - partea II

Când calculăm distanţe între variabile folosim în general:

Corelaţia Pearson

Corelaţia între vectori

Nota: aceste distanţe se pot folosi si pentru gruparea cazurilor

Calcularea distantelor - un exemplu partea III

Conținut arhivă zip

  • Analiza Cluster - Gruparea Cazurilor sau a Variabilelor.ppt

Alții au mai descărcat și

Mediul extern al SC Agdesy SRL - oportunități și restricții

Analiza macro-mediului intreprinderii Studiul macro-mediului intreprinderii permite depasirea orizontului mediului concurential deoarece...

Întreprinderea în era globalizării

In era globalizarii, specialitii in domeniu vorbesc despre “intreprinderea digitala”, “intreprinderea virtuala” sau “intreprinderea mileniului...

România în ecuația integrării europene

Reforme institutionale si politice in U.E. inaintea procesului de largire. Actuala forma de organizare ce cuprinde 15 tari membre nu mai...

Te-ar putea interesa și

Spss Analiza Cluster

Obiective Până la finalul acestei ore ne propunem ca: - 90 % dintre colegi să fi înţeles descrierea conceptului de baza “Cluster Analysis” ; -...

Metode statistico-matematice pentru fundamentarea strategiei unei societăți comerciale

Cercetarea de marketing reprezinta un element important în caracterizarea gradului însusi de dezvoltare a marketingului. Cercetarea de marketing...

Strategia Unei Sococietati Comerciale

Introducere Televizoare cu ecrane cu plasma, aparatura digitala de ultima ora, aparate de aer conditionat performante, masini de spalat...

Recunoaștere Nesupervizată a Formelor

PROIECT 2: Aplicaţie numerică la una dintre următoarele doua teme: Analiza Cluster (Recunoaştere Nesupervizată a Formelor) sau Analiza...

Analiza multidimensională a datelor

Pentru exemplificarea acestui algoritm vom presupune că managerul unei firme de transport doreşte să afle cum sunt grupate autoturismele pe piaţă,...

Data mining

Scurt istoric al OLAP Bazele de date nu sunt un domeniu foarte atractiv. Desi afacerile in acest domeniu sunt impresionante, iar aplicatiile care...

Analiza Multidimensională a Datelor

Analiza Cluster În cele ce urmează am încercat o clasificare a variabilelor pe clase utilizând o metodă neierarhică de clasificare, respectiv...

Metode Cantitative în MRU - Analiza Cluster

Capitolul 1. Descrierea bazei de date. Provenienţa bazei de date Baza de date pe care am utilizat-o în acest proiect a fost creată ca rezultat al...

Ai nevoie de altceva?