Analiza cluster

Proiect
8/10 (1 vot)
Domeniu: Cibernetică
Conține 1 fișier: docx
Pagini : 23 în total
Cuvinte : 1611
Mărime: 1.31MB (arhivat)
Publicat de: Maria B.
Puncte necesare: 7
Facultatea de Cibernetica, Statistica si Informatica Economica
Academia de Studii Economice, Bucuresti

Cuprins

  1. Descrierea datelor: 3
  2. 1. Evaluarea distanțelor între indicatori 3
  3. a. Matricea distanțelor 3
  4. b. Cum a fost calculată distanța eculidiană dintre primele 2 obiecte? 3
  5. 2. Metode ierarhice 4
  6. 2.1. Metoda Ward 4
  7. 2.2. Alte metode de clusterizare ierarhică 8
  8. 2.2.1. Metoda agregarii simple 8
  9. 2.2.2. Metoda agregarii complete 9
  10. 2.2.3. Metoda agregarii medii 9
  11. 2.2.4. Metoda centroidului 10
  12. 3. Algoritmul K-mens. Compararea soluțiilor de clusterizare 10
  13. 3.1. Soluția obtinută 10
  14. 3.2. Evaluarea variabilitatii intraclasa si interclase 11
  15. 3.3. Evaluarea de discriminare a variabilelor 11
  16. 3.4. Compararea solutiilor de clusterizare 12
  17. 4. Recunoașterea supervizată a formelor 13
  18. 5. KNN 17
  19. ANEXE- Cod R 18

Extras din proiect

Descrierea datelor:

Detalii despre setul de date: 13 variabile, 101 de observații inițial, 69 de observații după

eliminarea outlyer-elor. Anul pentru care s-au analizat datele: 2019;

Sursa datelor: https://www.topfirme.com/caen/4773/cifra-de-afaceri/?pagina=3

Obiect de activitate al companiilor: comerțul cu amănuntul, în magazine specializare, al

produselor farmaceutice și medicale, al produselor ortopedice, produse cosmetice și de parfumerie.

1. Evaluarea distanțelor între indicatori

a. Matricea distanțelor

b. Cum a fost calculată distanța eculidiană dintre primele 2 obiecte?

Observăm că distanța euclidiană dintre primii 2 indicatori este de 10,37492 și are aceiași valoare ca cea din matricea distanțelor .

2. Metode ierarhice

2.1. Metoda Ward

a. Etapa clusterizării

Vedem etichetele de la fiecare etapa de clusterizare , cu

- (minus) avem observațiile, cu + (plus) avem clusterele deja formate, coloana 3 e distantța de agregare.

La etapa 1 de clasificare compania 55 cu 56 au format un cluster la distanta de agregare (comasare) 0.000.

La etapa 2 de clasificare compania 87 cu 96 au format un cluster la distanta de agregare (comasare) 0.058.

La etapa 9 de clasificare compania 82 s-a adaugat la clusterul 5 deja format la distanța de agregare 0.0986.

Observație: Distanțele de agregare sunt crescătoare de la o etapă de clusterizare la alta pt ca avem metoda ierarhică ascendentă.

Preview document

Analiza cluster - Pagina 1
Analiza cluster - Pagina 2
Analiza cluster - Pagina 3
Analiza cluster - Pagina 4
Analiza cluster - Pagina 5
Analiza cluster - Pagina 6
Analiza cluster - Pagina 7
Analiza cluster - Pagina 8
Analiza cluster - Pagina 9
Analiza cluster - Pagina 10
Analiza cluster - Pagina 11
Analiza cluster - Pagina 12
Analiza cluster - Pagina 13
Analiza cluster - Pagina 14

Conținut arhivă zip

  • Analiza cluster.docx

Alții au mai descărcat și

Tehnologia SSD-urilor

Un solid-state drive (expresie engleză cu traducerea liberă „unitate cu cipuri”; prescurtat SSD) este un dispozitiv de stocare a datelor care...

Cyber attacks - Analiza atacurilor informatice realizate prin e-mail

Abstract Datorită expansiunii internetului și a fluxului de date transmis online din ultimii ani, cele mai numeroase atacuri din secolul XX au...

Metoda Dijkstra

1) Fiecărui nod iÎV i s-a asociat o variabilă d(i) numită în continuare eticheta nodului i. Prin definiție d(s) = 0 . În oricare moment al...

România în mișcare

INTRODUCERE România în mișcare este un proiect care are scop evidențierea necesității sistemelor adaptive complexe în viața unui om. Având în...

BCE - Seminare 1-5

BCE Seminar 1 Sistemele dinamice discrete Clasificare: Un sistem dinamic discret este o secven.a de func.ii yt, care exprima valorile...

Proiectarea arhitecturii sistemelor informatice

Aspecte generale ale proiectării sistemelor informatice - Proiectarea sistemului informatic constă în stabilirea soluțiilor logice și specificarea...

Te-ar putea interesa și

Analiza Datelor

I. Introducere Cunoasterea stiintifica din orice domeniu de activitate umana presupune, indiferent de natura si specificul obiectivelor concrete...

Analiza Datelor

I. Analiza componentelor principale 1.1. Standardizarea datelor 1.2. Matricea de corelaţie 1.3. Vectorii şi valorile proprii 1.4. Reprezentarea...

Politici Regionale

CAPITOLUL 1 FUNDAMENTELE ECONOMIEI SPAŢIALE Ştiinţa regională, ca disciplină de sine stătătoare, nu are o istorie prea lungă deşi, ca excepţii,...

Spss Analiza Cluster

Obiective Până la finalul acestei ore ne propunem ca: - 90 % dintre colegi să fi înţeles descrierea conceptului de baza “Cluster Analysis” ; -...

Raport de Cercetare BRD

Rezumat Introductiv\aBRD Groupe Societe Generale doreste introducerea pe piata a unui nou tip de card VISA Electron care va avea numele CreditStud....

Analiza Datelor - Proiect SAS

Introducere In cele ce urmeaza am realizat o canaliza a ofertei de autoturisme a unui dealer. Scopul final este acela de a stabili care sunt...

Analiza componentelor principale (ACP)

Descrierea datelor Proiectul își propune să analizeze un eșantion de dimensiune n=42, ce reprezintă județele României, datele fiind culese de pe...

Analiza Datelor

1. DESCRIEREA INDICATORILOR Datele au fost preluate .i prelucrate de pe site-ul: https://ec.europa.eu/eurostat/web. Exemplul prezentat de noi...

Ai nevoie de altceva?