Extras din seminar
În cadrul analizei cluster utilizăm componentelor principale provenite din acp, mai exact scorurile acestora.
Metode de clusterizare ierarhică
- Metoda agregării simple
Metoda celor mai apropiați vecini reprezintă distanța dintre cele mai apropiate obiecte. Se identifică cea mai mica valoare din matricea distanțelor care are o dimensiune de 26 pe 26 și firmele asociate acesteia. Recalculam matricea distanțelor care este acum de 25 pe 25.
Cele mai apropiate 2 firme care au format prima clasă sunt Junior Soft și Q Info, regăsinduse în matricea distanțelor cu cea mai mica valoare și anume 0.003715589. Se calculează distanța dintre Junior Soft și toate celalalte firme, apoi distanța dintre Q Info și toate celalalte firme și se alage minimul. Următoarea distanță la care s-a făcut agregarea este 0.018492001 unde s-au unit firmele Junior Soft, Q Info și Metal Glass. Cea de-a treia agregare a unit firmele Junior Soft, Q Info, Metal Glass și Genius la distanța de 0.018769947.
Distanțele de agregare
0.003715589 0.018492001 0.018769947 0.060770786 0.085141559 0.162990995 0.192754499 0.206213392 0.213410356 0.289325049 0.297800902 0.324402131 0.343636066 0.411637164 0.462979823 0.548667262 0.572644363 0.656557692 0.698860823 0.718694399 0.976384217 1.002562174 1.358900298 1.367122238
1.409306457
Urmărind distanțele de agregare vom efectua tăietura acolo unde avem cel mai mare salt. Acesta se observă între valorile 1.002562174 și 1.358900298 ( Figura 1 ).
Figura 1
Pe axa din stânga sunt reprezentate distanțele de agregare. Faptul că la un anumit moment 2 entități s au grupat ne spun despre acestea că sunt cele mai asemanatoare și au fost agragate în cadrul aceleiasi clase. În partea de jos a graficului se observă metoda utilizată.
Preview document
Conținut arhivă zip
- Analiza Cluster.docx