Cuprins
- I. Obiectiv si sursa datelor 3
- II. Statistici descriptive in R 5
- III. Analizarea Componentelor Principale 11
- Datele selectate inițial sunt caracteristici tehnice ale autoturismelor. Acestea au unități de măsură diferite. De aceea, în continuare vom lucra pe datele standardizate: 11
- 1. Criteriul Kaiser 12
- 2. Criteriul Pantei 12
- 12
- 3. Criteriul Procentului de Variație 13
- IV. Analiza Cluster 19
- Analiza cluster poate fi privită ca un instrument care are ca scop reducerea unor mulțimi de obiecte, sau chiar de variabile, la un număr mai restrâns de entități informaționale, care sunt clasele sau clusterele. Totuși, deși analiza cluster, privită ca un ansamblu de metode și tehnici de clasificare a obiectelor, se aplică în spațiul variabilelor, utilizările frecvente ale acestor tehnici de analiză se remarcă pentru clasificarea obiectelor. 19
- 6.1. METODA WARD 20
- a. VARIABILE STANDARDIZATE 20
- În continuare am realizat matricea distanțelor utilizând metoda WARD. În cadrul acesteia se pot observa valorile din partea inferioară, aceasta fi nd o matrice de distanță simetrică și nu are relevanță cu ce nod se începe calculul pentru distanță. 20
- 20
- Algoritmul Kmeans 30
- Algoritmul Fuzzy C-means 33
- V. Clasificare 35
- a) Clasificatorul Naïve Bayesian 36
- b) Metoda celor mai apropiati vecini(KNN) 38
- c) Masina cu suport vectorial 42
- d) Arbori de decizie 44
- VI. Retele neuronale 45
Extras din proiect
I. Obiectiv si sursa datelor
Pentru realizarea acestui proiect am ales domeniul auto, mai exact compania Bayerische Motoren Werke(BMW), companie pentru care voi studia toate modelele de mașini în funcție de anul de fabricație.
Obiectivul proiectului meu este de a urmări ce modele sunt optime pentru clienți prin intermediul analizei unui set de caracteristici specifice.
Datele selectate au fost preluate de pe diferite site-uri de specialitate, precum www.auto-data.net, www.press.bmwgroup.com, www.autovit.ro, www.bmw.ro, www.mobile.de, www.autoscout24.com, www.autozeitung.de, www.bmw-bavaria.ro. Astfel, printre caracteristicile tehnice studiate, se regasesc urmatoarele:
1. Model - denumirea fiecărui model studiat;
2. Manufacturing date - data de fabricație a fiecărui model studiat;
3. Engine size - capacitatea motorului pe care o are fiecare model studiat;
4. No cylinders - numărul de cilindrii pentru fiecare model studiat;
5. Length - lungimea fiecărui model;
6. Width - lățimea fiecărui model;
7. Weight - greutatea fiecărui model studiat;
8. Consumption - consumul de motorină/benzină în litri/km pentru fiecare model;
9. Max speed - viteza maximă pe care o poate atinge fiecare model studiat;
10. Acceleration - timpul în care fiecare model poate atinge viteza de 100 km/h.
11. Co2 emissions - cantitatea de dioxid de carbon emanată în aer pentru fiecare model studiat;
12. Price - prețul la care se gasește pe piață fiecare model studiat.
Prin intermediul programului Excel am structurat datele sub forma unui tabel pentru a le putea studia eficient, tabelul conținând un număr de 64 de observații , după cum urmează:
Tabel.1- Date initiale
II. Statistici descriptive in R
Fig2. Summary
În urma utilizării comenzii summary deducem următoarele observații:
1.Engine size:
- Capacitatea motorului ia valori între 1995 cm3 pentru modelele următoare: Series_1, Series_2_1, Series_2_GT_1, Series_3, Series_3_GT_1, Series_6_GT, X1, X1_1 și 2993 cm3 pentru modelele următoare: Series_4, Series_4_1, Series_5, Series_5_1, Series_5_GT, Series_5_GT_1, Series_6, Series_7, Series_7_1, Series_8, Series_8_1, X3, X4, X5, X6, X7_1, Alpina_XD3, Alpina_XD4.
- Capacitatea medie a motorului pentru automobilele BMW este de 2588.
- 50% dintre valorile selectate au o valoare mai mică de 2993 cm3, iar restul de 50% au o valoare egală cu 2993 cm3.
2. No cylinders:
- Numărul de cilindrii minim este de 4 pentru modelele: Series_1, Series_1_1, Series_2, Series_2_1, Series_2_GT_1, Series_3, Series_3_GT_1, Series_6_GT, Series_6_GT_1, X1, X1_1, X3_1, Z4, în timp ce numărul maxim de cilindrii este de 6 pentru modelele : Series_3_1, Series_4, Series_4_1, Series_5, Series_5_1, Series_5_GT, Series_5_GT_1, Series_6, Series_7, Series_7_1, Series_8, Series_8_1, X3, X4, X5, X6, X7_1, Alpina_XD3, Alpina_XD4.
- Numărul mediu de cilindrii este de 5.188.
- 50% dintre modelele selectate au un număr de cilindrii mai mic de 6, în timp ce 50% din modelele selectate au un număr de 6 cilindrii.
Preview document
Conținut arhivă zip
- Inteligenta Computationala.docx