Cuprins
- Descrierea experimentului și a datelor - pagina 3
- Statistici descriptive - pagina 4
- Analiza Componentelor Principale - pagina 9
- Clasificatorul naiv Bayesian - pagina 11
- Arborele decizional - pagina 13
- Algoritmul K-means - pagina 14
- Algoritmul K-mendoids - pagina 19
- Analiza coeficienților siluetă - pagina 21
- Algoritmul Fuzzy - pagina 21
- Clusterizare ierarhică - pagina 22
- Rețele neuronale - pagina 23
- SVM - pagina 25
Extras din proiect
Tabela Theoph conține 132 de rânduri și 5 coloane de date corespunzătoare unui experiment asupra farmacocineticii teofilinei. Aceasta conține următoarele coloane:
-Subject: tip factor ce poate avea nivelele 1, 2, 3, , 12 ce corespund subiecților pe care s-a facut experimentul. Ordonarea se face prin creșterea concentrației maxime de teofilină observate;
-Wt: tip numeric (kg) ce exprimă greutatea subiectului pe care s-a facut experimentul;
-Dose: tip numeric - doza de teofilină administrată oral subiecților (mg/kg);
-Time: tip numeric - timpul de la administrarea medicamentului pana la extragerea eșantionului (ore)
-Conc: tip numeric - concentrația teofilinei din eșantion (mg/L)
Descrierea tabelei și a datelor:
> dim(Theoph)
[1] 132 5
> names(Theoph)
[1] "Subject" "Wt" "Dose" "Time" "conc"
> str(Theoph)
132 obs. of 5 variables:
$ Subject: Ord.factor w/ 12 levels "6"<"7"<"8"<"11"< : 11 11 11 11 11
$ Wt : num 79.6 79.6 79.6 79.6 79.6 79.6 79.6 79.6 79.6 79.6
$ Dose : num 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02 4.02
$ Time : num 0 0.25 0.57 1.12 2.02
$ conc : num 0.74 2.84 6.57 10.5 9.66 8.58 8.36 7.47 6.89 5.94
> attributes(Theoph)
$names
[1] "Subject" "Wt" "Dose" "Time" "conc"
$row.names
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13
[14] 14 15 16 17 18 19 20 21 22 23 24 25 26
[27] 27 28 29 30 31 32 33 34 35 36 37 38 39
[40] 40 41 42 43 44 45 46 47 48 49 50 51 52
[53] 53 54 55 56 57 58 59 60 61 62 63 64 65
[66] 66 67 68 69 70 71 72 73 74 75 76 77 78
[79] 79 80 81 82 83 84 85 86 87 88 89 90 91
[92] 92 93 94 95 96 97 98 99 100 101 102 103 104
[105] 105 106 107 108 109 110 111 112 113 114 115 116 117
[118] 118 119 120 121 122 123 124 125 126 127 128 129 130
[131] 131 132
> head(Theoph)
Subject Wt Dose Time conc
1 1 79.6 4.02 0.00 0.74
2 1 79.6 4.02 0.25 2.84
3 1 79.6 4.02 0.57 6.57
4 1 79.6 4.02 1.12 10.50
5 1 79.6 4.02 2.02 9.66
6 1 79.6 4.02 3.82 8.58
Statistici descriptive:
Subject
> pie(table(Theoph$Subject))
-Din graficul anterior se observă că numărul de observații din fiecare categorie (nivel) sunt aproximativ egale.
Wt
> quantile(Theoph$Wt,na.rm = TRUE)
0% 25% 50% 75% 100%
54.600 63.575 70.500 74.425 86.400
> summary(Theoph$Wt)
Min. 1st Qu. Median Mean 3rd Qu. Max.
54.60 63.58 70.50 69.58 74.43 86.40
- Greutatea minimă întregistrată este de 54,6 kg, iar cea maximă de 86,4 kg.
- Primele 25% de observații au greutăți mai mici decât 63,58, pe când 50% dintre acestea au greutatea sub 70,5 kg, iar 25% au greutatea mai mare de 74,43 kg.
- Valoarea medie calculată este de 69,58.
> hist(Theoph$Wt)
Frecvența cea mai mare (peste 40 de observații) se află în intervalul 70-75 (kg), iar histograma este asimetrică spre stânga.
> pie(table(Theoph$Wt))
Diagrama de mai sus confirmă faptul ca frecvența maximă o are greutatea de 70,5 kg.
> plot(Theoph$Wt)
Dose
> quantile(Theoph$Dose,na.rm = TRUE)
0% 25% 50% 75% 100%
3.1000 4.3050 4.5300 5.0375 5.8600
> summary(Theoph$Dose)
Min. 1st Qu. Median Mean 3rd Qu.
3.100 4.305 4.530 4.626 5.038
Max.
5.860
- Doza minimă administrată este de 3,1 mg/kg, iar cea maximă de 5,860 mg/kg, în timp ce media vaorilor înregistrate este de 4,53.
- 25% dintre observații au doza mai mică decât 4,305 mg/kg, 50% au doza mai mică de 4,53, iar 25% dintre observații au valori de peste 5,038.
> hist(Theoph$Dose)
Din histogramă se observă că cele mai multe doze au valori cuprinse între 4,5 - 5 mg/mg.
> plot(Theoph$Dose)
> pie(table(Theoph$Dose))
Din piechart-ul anterior se observă că cele mai multe doze au valori de aproximativ 4,4 și 4,53 mg/kg.
Time
> quantile(Theoph$Time,na.rm = TRUE)
0% 25% 50% 75% 100%
0.000 0.595 3.530 9.000 24.650
> summary(Theoph$Time)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 0.595 3.530 5.895 9.000 24.650
- Timpul minim de la administrarea dozei pana la extragerea eșationului a fost de 0 h, iar timpul maxim de 24,65 ore.
Preview document
Conținut arhivă zip
- Inteligenta computationala.docx