Analiza Datelor și Extragerea Cunostiintelor

Curs
8/10 (1 vot)
Domeniu: Calculatoare
Conține 7 fișiere: pdf
Pagini : 90 în total
Cuvinte : 30577
Mărime: 1.70MB (arhivat)
Cost: Gratis
Profesor îndrumător / Prezentat Profesorului: Vasile Georgescu

Extras din document

Capitolul 1

REPREZENTĂRI, DESCRIPTORI ŞI METRICI ALE DATELOR

MULTIDIMENSIONALE

1.1. Formalizarea noţiunii de variabilă

O colecţie de date multidimensionale serveşte la descrierea unei mulţimi Γ de n unităţi observate

(indivizi), cu ajutorul a p variabile.

Fiecare variabilă este definită prin:

1. o mulţime Ω numită spaţiul observaţiilor;

2. o structură algebrică S pe Ω;

3. o aplicaţie v a lui Γ în Ω:

Γ⎯⎯v→Ω înzestrată cu structura S

Pentru ansamblul celor p variabile:

1

Γ⎯⎯v1→Ω înzestrată cu structura S1

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p

Γ⎯⎯v p→Ω înzestrată cu structura Sp

se poate defini o variabilă vectorială, ce aplică Γ în produsul cartezian Ω1 ×...×Ωp :

( ) v = v1,..., vp : Γ →Ω = Ω1 ×...×Ωp

unde Ω este înzestrată cu o structură S, definită plecând de la S1,..., Sp .

Aşadar, variabila vectorială v asociază fiecărui individ γ ∈Γ , p-uplul (v1(γ ),..., vp (γ )) din Ω.

În funcţie de cardinalul lui Ω şi de structura algebrică S se disting 4 tipuri de variabile:

1° calitative nominale: v :Γ→Ω (≡ N)

unde Ω constituie o mulţime de coduri numerice, finită, fără structură, exceptând relaţia de identitate -

nonidentitate (= sau ≠) impusă de chiar principiul logic al noncontradicţiei. Spre exemplu, parametrului “tip de

transport“, definit prin modalităţile (denominative, nelegate de vreo preferinţă expresă) : rutier=1, feroviar=2,

fluvial=3, maritim=4, aerian=5, i se asociază calitatea nominală: v : Γ→Ω = {1,2,3,4,5}, fără structură.

2° calitative ordinale: v :Γ→Ω (≡ N)

unde Ω este o mulţime finită, sau cel mult numărabilă, înzestrată cu o structură de ordine (≤). Spre exemplu,

testând preferinţele cumpărătorilor cu privire la 4 mărci de parfumuri, li se solicită acestora să acorde o notă de la

1 la 4. Atunci, o variabilă v j asociată mărcii M j , este o aplicaţie v j : Γ →Ω = {1,2,3,4}, înzestrată cu structura

de ordine uzuală, iar o valoare v3(w2 ) = 4∈Ω are semnificaţia că al doilea individ interogat ∈Γ w2 , preferă a

treia marcă de parfum tuturor celorlalte.

2

3° cantitative ordinale: v :Γ→Ω (≡ R)

În acest caz, mulţimea Ω este continuă (reală), înzestrată cu o structură de ordine. Variabila ce se

asociază parametrului temperatură este un bun exemplu în acest sens. La fel variabilele ce exprimă stări, sau

stocuri, ale căror nivele succesive pot fi comparate (≤), de asemenea li se poate aplica operaţia de diferenţă (-),

dar sunt lipsite de sens operaţiile de impărţire (/), sau de însumare (+).

4° cantitative, măsurabile cardinal: v :Γ→Ω (≡ R)

Variabilele de acest tip iau valori într-o mulţime Ω continuă, cu structură de corp ordonat (≤, +, ×).

Exemplele sunt numeroase: venitul lunar, preţul unui produs, conţinutul unui mineral în substanţă utilă, etc.

In funcţie de semnificaţia atribuită, aceluiaşi parametru îi vor corespunde variabile cu structuri diferite.

Astfel, parametrului “vârstă“ i se poate asocia o variabilă cantitativă (vârsta „exactă”), o variabilă cantitativă

ordinală (clasele de vârstă), respectiv o variabilă calitativă nominală (clasele de vârstă regrupate într-o manieră

neordinală, punând, de exemplu, în aceeaşi grupă tinerii şi vârstnicii).

Diferitele tipuri de variabile sunt rezumate în tabelul următor:

Cardinalul

lui Ω

Structura lui Ω

Mulţime continuă Mulţime finită sau cel mult

numărabilă

Fără structură

identitate (=)

nonidentitate (≠)

Domiciliu,

Categorii socio-profesionale

Nominală

Cu structură

ordinară (≤)

Stări, Nivele, Temperatura,

Clase de vârstă

Preferinţe, Ranguri, Frecvenţe,

Asemănări

Ordinală

Cu structură de

corp ordonat

(≤, +, ×)

Venit, Preţ,

Variabile de flux

Măsurabilă

cardinal

Cantitativă Calitativă Variabila

1.2. Reprezentarea datelor multidimensionale. Spaţiul variabilelor şi spaţiul indivizilor

Valorile variabilelor relativ la indivizii supuşi observării se specifică printr-o matrice cu n linii şi p

coloane:

Preview document

Analiza Datelor și Extragerea Cunostiintelor - Pagina 1
Analiza Datelor și Extragerea Cunostiintelor - Pagina 2
Analiza Datelor și Extragerea Cunostiintelor - Pagina 3
Analiza Datelor și Extragerea Cunostiintelor - Pagina 4
Analiza Datelor și Extragerea Cunostiintelor - Pagina 5
Analiza Datelor și Extragerea Cunostiintelor - Pagina 6
Analiza Datelor și Extragerea Cunostiintelor - Pagina 7
Analiza Datelor și Extragerea Cunostiintelor - Pagina 8
Analiza Datelor și Extragerea Cunostiintelor - Pagina 9
Analiza Datelor și Extragerea Cunostiintelor - Pagina 10
Analiza Datelor și Extragerea Cunostiintelor - Pagina 11
Analiza Datelor și Extragerea Cunostiintelor - Pagina 12
Analiza Datelor și Extragerea Cunostiintelor - Pagina 13
Analiza Datelor și Extragerea Cunostiintelor - Pagina 14
Analiza Datelor și Extragerea Cunostiintelor - Pagina 15
Analiza Datelor și Extragerea Cunostiintelor - Pagina 16
Analiza Datelor și Extragerea Cunostiintelor - Pagina 17
Analiza Datelor și Extragerea Cunostiintelor - Pagina 18
Analiza Datelor și Extragerea Cunostiintelor - Pagina 19
Analiza Datelor și Extragerea Cunostiintelor - Pagina 20
Analiza Datelor și Extragerea Cunostiintelor - Pagina 21
Analiza Datelor și Extragerea Cunostiintelor - Pagina 22
Analiza Datelor și Extragerea Cunostiintelor - Pagina 23
Analiza Datelor și Extragerea Cunostiintelor - Pagina 24
Analiza Datelor și Extragerea Cunostiintelor - Pagina 25
Analiza Datelor și Extragerea Cunostiintelor - Pagina 26
Analiza Datelor și Extragerea Cunostiintelor - Pagina 27
Analiza Datelor și Extragerea Cunostiintelor - Pagina 28
Analiza Datelor și Extragerea Cunostiintelor - Pagina 29
Analiza Datelor și Extragerea Cunostiintelor - Pagina 30
Analiza Datelor și Extragerea Cunostiintelor - Pagina 31
Analiza Datelor și Extragerea Cunostiintelor - Pagina 32
Analiza Datelor și Extragerea Cunostiintelor - Pagina 33
Analiza Datelor și Extragerea Cunostiintelor - Pagina 34
Analiza Datelor și Extragerea Cunostiintelor - Pagina 35
Analiza Datelor și Extragerea Cunostiintelor - Pagina 36
Analiza Datelor și Extragerea Cunostiintelor - Pagina 37
Analiza Datelor și Extragerea Cunostiintelor - Pagina 38
Analiza Datelor și Extragerea Cunostiintelor - Pagina 39
Analiza Datelor și Extragerea Cunostiintelor - Pagina 40
Analiza Datelor și Extragerea Cunostiintelor - Pagina 41
Analiza Datelor și Extragerea Cunostiintelor - Pagina 42
Analiza Datelor și Extragerea Cunostiintelor - Pagina 43
Analiza Datelor și Extragerea Cunostiintelor - Pagina 44
Analiza Datelor și Extragerea Cunostiintelor - Pagina 45
Analiza Datelor și Extragerea Cunostiintelor - Pagina 46
Analiza Datelor și Extragerea Cunostiintelor - Pagina 47
Analiza Datelor și Extragerea Cunostiintelor - Pagina 48
Analiza Datelor și Extragerea Cunostiintelor - Pagina 49
Analiza Datelor și Extragerea Cunostiintelor - Pagina 50
Analiza Datelor și Extragerea Cunostiintelor - Pagina 51
Analiza Datelor și Extragerea Cunostiintelor - Pagina 52
Analiza Datelor și Extragerea Cunostiintelor - Pagina 53
Analiza Datelor și Extragerea Cunostiintelor - Pagina 54
Analiza Datelor și Extragerea Cunostiintelor - Pagina 55
Analiza Datelor și Extragerea Cunostiintelor - Pagina 56
Analiza Datelor și Extragerea Cunostiintelor - Pagina 57
Analiza Datelor și Extragerea Cunostiintelor - Pagina 58
Analiza Datelor și Extragerea Cunostiintelor - Pagina 59
Analiza Datelor și Extragerea Cunostiintelor - Pagina 60
Analiza Datelor și Extragerea Cunostiintelor - Pagina 61
Analiza Datelor și Extragerea Cunostiintelor - Pagina 62
Analiza Datelor și Extragerea Cunostiintelor - Pagina 63
Analiza Datelor și Extragerea Cunostiintelor - Pagina 64
Analiza Datelor și Extragerea Cunostiintelor - Pagina 65
Analiza Datelor și Extragerea Cunostiintelor - Pagina 66
Analiza Datelor și Extragerea Cunostiintelor - Pagina 67
Analiza Datelor și Extragerea Cunostiintelor - Pagina 68
Analiza Datelor și Extragerea Cunostiintelor - Pagina 69
Analiza Datelor și Extragerea Cunostiintelor - Pagina 70
Analiza Datelor și Extragerea Cunostiintelor - Pagina 71
Analiza Datelor și Extragerea Cunostiintelor - Pagina 72
Analiza Datelor și Extragerea Cunostiintelor - Pagina 73
Analiza Datelor și Extragerea Cunostiintelor - Pagina 74
Analiza Datelor și Extragerea Cunostiintelor - Pagina 75
Analiza Datelor și Extragerea Cunostiintelor - Pagina 76
Analiza Datelor și Extragerea Cunostiintelor - Pagina 77
Analiza Datelor și Extragerea Cunostiintelor - Pagina 78
Analiza Datelor și Extragerea Cunostiintelor - Pagina 79
Analiza Datelor și Extragerea Cunostiintelor - Pagina 80
Analiza Datelor și Extragerea Cunostiintelor - Pagina 81
Analiza Datelor și Extragerea Cunostiintelor - Pagina 82
Analiza Datelor și Extragerea Cunostiintelor - Pagina 83
Analiza Datelor și Extragerea Cunostiintelor - Pagina 84
Analiza Datelor și Extragerea Cunostiintelor - Pagina 85
Analiza Datelor și Extragerea Cunostiintelor - Pagina 86
Analiza Datelor și Extragerea Cunostiintelor - Pagina 87
Analiza Datelor și Extragerea Cunostiintelor - Pagina 88
Analiza Datelor și Extragerea Cunostiintelor - Pagina 89
Analiza Datelor și Extragerea Cunostiintelor - Pagina 90

Conținut arhivă zip

  • 0_Introducere in Data Mining.pdf
  • 1_REPREZENTARI, DESCRIPTORI SI METRICI ALE DATELOR MULTIDIMENSIONALE.pdf
  • 2_TEHNICI DE INVATARE SUPERVIZATA_discretizoare, algoritmi de inductie si clasificatoare.pdf
  • 3_TEHNICI DE INVATARE SUPERVIZATA_Retele neuronale.pdf
  • 4_TEHNICI DE INVATARE SUPERVIZATA_Metode predictive_de_tip_regresie.pdf
  • 5_TEHNICI DE INVATARE NESUPERVIZATA_Grupare_(clustering).pdf
  • 6_TEHNICI DE INVATARE NESUPERVIZATA_reguli_de_asociere.pdf

Alții au mai descărcat și

Curs Excel pentru începători

1.1 Scopul cursului Cursul se adreseaza angajatilor care au un nivel elementar de cunostinte Excel, pentru a ajunge la nivelul mediu pentru ca mai...

Programare în Limbaj de Asamblare

Bitii din registrul Flag sunt indicatori de stare care se pozitioneaza functie de rezultatul ultimei operatii aritmetice sau logice si se testeaza...

Curs HTML

Curs – Programare WEB Curs – 1 Elemente de baza Pentru inceput sa descoperim originea abrevierii HTML - Hypertext Markup Language . Acest limbaj...

Bazele inteligenței artificiale

In rezolvarea problemelor utilizind strategii de cautare neinformata numarul de stari investigate inainte de a gasi o solutie poate ajunge...

Sisteme Avansate de Baze de Date

Ne vom referi la urmatoarele categorii de baze de date: - Baze de date relationale - Baze de date active, - Baze de date deductive - Baze de...

Meniuri în Java

Metode add (MenuItem) Adds the specified item to this menu. add(String) Adds an item with with the specified label to this menu....

Serializarea Obiectelor în Java

Clasa ObjectInputStream Constructor public ObjectInputStream( java.io.InputStream in ) throws java.io.IOException,...

Șiruri de caractere în C și C++

Functii de intrare / iesire relative la siruri de caractere. Pentru a citi un sir de caractere de la intrarea standard se foloseste functia gets()...

Te-ar putea interesa și

Tehnici Avansate de Conducere pentru un Sistem Energetic

1. Introducere În contextul situaþiei energetice mondiale, efortul cerut pentru reducerea consumurilor de energie în vederea conservãrii este, de...

Sisteme Informaționale și Aplicații Informatice

Introducere Secolul XXI cunoaşte o tot mai mare nevoie de simplificare a operaţiunilor necesare a se efectua zilnic, de îndeplinire a tot mai...

Miniplan promoțional - Pate Sadu

1. Analiza preliminară a produsului / brandului 1.1. Analiza conjucturii de piaţă a produsului Scandia România SA este o companie producătoare de...

Data mining

Introducere Numarul utilizatorilor de Internet creste in fiecare zi semnificativ, aceasta insemnand faptul ca o buna parte din populatia globului...

Depozite de Date - Oracle Warehouse

Notă. Conceptul de Inteligenţa Afacerii – IA (Business Intelligence - BI) este o tehnologie informatică ce priveşte organizarea şi funcţionarea...

Ai nevoie de altceva?