GVMD

Curs
4/10 (2 voturi)
Domeniu: Cibernetică
Conține 1 fișier: pdf
Pagini : 48 în total
Cuvinte : 26115
Mărime: 1.11MB (arhivat)
Publicat de: Toma Bunea
Puncte necesare: 0
Facultatea de Cibernetica, Statistica si Informatica Economica
Academia de Studii Economice, Bucuresti

Cuprins

  1. DEPOZITE DE DATE. - 3 -
  2. 1. Modelul de date multidimensional . - 3 -
  3. 1.1. Structura modelului multidimensional . - 3 -
  4. 1.2. Operaţii realizate asupra modelului multidimensional . - 7 -
  5. 1.3. Restricţii de integritate . - 8 -
  6. 1.4. Modele de reprezentare a obiectelor depozitelor de date . - 9 -
  7. 2. Organizarea datelor în depozite de date . - 11 -
  8. 2.1. Inteligenţa Afacerii – aspecte fundamentale . - 11 -
  9. 2.2. Principalele tehnologii informatice utilizate în sistemele pentru Inteligenţa Afacerii- 12 -
  10. 2.3. Evoluţia şi definirea depozitelor de date . - 13 -
  11. 2.4. Obiectivele şi caracteristicile organizării datelor în depozitele de date . - 15 -
  12. 2.5. Facilităţi oferite de depozitele de date sistemelor de Inteligenţa Afacerii . - 17 -
  13. 3. Arhitectura depozitelor de date . - 18 -
  14. 3.1. Arhitectura pe componente a depozitelor de date . - 18 -
  15. 3.2. Arhitectura pe niveluri a depozitelor de date . - 19 -
  16. 3.3. Arhitectura depozitelor de date din punctul de vedere funcţional . - 20 -
  17. 4. Tipuri de depozite de date. - 21 -
  18. 4.1. Tipuri de depozite de date în funcţie de aria de cuprindere . - 21 -
  19. 4.2. Tipuri de depozite de date în funcţie de procesele decizionale pentru care au fost proiectate . - 22 -
  20. 4.3. Tipuri de depozite de date în funcţie de modelul de date implementat . - 22 -
  21. 5. Aspecte comparative privind organizarea datelor în baze de date şi în depozite de date . - 23 -
  22. REALIZAREA DEPOZITELOR DE DATE . - 25 -
  23. 1. Considerente privind realizarea depozitelor de date . - 25 -
  24. 1.1. Modalităţi de realizare a depozitelor de date . - 25 -
  25. 1.2. Metodologii utilizate la realizarea depozitelor de date . - 26 -
  26. 2. Etape de realizare a depozitelor de date . - 28 -
  27. 2.1. Strategia de realizare a depozitelor de date . - 28 -
  28. 2.2. Modelarea depozitelor de date . - 31 -
  29. 2.3. Implementarea depozitelor de date . - 34 -
  30. 2.4. Exploatarea depozitelor de date . - 42 -
  31. 2.5. Criterii de evaluare a depozitelor de date . - 44 -
  32. 2.6. Instrumente şi medii de dezvoltare utilizate pentru realizarea depozitelor de date . - 45 -
  33. BIBLIOGRAFIE . - 47 -

Extras din curs

DEPOZITE DE DATE

Un depozit de date furnizează o sursă integrată şi centralizată de date, separată de sistemul tranzacţional, care conţine datele esenţiale despre activitatea companiei din multitudinea de surse de date existente. Rapoartele obţinute pe baza acestor date sunt utilizate ca un instrument de analiză strategic şi competitiv, analizele rapide şi corecte putând influenţa deciziile privind evoluţia organizaţiei pe termen mediu şi lung.

Cuvinte cheie: depozite de date, cub de date, schema de tip stea, model multidimensional, dimensiuni, fapte, măsuri.

1. Modelul de date multidimensional

Depozitele de date sunt organizate diferit faţă de bazele de date, fiind destinate mai mult extragerii de date decât actualizărilor repetate. Datele extrase sunt utilizate în analize dinamice care presupun schimbări de perspectivă asupra datelor şi vizualizări ale acestora de la un nivel detaliat la unul sintetic, agregat şi invers. Din acest motiv s-a impus o organizare specifică a datelor în care obiectele sunt structurate pe diferite niveluri care permit această analiză dinamică.

Modelele de date utilizate pentru reprezentarea depozitelor de date au cunoscut o diversitate destul de mare atât din punctul de vedere al teoretizării conceptelor cât mai ales din punctul de vedere al aplicării diferitelor tipuri de modele în practică. Două direcţii importante au clasificat totuşi această diversitate de modele şi anume dezvoltarea unor extensii ale modelului relaţional şi dezvoltarea modelelor bazate pe cuburi n-dimensionale.

Tipul de model multidimensional utilizat de diverse tehnologii şi produse software care implementează depozitele de date diferă atât din punctul de vedere al SGBD utilizat cât şi din cel al operaţiilor realizate asupra datelor şi a arhitecturii implementate.

1.1. Structura modelului multidimensional

Structura modelului multidimensional conţine în principal obiectele referitoare la tabelele de fapte cu atribute de tip măsuri sau metrici, tabelele de tip dimensiune în care regăsim niveluri ierarhice, atribute de identificare şi atribute de descriere etc. Aceste obiecte vor fi prezentate în continuare.

În cadrul modelului multidimensional se întâlnesc mai multe tipuri de obiecte care prezintă o importanţă deosebită în analiză [KIRE98].

Dimensiunile – reprezintă structuri compuse formate din atribute structurate pe diverse niveluri ierarhice în funcţie de care sunt grupate datele. Aceste atribute sunt de obicei descriptive şi sunt folosite ca sursă pentru limitarea înregistrărilor afişate în cadrul rapoartelor analitice. Sunt considerate tabele secundare datorită dimensiunilor reduse. Consiliul OLAP, un consorţiu al firmelor dezvoltatoare de produse OLAP înfiinţat în 1995 cu rolul de a standardiza aceste tehnologii prin stabilirea unor standarde deschise (OLAP API), defineşte conceptul de dimensiune ca fiind “un atribut structural al unui cub care constă dintr-o listă de membri, pe care utilizatorii îi percep ca fiind de acelaşi tip (de exemplu toate lunile, trimestrele, anii formează dimensiunea Timp). Dimensiunile reprezintă un mod foarte concis, intuitiv de organizare şi selectare a datelor pentru

explorare şi analiză.” [OLAP95].

Datele dintr-o dimensiune sunt structurate ierarhic, pe mai multe niveluri, fiecare dintre acestea putând avea mai multe atribute.

Ierarhiile – sunt structuri logice utilizate pentru ordonarea nivelurilor de reprezentare a datelor. Sunt utilizate şi pentru definirea căilor de navigare în interiorul dimensiunilor şi oferă instrumentelor de analiză OLAP posibilitatea de detaliere graduală a datelor în rapoarte. Tot în definiţiile date de Consiliul OLAP se menţionează că „membrii dimensiunilor pot fi organizaţi pe baza relaţiilor de tip părinte-copil, unde un membru părinte reprezintă agregarea membrilor copil. Rezultatul este o ierarhie şi relaţiile părinte-copil sunt relaţii ierarhice” [OLAP95].

Nivelurile – reprezintă poziţii în cadrul ierarhiilor, cu exemplificare pe dimensiunea Produs (figura 1). De exemplu dimensiunea Timp poate avea trei niveluri de ierarhizare: an, trimestru şi lună. Relaţiile între diferite niveluri sunt relaţii de tipul părinte-copil, însă se pot defini ierarhii în care datele fiecărui nivel sunt agregate la un nivel imediat superior sau se poate sări peste anumite niveluri care sunt independente.

Figura 1. Ierarhii şi niveluri ale dimensiunii Produs

Nivelurile unei ierarhii sunt esenţiale pentru determinarea tipurilor de navigări care se pot realiza în dimensiuni. Tot consiliul OLAP precizează următoarele „doi membri ai unei ierarhii sunt de aceeaşi generaţie dacă ei au acelaşi număr de strămoşi. Termenii de generaţie şi nivel sunt necesari pentru a descrie subgrupuri de membri întrucât, de exemplu, deşi doi fraţi membri au acelaşi părinte şi sunt de aceeaşi generaţie, ei ar putea să nu fie la acelaşi nivel, dacă unul din fraţi are un copil şi celălalt nu.” [OLAP95]

Atributele – dimensiunile conţin atribute care reprezintă calificative specifice. Orice atribut se asociază unei singure dimensiuni, iar o dimensiune se poate exprima prin mai multe atribute. Există două tipuri de atribute: de identificare a dimensiunii şi a fiecărui nivel în parte şi atribute descriptive care realizează o clasificare a datelor în cadrul ierarhiei.

Tabelele de fapte – sunt tabelele centrale care conţin atribute de tip măsuri (metrici) şi chei externe către tabelele dimensiuni. Aceste obiecte conţin de obicei date numerice care pot fi însumate şi analizate pe fiecare nivel din ierarhiile dimensiunilor.

Măsurile (metricile)- corespund atributelor (faptelor) din tabelele de fapte şi sunt de regulă de natură numerică (de exemplu: volumul vânzărilor, costurile, stocurile disponibile). Aceste variabile au sens numai în contextul unor anumite dimensiuni. Valoarea măsurii este calculată pentru un punct dat prin agregarea datelor corespondente perechii aferente valoare-dimensiune, diferite pentru punctul dat.

Sunt mai multe criterii după care se pot clasifica măsurile utilizate într-o tabelă de fapte, şi anume: modalitatea de calcul, tipurile de funcţii agregate utilizate, modalităţile de însumare şi agregare în funcţie de dimensiuni.

În funcţie de modalitatea de calcul atributele se pot clasifica în măsuri de bază, care se

regăsesc sub forma atributelor din tabelele de fapte şi care provin din sursele de date şi măsuri derivate (virtuale) care se obţin prin combinarea măsurilor de bază şi care în tabelele de fapte au precizată formula de calcul prin care se obţin.

Bibliografie

[AGGU97] Agrawal R., Gupta A., Sarawagi S. - Modeling multidimensional databases, 13th International Conference on Data Engineering, 1997 [ANDE97] Anahory S., Dennis, M. - Data Warehousing in the Real World, Addison Wesley Longman, Reading, Mass, 1997 [BALU08] Bâra A., Lungu I., Velicanu M., Diaconiţa V., Botha I. – Improving query performance in virtual data warehouses, WSEAS Transactions on Information Science and Applications, vol. 5, nr. 5, Mai 2008, ISSN: 1709-0832. [DEVL97] Devlin, B. - Data Warehouse – from Architecture to Implementation, Addison Wesley Longman, Reading, Mass, 1997 [DIBO08] Diaconiţa V., Botha I., Bâra A., Lungu I., Velicanu M. – Two integration flavors in public institutions, Revista WSEAS Transactions on Information Science and Applications, volumul 5, numărul 5, pp. 806-815, ISSN: 1709-0832, Mai 2008 [ERIC08] Erickson J. - Data Warehousing gets extreme, Oracle Magazine, vol. XXII, ISSUE 6, November/December 2008. [GOMA98] Golfarelli M., Maio D, Rizzi S. - Conceptual design of data warehouses from E/R schemes, Proceeding of HICSS-31, Hawaii, 1998 [GRBO96] Gray J., Bosworth A., Layan A., Pirahesh H. - Data Cube: A relational aggregation operator generalizing group by, cross-tabs and sub-totals,Proc. of the 12th International Conference of Data Engineering, 1996 [GRWA98] Gray P., Watson H. – Decision Support in the Data Warehouse, Prentice Hall, 1998. [HOLL00] Holland, P. - Traditional data warehouses vs virtual data warehouses, White Paper, March, 2000 [INMO96] Inmon, W.H. - Building the Data Warehouse, John Wiley & Sons, New York, 1996 [INMO99] Inmon, B. - Data mart does not equal data warehouse, DM Direct Newsletter, November, 1999 [JAJE98] Jarke M., Jeusfeld M.A., Quix C., Vassiliadis P.- Architecture and quality in data warehouses, Proceedings CaiSE 98, Pisa, Italy, 1998 [KIMB96] Kimball R. - The Data Warehouse Toolkit, John Wiley & Sons, New York, 1996 [KIRE98] Kimball R., Reeves L., Ross M., Thornthwaite W. - The data Warehouse Lifecycle Toolkit, John Wiley&Sons, Inc., New York, 1998. [LUBA07] Lungu I, Bâra A – Sisteme informatice executive, editura ASE, 2007

[OLAP95] The OLAP Council Definitions, www.olapcouncil.org, ianuarie 1995 [POWE00] Power D.J. - Decision Support Systems: Concepts and Resources, Cedar Falls, IA: DSSresources.com, http://dssresources.com/dssbook, 2000 [TEST00] Teste O. - Towards Conceptual Multidimensional Design in DecisionSupport Systems, Dexa 2000, LNCS 1873, Londra, 2000 [VELU09] Velicanu M., Lungu I. ş.a. – Sisteme de baze de date evoluate, ed. ASE, ISBN 978-606-505-217-8, 2009. [VEMA07] Velicanu M., Matei Gh. – A few implementation solutions for Business Intelligence, Revista Informatica Economica nr. 3/2008, ISSN 1453-1305. [VEMA07a] Velicanu M., Matei Gh. – Building a data warehouse step by step, Revista Informatica Economică nr 2/2007, pag. 83-89, ISSN 1453-1305, 2007 [VEMA07b] Velicanu M., Matei Gh.– Database vs Data Warehouse, Revista Informatica Economică nr 3/2007 (43), pag. 91-95, ISSN 1453-1305, 2007 [VEMA10] Velicanu M., Matei Gh. – Tehnologia Inteligenţa Afacerii, Editura ASE Bucureşti, ISBN 978-606-505-311-3, 2010 [VILA97] Vilan A. – Data warehouses, data marts şi data mining, Revista Computerworld România, nr. 18 (88), 21 Octombrie 1997

Preview document

GVMD - Pagina 1
GVMD - Pagina 2
GVMD - Pagina 3
GVMD - Pagina 4
GVMD - Pagina 5
GVMD - Pagina 6
GVMD - Pagina 7
GVMD - Pagina 8
GVMD - Pagina 9
GVMD - Pagina 10
GVMD - Pagina 11
GVMD - Pagina 12
GVMD - Pagina 13
GVMD - Pagina 14
GVMD - Pagina 15
GVMD - Pagina 16
GVMD - Pagina 17
GVMD - Pagina 18
GVMD - Pagina 19
GVMD - Pagina 20
GVMD - Pagina 21
GVMD - Pagina 22
GVMD - Pagina 23
GVMD - Pagina 24
GVMD - Pagina 25
GVMD - Pagina 26
GVMD - Pagina 27
GVMD - Pagina 28
GVMD - Pagina 29
GVMD - Pagina 30
GVMD - Pagina 31
GVMD - Pagina 32
GVMD - Pagina 33
GVMD - Pagina 34
GVMD - Pagina 35
GVMD - Pagina 36
GVMD - Pagina 37
GVMD - Pagina 38
GVMD - Pagina 39
GVMD - Pagina 40
GVMD - Pagina 41
GVMD - Pagina 42
GVMD - Pagina 43
GVMD - Pagina 44
GVMD - Pagina 45
GVMD - Pagina 46
GVMD - Pagina 47
GVMD - Pagina 48

Conținut arhivă zip

  • Gestiunea volumelor mari de date.pdf

Alții au mai descărcat și

Programare evolutivă și algoritmi genetici

Introducere Ideea de a aplica principiile darwiniste ale evolutiei in rezolvarea automata a problemelor (Problem Solving - PS) dateaza din anii...

Metoda Dijkstra

1) Fiecărui nod iÎV i s-a asociat o variabilă d(i) numită în continuare eticheta nodului i. Prin definiție d(s) = 0 . În oricare moment al...

România în mișcare

INTRODUCERE România în mișcare este un proiect care are scop evidențierea necesității sistemelor adaptive complexe în viața unui om. Având în...

Analiza informațional - decizională - Departamentul de web developer

. Cunoașterea generală a mecanismului economic Studiul de caz reprezinta o analiza informational - decizionala a sistemului reprezentat prin...

BCE - Seminare 1-5

BCE Seminar 1 Sistemele dinamice discrete Clasificare: Un sistem dinamic discret este o secven.a de func.ii yt, care exprima valorile...

Proiectarea arhitecturii sistemelor informatice

Aspecte generale ale proiectării sistemelor informatice - Proiectarea sistemului informatic constă în stabilirea soluțiilor logice și specificarea...

Structuri de date și algoritmi

Înainte de a elabora un algoritm, trebuie să ne gândim la modul în care reprezentăm datele. Structurile fundamentale de date cu care se poate opera...

Ai nevoie de altceva?