GVMD

Imagine preview
(7/10 din 1 vot)

Acest curs prezinta GVMD.
Mai jos poate fi vizualizat cuprinsul si un extras din document (aprox. 2 pagini).

Arhiva contine 1 fisier pdf de 48 de pagini .

Iti recomandam sa te uiti bine pe extras, cuprins si pe imaginile oferite iar daca este ceea ce-ti trebuie pentru documentarea ta, il poti descarca.

Fratele cel mare te iubeste, acest download este gratuit. Yupyy!

Domeniu: Cibernetica

Cuprins

DEPOZITE DE DATE. - 3 -
1. Modelul de date multidimensional . - 3 -
1.1. Structura modelului multidimensional . - 3 -
1.2. Operaţii realizate asupra modelului multidimensional . - 7 -
1.3. Restricţii de integritate . - 8 -
1.4. Modele de reprezentare a obiectelor depozitelor de date . - 9 -
2. Organizarea datelor în depozite de date . - 11 -
2.1. Inteligenţa Afacerii – aspecte fundamentale . - 11 -
2.2. Principalele tehnologii informatice utilizate în sistemele pentru Inteligenţa Afacerii- 12 -
2.3. Evoluţia şi definirea depozitelor de date . - 13 -
2.4. Obiectivele şi caracteristicile organizării datelor în depozitele de date . - 15 -
2.5. Facilităţi oferite de depozitele de date sistemelor de Inteligenţa Afacerii . - 17 -
3. Arhitectura depozitelor de date . - 18 -
3.1. Arhitectura pe componente a depozitelor de date . - 18 -
3.2. Arhitectura pe niveluri a depozitelor de date . - 19 -
3.3. Arhitectura depozitelor de date din punctul de vedere funcţional . - 20 -
4. Tipuri de depozite de date. - 21 -
4.1. Tipuri de depozite de date în funcţie de aria de cuprindere . - 21 -
4.2. Tipuri de depozite de date în funcţie de procesele decizionale pentru care au fost proiectate . - 22 -
4.3. Tipuri de depozite de date în funcţie de modelul de date implementat . - 22 -
5. Aspecte comparative privind organizarea datelor în baze de date şi în depozite de date . - 23 -
REALIZAREA DEPOZITELOR DE DATE . - 25 -
1. Considerente privind realizarea depozitelor de date . - 25 -
1.1. Modalităţi de realizare a depozitelor de date . - 25 -
1.2. Metodologii utilizate la realizarea depozitelor de date . - 26 -
2. Etape de realizare a depozitelor de date . - 28 -
2.1. Strategia de realizare a depozitelor de date . - 28 -
2.2. Modelarea depozitelor de date . - 31 -
2.3. Implementarea depozitelor de date . - 34 -
2.4. Exploatarea depozitelor de date . - 42 -
2.5. Criterii de evaluare a depozitelor de date . - 44 -
2.6. Instrumente şi medii de dezvoltare utilizate pentru realizarea depozitelor de date . - 45 -
BIBLIOGRAFIE . - 47 -

Extras din document

DEPOZITE DE DATE

Un depozit de date furnizează o sursă integrată şi centralizată de date, separată de sistemul tranzacţional, care conţine datele esenţiale despre activitatea companiei din multitudinea de surse de date existente. Rapoartele obţinute pe baza acestor date sunt utilizate ca un instrument de analiză strategic şi competitiv, analizele rapide şi corecte putând influenţa deciziile privind evoluţia organizaţiei pe termen mediu şi lung.

Cuvinte cheie: depozite de date, cub de date, schema de tip stea, model multidimensional, dimensiuni, fapte, măsuri.

1. Modelul de date multidimensional

Depozitele de date sunt organizate diferit faţă de bazele de date, fiind destinate mai mult extragerii de date decât actualizărilor repetate. Datele extrase sunt utilizate în analize dinamice care presupun schimbări de perspectivă asupra datelor şi vizualizări ale acestora de la un nivel detaliat la unul sintetic, agregat şi invers. Din acest motiv s-a impus o organizare specifică a datelor în care obiectele sunt structurate pe diferite niveluri care permit această analiză dinamică.

Modelele de date utilizate pentru reprezentarea depozitelor de date au cunoscut o diversitate destul de mare atât din punctul de vedere al teoretizării conceptelor cât mai ales din punctul de vedere al aplicării diferitelor tipuri de modele în practică. Două direcţii importante au clasificat totuşi această diversitate de modele şi anume dezvoltarea unor extensii ale modelului relaţional şi dezvoltarea modelelor bazate pe cuburi n-dimensionale.

Tipul de model multidimensional utilizat de diverse tehnologii şi produse software care implementează depozitele de date diferă atât din punctul de vedere al SGBD utilizat cât şi din cel al operaţiilor realizate asupra datelor şi a arhitecturii implementate.

1.1. Structura modelului multidimensional

Structura modelului multidimensional conţine în principal obiectele referitoare la tabelele de fapte cu atribute de tip măsuri sau metrici, tabelele de tip dimensiune în care regăsim niveluri ierarhice, atribute de identificare şi atribute de descriere etc. Aceste obiecte vor fi prezentate în continuare.

În cadrul modelului multidimensional se întâlnesc mai multe tipuri de obiecte care prezintă o importanţă deosebită în analiză [KIRE98].

Dimensiunile – reprezintă structuri compuse formate din atribute structurate pe diverse niveluri ierarhice în funcţie de care sunt grupate datele. Aceste atribute sunt de obicei descriptive şi sunt folosite ca sursă pentru limitarea înregistrărilor afişate în cadrul rapoartelor analitice. Sunt considerate tabele secundare datorită dimensiunilor reduse. Consiliul OLAP, un consorţiu al firmelor dezvoltatoare de produse OLAP înfiinţat în 1995 cu rolul de a standardiza aceste tehnologii prin stabilirea unor standarde deschise (OLAP API), defineşte conceptul de dimensiune ca fiind “un atribut structural al unui cub care constă dintr-o listă de membri, pe care utilizatorii îi percep ca fiind de acelaşi tip (de exemplu toate lunile, trimestrele, anii formează dimensiunea Timp). Dimensiunile reprezintă un mod foarte concis, intuitiv de organizare şi selectare a datelor pentru

explorare şi analiză.” [OLAP95].

Datele dintr-o dimensiune sunt structurate ierarhic, pe mai multe niveluri, fiecare dintre acestea putând avea mai multe atribute.

Ierarhiile – sunt structuri logice utilizate pentru ordonarea nivelurilor de reprezentare a datelor. Sunt utilizate şi pentru definirea căilor de navigare în interiorul dimensiunilor şi oferă instrumentelor de analiză OLAP posibilitatea de detaliere graduală a datelor în rapoarte. Tot în definiţiile date de Consiliul OLAP se menţionează că „membrii dimensiunilor pot fi organizaţi pe baza relaţiilor de tip părinte-copil, unde un membru părinte reprezintă agregarea membrilor copil. Rezultatul este o ierarhie şi relaţiile părinte-copil sunt relaţii ierarhice” [OLAP95].

Nivelurile – reprezintă poziţii în cadrul ierarhiilor, cu exemplificare pe dimensiunea Produs (figura 1). De exemplu dimensiunea Timp poate avea trei niveluri de ierarhizare: an, trimestru şi lună. Relaţiile între diferite niveluri sunt relaţii de tipul părinte-copil, însă se pot defini ierarhii în care datele fiecărui nivel sunt agregate la un nivel imediat superior sau se poate sări peste anumite niveluri care sunt independente.

Figura 1. Ierarhii şi niveluri ale dimensiunii Produs

Nivelurile unei ierarhii sunt esenţiale pentru determinarea tipurilor de navigări care se pot realiza în dimensiuni. Tot consiliul OLAP precizează următoarele „doi membri ai unei ierarhii sunt de aceeaşi generaţie dacă ei au acelaşi număr de strămoşi. Termenii de generaţie şi nivel sunt necesari pentru a descrie subgrupuri de membri întrucât, de exemplu, deşi doi fraţi membri au acelaşi părinte şi sunt de aceeaşi generaţie, ei ar putea să nu fie la acelaşi nivel, dacă unul din fraţi are un copil şi celălalt nu.” [OLAP95]

Atributele – dimensiunile conţin atribute care reprezintă calificative specifice. Orice atribut se asociază unei singure dimensiuni, iar o dimensiune se poate exprima prin mai multe atribute. Există două tipuri de atribute: de identificare a dimensiunii şi a fiecărui nivel în parte şi atribute descriptive care realizează o clasificare a datelor în cadrul ierarhiei.

Tabelele de fapte – sunt tabelele centrale care conţin atribute de tip măsuri (metrici) şi chei externe către tabelele dimensiuni. Aceste obiecte conţin de obicei date numerice care pot fi însumate şi analizate pe fiecare nivel din ierarhiile dimensiunilor.

Măsurile (metricile)- corespund atributelor (faptelor) din tabelele de fapte şi sunt de regulă de natură numerică (de exemplu: volumul vânzărilor, costurile, stocurile disponibile). Aceste variabile au sens numai în contextul unor anumite dimensiuni. Valoarea măsurii este calculată pentru un punct dat prin agregarea datelor corespondente perechii aferente valoare-dimensiune, diferite pentru punctul dat.

Sunt mai multe criterii după care se pot clasifica măsurile utilizate într-o tabelă de fapte, şi anume: modalitatea de calcul, tipurile de funcţii agregate utilizate, modalităţile de însumare şi agregare în funcţie de dimensiuni.

În funcţie de modalitatea de calcul atributele se pot clasifica în măsuri de bază, care se

regăsesc sub forma atributelor din tabelele de fapte şi care provin din sursele de date şi măsuri derivate (virtuale) care se obţin prin combinarea măsurilor de bază şi care în tabelele de fapte au precizată formula de calcul prin care se obţin.

Fisiere in arhiva (1):

  • Gestiunea volumelor mari de date.pdf

Bibliografie

[AGGU97] Agrawal R., Gupta A., Sarawagi S. - Modeling multidimensional databases, 13th International Conference on Data Engineering, 1997 [ANDE97] Anahory S., Dennis, M. - Data Warehousing in the Real World, Addison Wesley Longman, Reading, Mass, 1997 [BALU08] Bâra A., Lungu I., Velicanu M., Diaconiţa V., Botha I. – Improving query performance in virtual data warehouses, WSEAS Transactions on Information Science and Applications, vol. 5, nr. 5, Mai 2008, ISSN: 1709-0832. [DEVL97] Devlin, B. - Data Warehouse – from Architecture to Implementation, Addison Wesley Longman, Reading, Mass, 1997 [DIBO08] Diaconiţa V., Botha I., Bâra A., Lungu I., Velicanu M. – Two integration flavors in public institutions, Revista WSEAS Transactions on Information Science and Applications, volumul 5, numărul 5, pp. 806-815, ISSN: 1709-0832, Mai 2008 [ERIC08] Erickson J. - Data Warehousing gets extreme, Oracle Magazine, vol. XXII, ISSUE 6, November/December 2008. [GOMA98] Golfarelli M., Maio D, Rizzi S. - Conceptual design of data warehouses from E/R schemes, Proceeding of HICSS-31, Hawaii, 1998 [GRBO96] Gray J., Bosworth A., Layan A., Pirahesh H. - Data Cube: A relational aggregation operator generalizing group by, cross-tabs and sub-totals,Proc. of the 12th International Conference of Data Engineering, 1996 [GRWA98] Gray P., Watson H. – Decision Support in the Data Warehouse, Prentice Hall, 1998. [HOLL00] Holland, P. - Traditional data warehouses vs virtual data warehouses, White Paper, March, 2000 [INMO96] Inmon, W.H. - Building the Data Warehouse, John Wiley & Sons, New York, 1996 [INMO99] Inmon, B. - Data mart does not equal data warehouse, DM Direct Newsletter, November, 1999 [JAJE98] Jarke M., Jeusfeld M.A., Quix C., Vassiliadis P.- Architecture and quality in data warehouses, Proceedings CaiSE 98, Pisa, Italy, 1998 [KIMB96] Kimball R. - The Data Warehouse Toolkit, John Wiley & Sons, New York, 1996 [KIRE98] Kimball R., Reeves L., Ross M., Thornthwaite W. - The data Warehouse Lifecycle Toolkit, John Wiley&Sons, Inc., New York, 1998. [LUBA07] Lungu I, Bâra A – Sisteme informatice executive, editura ASE, 2007
[OLAP95] The OLAP Council Definitions, www.olapcouncil.org, ianuarie 1995 [POWE00] Power D.J. - Decision Support Systems: Concepts and Resources, Cedar Falls, IA: DSSresources.com, http://dssresources.com/dssbook, 2000 [TEST00] Teste O. - Towards Conceptual Multidimensional Design in DecisionSupport Systems, Dexa 2000, LNCS 1873, Londra, 2000 [VELU09] Velicanu M., Lungu I. ş.a. – Sisteme de baze de date evoluate, ed. ASE, ISBN 978-606-505-217-8, 2009. [VEMA07] Velicanu M., Matei Gh. – A few implementation solutions for Business Intelligence, Revista Informatica Economica nr. 3/2008, ISSN 1453-1305. [VEMA07a] Velicanu M., Matei Gh. – Building a data warehouse step by step, Revista Informatica Economică nr 2/2007, pag. 83-89, ISSN 1453-1305, 2007 [VEMA07b] Velicanu M., Matei Gh.– Database vs Data Warehouse, Revista Informatica Economică nr 3/2007 (43), pag. 91-95, ISSN 1453-1305, 2007 [VEMA10] Velicanu M., Matei Gh. – Tehnologia Inteligenţa Afacerii, Editura ASE Bucureşti, ISBN 978-606-505-311-3, 2010 [VILA97] Vilan A. – Data warehouses, data marts şi data mining, Revista Computerworld România, nr. 18 (88), 21 Octombrie 1997