Data Mining

Imagine preview
(7/10 din 2 voturi)

Acest referat descrie Data Mining.
Mai jos poate fi vizualizat cuprinsul si un extras din document (aprox. 2 pagini).

Arhiva contine 1 fisier doc de 13 pagini .

Iti recomandam sa te uiti bine pe extras, cuprins si pe imaginile oferite iar daca este ceea ce-ti trebuie pentru documentarea ta, il poti descarca. Ai nevoie de doar 5 puncte.

Domeniu: Economie

Cuprins

Scurt Istoric al OLAP.3
Noile tehnologii ale informaticii decizionale in mediul informatizat al intreprinderii.4
Data Mining.6
Concluzii.12
Bibliografie.13

Extras din document

Scurt istoric al OLAP

Bazele de date nu sunt un domeniu foarte atractiv. Desi afacerile in acest domeniu sunt impresionante, iar aplicatiile care utilizeaza baze de date sunt omniprezente, lipsa de interes din partea publicului este explicabila: fiind unul dintre cele mai vechi domenii de aplicare a computerelor, tehnologiile sunt mature, iar evolutiile spectaculoase sunt rare. Pe de alta parte, suntem prea obisnuiti cu aplicatiile de acest gen, le vedem in fiecare zi. Ceea ce observam este insa ca aceste aplicatii sunt excelente pentru a obtine informatii punctuale, dar sunt destul de nepricepute cand e vorba de a furniza informatii sintetice care sa serveasca pentru analize economice si, in final, sa sprijine decizia manageriala. Aici este zona cea mai fierbinte a domeniului.

Inca de la sfarsitul anilor ’80 specialistii au cazut de acord ca pentru aplicatiile de analiza economica (OLAP - Online Analytical Processing) cea mai buna varianta este crearea unei baze de date separate, care sa fie alimentata din bazele de date operationale, precum si din alte surse publice. Ideea centrala este ca aceasta baza de date sa fie astfel structurata incat sa faciliteze explorarea datelor pentru analiza. Pentru ca aceasta constructie trebuia sa se cheme cumva, specialistii au vrut sa-i spuna “depozit de informatii”, dar pana la urma termenul care s-a incetatenit a fost Data Warehouse (depozit de date). Pe parcursul anilor ’90 a fost foarte in voga si o multime de firme de consultanta au facut bani frumosi exploatand acest domeniu. Rata de succes a implementarilor a ramas destul de scazuta in vremea cand termenul a fost in voga, dar a crescut in anii cand despre depozite de date se vorbea doar in cercurile de specialisti. In teorie, e foarte simplu. Intr-un depozit de date, organizarea informatiilor este bazata pe asa-numite dimensiuni. O dimensiune uzuala este timpul, ceea ce inseamna ca orice piesa de informatie trebuie calificata temporal. O alta dimensiune este de obicei geografia pietei. Se pot imagina diferite alte dimensiuni - cum ar fi gama de produse, canalele de distributie -, dar cele mai valoroase sunt cele care pot fi structurate ierarhic. De exemplu, timpul se poate exprima in ani, anii in trimestre, trimestrele in luni si asa mai departe. Geografia pietei se poate exprima in regiuni, regiunile pot fi compuse din judete etc. Pe baza acestor ierarhii, datele sunt agregate in “calupuri” rezumative pregatite pentru analiza. Este evident ca pentru un manager informatia de detaliu este mai putin interesanta decat datele agregate - intrebarile pe care si le pune nu sunt de genul “cate perechi de pantofi a vandut un cutare magazin in ziua de 17 mai 2008”, ci mai degraba “cum au oscilat veniturile din cutare gama de produse in zona Moldova in ultimii trei ani, defalcat pe trimestre”. O alta caracteristica a depozitelor de date este ca aduc in ecuatie si date externe: de exemplu, datele demografice obtinute prin recensamant pot fi foarte utile acolo unde vanzarile vizeaza anumite categorii socio-profesionale, grupe de varsta si asa mai departe.

In practica, lucrurile sunt ceva mai complicate. Poate cea mai dezagreabila parte a implementarii o reprezinta “curatirea datelor” care intra in depozit (data cleaning), deoarece implica operatii destul de delicate. E suficient sa ne gandim la moduri diverse de exprimare a adreselor postale sau a datelor calendaristice pentru a ne imagina ce inseamna aducerea lor intr-o forma unica si utilizabila. Insa efortul merita, pentru ca aceste structuri multidimensionale (“cuburi de date”) permit o serie intreaga de utilizari in domeniul analizei, prin operatii tipice - de pilda, prin “drill down” se detaliaza o anumita dimensiune, in timp ce prin “drill up” se merge spre general, sectiunile pe baza anumitor dimensiuni produc viziuni specifice anumitor manageri de specialitate si inca multe altele.

Noile tehnologii ale informaticii decizionale in mediul informatizat al intreprinderii

Pentru ca factorii decidenti, reprezentati de conducerea intreprinderii, sa dispuna de o informare relevanta, obiectiva, oportuna si care sa reflecte realitatea economica si , nu una impregnata in mod excesiv de influente de natura juridico-fiscala, sistemele informationale si in primul rand cele financiar-contabile, trebuie sa puna la dispozitia managerilor atat informatii de sinteza privind lichiditatea agentilor si informatii curente privind controlul bugetelor, cat si informatii previzionale legate de estimarea fluxurilor de trezorerie viitoare, care vor fi generate de diferitele activitati ale intreprinderii. Pe de alta parte, o gestiune a trezoreriei care sa raspunda acestor cerinte informationale, nu poate fi conceputa decat in contextul proiectarii si utilizarii unui sistem informatic modern, pentru asistarea deciziilor. Si pentru a contura sfera de actiune a sistemelor informatice de asistare a deciziei, este necesara definirea teoriilor referitoare la fundamenterea deciziilor, etapele procesului decizional, precum si , motivatiile unui demers decizional, in mediul informatizat al intreprinderii.

Conditiile specifice si circumstantele in care o problema organizationala poate fi rezolvata sunt dictate, in ultima instanta, de modul in care este adoptata decizia. Aceasta poate fi definita ca un proces de reflectie succeptibil de a naste rationamente, in scopul rezolvarii unei probleme cu care se confrunta intreprinderile intr-un context decizional real. Plecand de la intrebarea „ cum isi adopta managerii deciziile ?”, se pot identifica patru mari faze ale procesului decizional si anume :

- Informarea generala sau diagnosticul;

- Proiectarea modelului;

- Alegea solutiei;

- Implementarea modelului .

In faza de informare, decidentul trebuie sa procedeze la sintetizarea problemelor legate de subiectul in studiu, explorand toate informatiile de care dispune, necesare fundamentarii unei decizii viitoare. Prin aceasta, el analizeaza solutiile potentiale, reflecteaza asupra informatiilor provenite din mediul extern al intreprinderii si nu in ultimul rand, defineste si cauta pe cat posibil , sa-si completeze competentele pentru a rezolva toate problemele circumscrise sferei sale decizionale .

Faza de proiectare include toate activitatile legate de intelegerea contextului decizional si de testare a solutiilor pentru a face posibila evaluarea pertinentei si fezabilitatii problemei decizionale . In acest sens , decidentul isi construieste propriile solutii plecand de la informatiile cunoscute , realizand o serie de scenarii menite sa gaseasca informatii suplimentare. Daca informatiile initiale sunt insuficiente, exista posibilitatea de intoarcere la faza precedenta pentru a culege informatii noi, care sa conduca la un nou diagnostic.

Fisiere in arhiva (1):

  • Data Mining.doc