Data mining

Referat
8.7/10 (4 voturi)
Domeniu: Economie
Conține 1 fișier: docx
Pagini : 11 în total
Cuvinte : 1780
Mărime: 424.90KB (arhivat)
Publicat de: Savina Lupu
Puncte necesare: 6

Cuprins

  1. Introducere 3
  2. 1.Tehnici de data mining 3
  3. 1.1 Tehnici de data mining folosind WEKA 3
  4. 1.2 Utilizarea WEKA 4
  5. 2. Baza de date 5
  6. 2.1 Prezentarea bazei de date 5
  7. 2.2 Corelatiile dintre elementele bazei de date 6
  8. 3. Concluzii 11

Extras din referat

Introducere

Numarul utilizatorilor de Internet creste in fiecare zi semnificativ, aceasta insemnand faptul ca o buna parte din populatia globului utilieaza internetul. In aceste conditii modul in care sunt gandite afacerile trebuie schimbate.

Multe firme care in conditiile secolului trecut, nici macar nu puteau visa ca ar putea s aiba un anumit volum de activitate sau ca ar putea sa faca fata concurentei gigantilor din industrial lor, au reusit sa se bucure de un mare succes. E-business este cheia pentru a face viata mai usoara pentru oameni.

Cunoasterea mediului e-business este esntiala pentru a putea face afaceri in acest secol. Mai mult, trebuie intelese si aplicate noile tehnologii de extragere a cunostintelor din date.

Data mining se concretizeaza prin aplicarea unor algorimti specifici pentru extragerea modelelor din date. Pasii suplimentari ai procesului de descoperire a cunostintelor din date, cum sunt prepararea datelor, selectarea datelor, etapa de curatare, integrarea cunostintelor anterioare necesare sunt esentiale pentru a asigura ca se vor extrage cunostinte folositoare din date.

1.Tehnici de data mining

Exista doua clase fundamentale de metode invatare:

- Predictive (bazata pe invatare supervizata) ce utilizeaza un set de variabile (numite predictor) prin intermediul carora se realizeaza predictii relative la valorile (continue sau discrete) ale altor variabile (numite variabile de decizie)

- Descriptive ( bazate pe invatare nesupervizata) destinate extragerii unor patternuri (structuri inteligibile) din date

1.1 Tehnici de data mining folosind WEKA

“Weka” provine de la Mediul Waikato pentru Analiza Cunostiintelor si a fost dezvoltat la Universitatea Waikato din Noua Zeelanda . WEKA este extensibil si a devenit o colectie de algoritmi pentru invatare in scopul rezolvarii problemelor de data mining din lumea reala. A fost implementat in limbajul Java si ruleaza aproape pe orice platforma.

Mediul de lucru WEKA contine o colectie de instrumente de vizualizare si algoritmi de analiza a datelor si modelare predictiva. WEKA exercita mai multe roluri de data mining, in mod special procesarea datelor,gruparea, clasificarea, regresia, vizualizarea si selectie caracteristica.

Acesta poate fi utilizat in oricare dintre interfetele:

- Linia de comanda ( CLI)

- Interfata grafica a utilizatorului

Programul WEKA apare asa:

1.2 Utilizarea WEKA

Butoanele pot fi folosite pentru deschiderea urmatoarelor aplicatii:

• Explorer : acesta este mediul de explorare a datelor cu WEKA oferind acces la toate facilitatile programului

• Experimenter : acesta ofera raspunsul la intrebarea : care metode si care parametrii de lucru functioneaza cel mai bine pentru solutionarea problemei

• KnowledgeFlow: aceeasi functie ca si Explorer. Permite proiectarea configuratiilor de date pentru datele aflate in prelucrare. Algoritmii elementari pot fi folositi pentru procesarea datelor de dimensiuni mari.

• Simple CLI : o interfata pentru linia de comanda in vederea executarii comenzilor directe WEKA.

Interfata Explorer are mai multe panouri care ofera acces la componentele principale ale mediului de lucru:

• Panoul Preprocessing- care dispune de facilitati pentru importul de date dintr-o baza de date, un fisier CSV etc si pentru preprocesarea acestor date cu ajutorul unui algoritm de filtrare. Este posibila transformarea datelor si stergerea atributelor in functie de criterii specifice.

• Panoul Classify- permite aplicarea clasificarii si a regresiei algoritmilor, in vederea estimarii unei precizii rezultate in mod predictiv, precum si vizualizarea unei previziuni eronate

• Panoul Associate ofera acces la invatarea regulilor de asocierea, care incearca sa identifice importanta interdependentei dintre atribute.

• Panoul Clauster ofera acces la tehnicile de grupare in WEKA, in vederea alegerii si rularii metodei de grupare a datelor

• Panoul Select Attributes, functioneaza in vederea oferirii algoritmilor pentru identificarea atributelor celor mai predictive intr-un set de date

• Panoul Vizualize permite vizualizarea setului curent de date in una sau doua dimensiuni , cu ajutorul unor diferiti operatori de selectie.

Acest proiect va demonstra aplicarea celor doua tehnici de data mining in WEKA :

- Clustering

- Regresia liniara

Preview document

Data mining - Pagina 1
Data mining - Pagina 2
Data mining - Pagina 3
Data mining - Pagina 4
Data mining - Pagina 5
Data mining - Pagina 6
Data mining - Pagina 7
Data mining - Pagina 8
Data mining - Pagina 9
Data mining - Pagina 10
Data mining - Pagina 11

Conținut arhivă zip

  • Data Mining.docx

Alții au mai descărcat și

Fondul European de Dezvoltare Regională

O dată cu aderarea Danemarcei, Irlandei şi Regatului Unit, la 1 ianuarie 1973, Comunitatea Europeană s-a extins şi s-a simţit tot mai acut nevoia...

Mediul extern al SC Agdesy SRL - oportunități și restricții

Analiza macro-mediului intreprinderii Studiul macro-mediului intreprinderii permite depasirea orizontului mediului concurential deoarece...

Statistică

1) Să se calculeze valorile medii şi ale celor 40 de înregistrări = = =9,23875 puncte Interpretare: punctajul mediu obţinut la bac de cei 40 de...

Estimarea mediei prin interval de încredere - Testarea statistică

Prin aceasta tema se urmareste estimarea prin interval de incredere a ratei somajului in anul 2014 la nivelul Romaniei, pe baza prelucrarii datelor...

Analiza structurii și dinamicii cheltuielilor publice din bugetul de stat al României

1. Structura cheltuielilor publice din bugetul de stat – criterii şi component Sistemul cheltuielilor publice cuprinde totalitatea cheltuielilor...

România în ecuația integrării europene

Reforme institutionale si politice in U.E. inaintea procesului de largire. Actuala forma de organizare ce cuprinde 15 tari membre nu mai...

Aplicație statistică

I. Pt. 50 de salariati se cunosc timpul efectiv de lucru si salariul realizat: Nr. Crt Timpul efectiv lucrat(X) Salariul realizat (Z) 1 105...

Evoluția PIB în România în perioada 1990 - 2003

O economie dezvoltată se caracterizează prin creştere economică, dar şi printr-un nivel ridicat de civilizaţie, exprimat prin nivelul de cultură,...

Te-ar putea interesa și

Analiza rentabilității la SC Petal SA

INTRODUCERE În pragul mileniului trei este incontestabil nu numai faptul că lumea se află într-un proces continuu de schimbare, dar şi că ritmul...

Sisteme Informatice de Asistare a Activității unui Cabinet Veterinar

1. Decizie, decidenţi 1.1. Concepte de bază Domeniul teoriei deciziei se caracterizează prin existenţa mai multor concepte de bază. În continuare...

Identificarea șabloanelor frecvente

Data mining poate produce rezultate remarcabile pentru aproape orice organizatie care colecteaza date de la proprii clienti, de la piete comerciale...

Arhitectura software pentru data mining

Georges Edouard Kouamou, National Advanced School of Engineering, Cameroon 1. Introducere Data Mining cunoscut și sub denumirea Knowledge...

Data mining

Scurt istoric al OLAP Bazele de date nu sunt un domeniu foarte atractiv. Desi afacerile in acest domeniu sunt impresionante, iar aplicatiile care...

Folosirea metodelor de data mining pentru analiza poluării aerului în Europa

1. Scopul proiectului Poluarea aerului este introducerea chimicalelor, particulelor, materialelor biologice sau a altor materiale nocive in...

Analiza statistică a turismului - data mining

Introducere Data mining-ul reprezintă procesul de extracţie a informaţiilor din seturi mari de date. Cu alte cuvinte mineritul în date, presupune...

Data Mining - Metodă Modernă de Explorare și Manipulare a Datelor

Introducere Data mining este rezultatul firesc al evoluţiei tehnologiei informaţiei determinat de creşterea volumului de date produs de societatea...

Ai nevoie de altceva?