Data mining

Proiect
8/10 (3 voturi)
Domeniu: Statistică
Conține 3 fișiere: pdf, spo, sav
Pagini : 10 în total
Cuvinte : 1999
Mărime: 1.00MB (arhivat)
Publicat de: Marius Mitu
Puncte necesare: 9
Profesor îndrumător / Prezentat Profesorului: Ruxandra Ghoeghe
Aplicaţie numerică la metoda "Analiza componentelor principale" prezentat la master ASE

Extras din proiect

PROIECT 1: Aplicaţie numerică la una dintre următoarele doua teme: Analiza componentelor principale sau Analiza Factorială (max. 10 pagini);

REZOLVARE: Un studiu personal urmăreşte, în diferite judeţe ale ţării noastre, modul de încadrare a forţei de muncă în diferite ramuri industriale. Datele sunt sub formă de procentaje şi se găsesc în fişierul ACP.SAV. Variabilele sunt Judeţ – prescurtarea judeţului ţării, Agr – procentajul de muncitori din agricultură, Min – procentajul de muncitori din minerit, Man – procentajul de muncitori din industria prelucrătoare, Eng – procentajul de muncitori din industria energetică, Con – procentajul de muncitori din construcţii, SV – procentajul de muncitori din servicii, Fin – procentajul de muncitori din finanţe, SVS – procentajul de muncitori din servicii sociale, TC – procentajul de muncitori din transporturi şi comunicaţii, aşa cum se vede în imaginea de mai jos:

Pentru a aplica analiza factorială, prin natura metodei, trebuie ca între variabile să existe corelaţii suficient de mari pentru a avea sens problema reducerii dimensiunii. Prin urmare, dacă o variabilă nu este corelată cu celelalte va trebui exclusă din analiză. În acelaşi timp, nici corelaţiile foarte mari (multicoliniaritatea) nu conduc la rezultate uşor de interpretat, situaţia extremă fiind cea de singularitate, a existenţei variabilelor perfect corelate. În asemenea cazuri este imposibil să se determine contribuţia individuală la un factor a variabilelor. Prin urmare este necesar să se calculeze şi să se analizeze matricea de corelaţii a variabilelor prin Analyse  Correlate  Bivariate, inclusiv determinantul acestei matrice pentru determinarea multicoliniarităţii.

Variabilele procesate se trec în lista Variables şi bifăm opţiunile ca în imaginea de mai jos, apoi click pe butonul Options.

Se recomandă analizarea corelaţiilor pentru a identifica variabilele care nu sunt corelate cu celelalte (şi care pot fi eventual omise din analiză, dacă nu se doreşte mai degrabă reducerea numărului de variabile decât analiza corelaţiilor). Continue  OK şi obţin corelaţiile:

Preview document

Data mining - Pagina 1
Data mining - Pagina 2
Data mining - Pagina 3
Data mining - Pagina 4
Data mining - Pagina 5
Data mining - Pagina 6
Data mining - Pagina 7
Data mining - Pagina 8
Data mining - Pagina 9
Data mining - Pagina 10

Conținut arhivă zip

  • ACP.pdf
  • ACP.sav
  • ACP.spo

Alții au mai descărcat și

Analiza statistică a seriilor cronologice

DEFINITIE: SERIA CRONOLOGICA este un sir ordonat de valori ale unei variabile aferente unor momente sau perioade de timp succesive. Exista...

Cercetare Asupra Vopselei Lavabile Superweiss

Düfa ROMÂNIA SRL este una dintre cele mai dinamice companii ce opereaza pe piata de lacuri si vopsele din România. Compania a fost fondata în anul...

Program de Reabilitare

Spitalul de Boli Infectioase „Sf.Cuvioasa Parascheva „ este situat in partea de nord a orasului Galati pe strada Traian nr.393 ,în cartierul numit...

Centralizarea și Analiza Datelor

Q1+Q2. La aceste intrebari filtru, nici unul dintre cei 1000 de respondenti nu a fost eliminat Valoarea modala (Mo – cea mai mare frecventa de...

Statistică Economică

Obiectul principal în evolutia repartitiei bidimensionale îl reprezinta determinarea legaturii statistice dintre aceste doua variabile. În orice...

Te-ar putea interesa și

Analiza rentabilității la SC Petal SA

INTRODUCERE În pragul mileniului trei este incontestabil nu numai faptul că lumea se află într-un proces continuu de schimbare, dar şi că ritmul...

Sisteme Informatice de Asistare a Activității unui Cabinet Veterinar

1. Decizie, decidenţi 1.1. Concepte de bază Domeniul teoriei deciziei se caracterizează prin existenţa mai multor concepte de bază. În continuare...

Identificarea șabloanelor frecvente

Data mining poate produce rezultate remarcabile pentru aproape orice organizatie care colecteaza date de la proprii clienti, de la piete comerciale...

Arhitectura software pentru data mining

Georges Edouard Kouamou, National Advanced School of Engineering, Cameroon 1. Introducere Data Mining cunoscut și sub denumirea Knowledge...

Data mining

Scurt istoric al OLAP Bazele de date nu sunt un domeniu foarte atractiv. Desi afacerile in acest domeniu sunt impresionante, iar aplicatiile care...

Folosirea metodelor de data mining pentru analiza poluării aerului în Europa

1. Scopul proiectului Poluarea aerului este introducerea chimicalelor, particulelor, materialelor biologice sau a altor materiale nocive in...

Analiza statistică a turismului - data mining

Introducere Data mining-ul reprezintă procesul de extracţie a informaţiilor din seturi mari de date. Cu alte cuvinte mineritul în date, presupune...

Data Mining - Metodă Modernă de Explorare și Manipulare a Datelor

Introducere Data mining este rezultatul firesc al evoluţiei tehnologiei informaţiei determinat de creşterea volumului de date produs de societatea...

Ai nevoie de altceva?