Cuprins
- Capitolul I. Obiectivul proiectului.4
- Capitolul II. Crearea bazei de date.5
- 2.1. Identificarea variabilelor statistice.5
- 2.2. Definirea variabilelor si introducerea datelor.6
- Capitolul III. Descrierea statistica a variabilelor.7
- 3.1. Descrierea statistica a variabilelor categoriale .7
- 3.1.1. Valoarea dominanta a variabilelor categoriale.7
- 3.1.2. Diagrama de structura.8
- 3.2. Descrierea statistica a variabilelor numerice.8
- 3.2.1. Nivelul mediu.8
- 3.2.1.1. Media aritmetica.9
- 3.2.1.2. Modul.10
- 3.2.1.3. Mediana. 11
- 3.2.1.4. Quantilele. 12
- 3.2.1.5. Decilele. 13
- 3.2.1.6. Diagrama box plot. 14
- 3.2.1.7. Mediala. 14
- 3.2.2. Indicatori ai dispersiei.15
- 3.2.2.1. Amplitudinea variatiei. 15
- 3.2.2.2. Abaterea individuala.16
- 3.2.2.3. Abaterea medie liniara.16
- 3.2.2.4. Varianta.16
- 3.2.2.5. Abaterea medie patratica. 16
- 3.2.2.6. Intervalul mediu de variatie.17
- 3.2.2.7. Coeficientul de variatie.17
- 3.2.3. Asimetria.18
- 3.2.3.1. Coeficientul Yule.18
- 3.2.3.2. Coeficientul de asimetrie empiric Pearson.19
- 3.2.3.3. Coeficientul de asimetrie Pearson.19
- 3.2.3.4. Coeficientul de asimetrie Fisher.19
- 3.2.4. Boltirea.19
- 3.2.4.1. Coeficientul de boltire Pearson. 20
- 3.2.4.2. Coeficientul de boltire Fisher.20
- 3.2.5. Indicatori ai concentrari.21
- 3.2.5.1. Curba de concentrare. 21
- 3.2.5.2. Abaterea mediala – mediana. 22
- 3.2.5.3. Coeficientul de concentrare. 23
- 3.2.5.4. Coeficientul abaterii medii Gini.23
- 3.2.5.5. Indicele de concentrare Gini. 23
- Capitolul IV. Inferenta statistica. 25
- 4.1. Estimarea prin interval de incredere a unei medii. 25
- 4.2. Estimarea prin interval de incredere a unei proportii.26
- 4.3. Testarea unei valori medii cu o valoare fixa.27
- 4.4. Testarea unei proportii cu o valoare fixa.28
- Capitolul V. Analiza statistica a legaturilor dintre variabile. 29
- 5.1. Analiza variantei (ANOVA).29
- 5.2. Analiza de corelatie .32
- 5.3. Analiza de regresie.34
- Capitolul VI. Concluzii.37
- Bibliografie.38
Extras din proiect
Capitolul I. Obiectivul proiectului
Etimologia termenului “statistica” ne trimite la cuvantul “status”, care ajunge, prin evolutii successive, la cuvantul statistica de astazi.Crearea cuvantului este atribuita lui Gottfried Achenwall, care l-a introdus (in 1746) pentru a desemna o “stiinta a descrierii statului” folosita pentru evaluarea intr-o forma sistematica a unor variabile cum ar fi productia sau consumul de produse agricole.
Statistica a aparut din nevoia de a cunoaste intr-o forma masurabila realitatea inconjuratoare si s-a impus, inca din zorii civilizatiei, ca una din principalele preocupari ale grupurilor umane. Scopul statisticii este obtinerea datelor statistice.
Culegerea datelor statistice a inceput in mod sporadic, observandu-se elemente ale puterii economice si militare, de regula cand se organiza sau se reorganiza o cetate. Astazi, activitatea statistica se desfasoara intr-o forma organizata in cadrul institutiei statistice, care asigura, prin sistemul sau informational, obtinerea informatiei statistice in orice domeniu de activitate.
Obiectivul acestui proiect este analiza si descrierea statistica a unei distributii cu variabile categoriale si numerice, in cazul nostrum avem un esantion de 20 de judete a Romaniei, anul 2008. Pentru a reusi sa realizez o cercetare statistica cat mai amanuntita am folosit de o serie de variabile, care se impart in doua categorii: variabile categoriale si variabile numerice.
Variabilele categoriale sunt in numar de doua, reprezentate de regiunea de dezvoltare din care fac parte judetele si numarul de spitale(pe nivele) care se prezinta pe nivel inferior, mediu si superior. Variabilele categoriale nu pot reprezenta instrumental necesar analizei statistice daca nu au alaturi si variabilele numerice, care sunt tot in numar de doua: numarul de spitale si medici.
In cadrul acestui proiect structurat pe sase capitole, datele vor fi sistematizate in cadrul unui tabel , urmand apoi gruparea lor pe interval de variatie si distribuirea lor cu ajutorul unui grafic. Pentru variabila categoriala numarul de spitale(pe nivele) se va calcula proportia si valoarea dominant care vor fi structurate intr-o diagram de structura.
Pentru variabila numerica numarul de spitale se va calcula nivelul mediu (media aritmetica, modul , mediana, medial, quantilele, decilele, mediala); dispersia (amplitudinea variatiei, abaterea individuala, abaterea medie liniara, abaterea medie patratica, intervalul mediu de variatie, varianta, coeficientul de variatie); forma distribuitiei (asimetrie, boltire); indicatori ai concentrari; precum si graficele specifice. Urmand ca in capitole patru si cinci sa fie prezentata inferenta statistica si analiza statistica a legaturilor dintre variabi
Capitolul II. Crearea bazei de date
2.1. Identificarea variabilelor statistice
Dupa cum s-a putut observa in capitolul anterior variabilele statistice sunt in numar de patru si sunt grupate in doua categorii: variabile categoriale si variabile numerice. Variabilele categoriale sunt : regiunea de dezvoltare a judetelor si numarul de spitale(pe nivele) structurate pe nivel inferior, mediu si superior, iar variabilele numerice sunt: numarul de spitale si medici. Datele sunt luat din Anuarul Statictic din anul 2008. Conform celor prezentate mai sus vom prezenta datele in forma tabelara dupa cum urmeaza.
Tabelul 1. Unitatile sanitare, pe regiuni de dezvoltare si judete ,in anul 2008
Judetul Regiunea de dezvoltare Numarul de spitale Medici Numarul de spitale( pe nivele)
Arad Vest 12 940 mediu
Arges Sud - Muntenia 19 1321 superior
Bacau Nord - Est 12 1017 mediu
Bihor Nord - Vest 15 1544 superior
Botosani Nord - Est 10 558 inferior
Braila Sud - Est 5 516 inferior
Brasov Centru 17 1240 superior
Buzau Sud - Est 8 550 inferior
Calarasi Sud - Muntenia 6 272 inferior
Caras - Severin Vest 8 556 inferior
Cluj Nord - Vest 26 556 superior
Constanta Sud - Est 15 1865 superior
Covasna Centru 7 349 inferior
Dambovita Sud - Muntenia 7 625 inferior
Dolj Sud - Vest Oltenia 14 2114 superior
Gorj Sud - Vest Oltenia 8 601 inferior
Ilfov Bucuresti - Ilfov 7 573 inferior
Maramures Nord - Vest 11 790 mediu
Mehedinti Sud -Vest Oltenia 6 479 inferior
Timis Vest 16 2974 superior
2.2. Definirea variabilelor si introducerea datelor
Dupa cum se poate observa in tabelul anterior prezentat, vom incerca sa prelucram datele dupa variabila numerica , numarul de spitale.
Vom prelucra datele statistice sub forma intervalelor de variatie. Aflam, mai intai, marimea intervalului de variatie(l), considerand urmatoarea lege:
k= 1+3,322〖 lg〗_n
k= 1+3,322〖lg〗_20= 5,3 ≈ 5(intervale)
l =A/K, de unde A= x_max -x_min → A= 26-5=21
l= ( 21)/5 = 4,2 ≈ 5
Preview document
Conținut arhivă zip
- Proiect Statistica.docx