Cuprins
- 1. Introducere 2
- 2. Construirea bazei de date 4
- 3. Verificarea bazei de date 10
- 3.1 Verificarea normalităţii distribuţiilor 10
- 3.2 Depistarea outlierilor 14
- 4. Analiza statistica univariată a datelor 20
- 4.1 Descrierea statistică a variabilelor numerice 20
- 4.2 Descrierea statistică a varibilelor nominale 23
- 5. Analiza statistică bivariată a datelor 28
- 5.1 Analiza statistică a gradului de asociere între două variabile 28
- 5.2 Analiza de corelaţie şi regresie 30
- 5.3 Analiza dispersională (ANOVA) 34
- 6. Estimarea şi testarea statistică 38
- 6.1 Estimarea prin interval de încredere a unei medii 38
- 6.2 Estimarea prin interval de încredere a unei proporţii 40
- 6.3 Testarea statistică a unei medii 41
Extras din proiect
1. Introducere
Crima este definită ca un act sau o tentativă interzisă de către legile publice, act care îl face pe omitent pasibil pentru pedeapsa prevăzută de lege (după dicţionarul Merriam-Webster). Legile sunt destinate să protejeze şi să asigure siguranţa în toate aspectele vieţii sociale : fizic, financiar, psihologic şi social.
În ultimii ani s-a observat o creştere dramatică ratei infracţionalităţii datorită mai multor factori:
• creştere galopantă a abuzului de stupefiante şi a infracţiunilor influenţate de acest abuz;
• prosperitatea – o gamă largă de produse care pot fi furate. Dezvoltarea bunurilor de consum (inclusiv maşini şi obiectele din interiorul acestora);
• Creşterea mobilităţii persoanelor care a determinat declinul comunităţilor stabile tradiţionale;
• Creşterea criminalităţii în ultimii ani este substanţial infuenţată de creşterea numărului denunţurilor, decât de numărul infracţiunilor în sine;
• Urbanizarea (depopularea regiunilor rurale);
• Politicile guvernamentale (piaţa liberă, retragerea subvenţionării serviciilor publice, prăbuşirea comunismului în estul Europei) ;
• Relaxarea controlului social (mai multă mobilitate, abandonarea religiei şi a altor coduri morale tradiţionale) ;
• Relativa sărăcie / inegalitate ;
• Discriminarea minorităţilor etnice.
Modelul supus analizei este format din câteva variabile aleatorii care ar putea să influenţeze infracţionalitatea: numărul de linii telefonice în uz, Produsul Intern Brut ($), numărul de computere personale, numărul de tâlhării, pierderile datorate soft-urilor piratate, transporturile pe cai ferate (km) şi consumul de energie (kw/h).
Ceea ce m-a inspirat în alegerea temei acestui proiect, este situaţia actuală a pieţei informatice din România, care tinde să devină una din ţintele preferate ale marilor investitori din domeniul software. Unul din motivele acestei alegeri îl constituie calitatea serviciilor oferite de programatorii români. Cu toate acestea, reversul monedei este dat de numărul mare şi de competenţele deosebite ale programatorilor care aleg căi de câştig facile, dar nu întotdeauna legale.
Deoarece la nivelul ţării noastre nu sunt observabile diferenţe majore ale infracţiunilor de la un judeţ la altul, am extins analiza folosind statistici din câteva ţări aleatorii ale lumii cu număr al populaţiei şi nivel de dezvoltare diferite.
Infracţionalitatea economică continuă sa fie o ameninţare pentru companiile din toata lumea, peste o treime dintre ele fiind victime ale fraudei în ultimii doi ani, pierderea medie pe companie fiind de aproximativ de 2 milioane de dolari, conform ediţiei 2003 a Studiului privind Criminalitatea Economica ("SCE") realizat de PricewaterhouseCoopers ( unul dintre cele mai cuprinzătoare studii, referindu-se la natura fraudei şi la impactul acesteia asupra afacerii, la nivel mondial).
Cele mai expuse companii din punct de vedere al riscului de fraudă sunt companiile mari, cu peste 1.000 de angajaţi într-o ţară, sunt cele mai vulnerabile, raportând o incidenţă a criminalităţii economice de 52% în ultimii doi ani, în comparaţie cu firmele mai mici, la care incidenţa este de numai 37%.
Frauda, în variatele ei forme, de la furtul grosolan din magazia de produse finite la sofisticatele atacuri prin internet şi la spionajul economic, este din păcate o constantă a vieţii economice, în timp ce oamenii de afaceri din Europa Centralã şi de Est au tendinţa, datorată pe de o parte relativei lipse de transparenţă a mediului economic local, iar pe de altă parte speranţei că aderarea la structurile UE va forţa modificarea în bine a mediului economic, de a subestima impactul infracţionalităţii economice asupra succesului afacerilor lor.
Rãdãcinile fraudei ţin de natura umană, asanarea mediului economic depinde de instrumentele de prevenţie la dispoziţie şi de schimbările culturale şi de mentalitate care, din pãcate, devin operante dupã intervale relativ lungi de timp. Pentru eficientizarea demersului de a reduce costurile financiare şi de imagine datorate infracţionalităţii economice, efortul profilactic trebuie dublat de acţiuni profesional desfãşurate, şi de aceea descurajante, de detecţie a fraudei.
Sursele datelor statistice folosite pentru crearea bazei de date sunt: Seven United Nations Survey of Crime Trends and Operations of Criminal Justice System, CIA World Factbook, World Bank., World Development Indicators, CD-ROM. Washington, DC; ITU, Software piracy study, CIA World Factbook.
Obiectivul proiectului este de a analiza influenţa exercitată de numărul de linii telefonice în uz, de Produsul Intern Brut ($), de numărul de computere personale, de numărul de tâlhării, de pierderile datorate soft-urilor piratate, de transporturile pe căi ferate şi de consumul de energie, asupra numărului de infracţiuni comise în ţările alese aleatoriu din Europa de Vest, Europa Centralã şi de Est, America Centralã şi de Sud, America de Nord, Asia şi Africa acoperind perioada 2003 – 2005.
2. Construirea bazei de date
Baza de date este formată dintr-o variabilă dependentă (numărul total de infracţiuni) şi din şapte variabile independente numerice (numărul liniilor telefonice în uz, Produsul Intern Brut, numărul de computere personale, numărul de tâlhării, pierderile datorate softurilor piratate, tarnsporturile pe căi ferate şi consumul de energie). Inregistrările sunt preluate de pe site-ul www.nationmaster.com pentru 50 de ţări selectate din Europa de Vest, Europa Centralã şi de Est, America Centralã şi de Sud, America de Nord, Asia şi Africa în perioada 2003 – 2005.
Preview document
Conținut arhivă zip
- Analiza Statistica cu SPSS sub Windows.doc