Cuprins
1. INTRODUCERE 3
2. DESCRIEREA BAZEI DE DATE ȘI A VARIABILELOR ANALIZATE 4
3. ANALIZA STATISTICĂ UNIVARIATĂ A DATELOR 5
3.1 DESCRIEREA STATISTICĂ A VARIABILELOR CALITATIVE 5
3.2. DESCRIEREA STATISTICĂ A VARIABILELOR CANTITATIVE. 7
4. ESTIMAREA ȘI TESTAREA STATISTICĂ 12
4.1. ESTIMAREA UNEI MEDII PRIN INTERVAL DE ÎNCREDERE. 12
4.2. TESTAREA STATISTICĂ 13
5. ANALIZA DE REGRESIE ȘI CORELAȚIE 16
5.1. ANALIZA DE CERELAȚIE. 16
5.2. ANALIZA DE REGRESIE 17
CONCLUZII 31
Extras din document
1. INTRODUCERE
În vederea realizării proiectului, am ales baza de date „GrinnellHouses” , iar sursa acestei baze de date este vincentarelbundock. Scopul acestei analize este de a oferi o imagine de ansamblu asupra vânzării caselor din Grinnell, Iowa în perioada 2005-2015. Aceste observații au fost adunate de la un eșantion de 929 de persoane și prezintă 15 variabile.
Punctul de pornire, în studierea acestui fenomen, a fost alegerea variabilelor cu care voi lucra pe parcursul analizei și anume, variabilele calitative sunt: listprice2 și yearsold2 respectiv bedrooms, baths, saleprice sunt variabilele cantitative.
În capitolele prezentate se vor realiza testări, analize de corelație, regresie, iar în ultima parte a acestui proiect se va realiza testarea ipotezelor statistice.
2. DESCRIEREA BAZEI DE DATE ȘI A VARIABILELOR ANALIZATE
Pentru realizarea acestui proiectului am ales baza de date „GrinnellHouses”
Variabilele din baza de date, prezintă următoarele caracteristici:
- date: este o variabilă de tip numeric și este codul pentru data vânzării;
- adress: este o variabilă de tip string și este adresa unde se află casa;
- bedrooms: este o variabilă numerică și reprezintă numărul de dormitoare;
- baths: variabila numerica și reprezinta numărul de băi;
- squarefeet: este o variabilă de tip numerica și este metrul pătrat al
- lotsize: este o variabilă de tip numerica și reprezintă dimensiunea lotului;
- yearbuilt: este o variabilă numerică și semnifică anul construirii casei;
- yearsold: variabilă numerică și reprezintă anul vânzării casei;
- monthsold: variabilă numerică și reprezintă luna vânzării;
- daysold : variabilă numerică și reprezintă ziua vânzării;
- costpersqft: este o variabilă de tip numeric și este prețul de vânzare pe metrul pătrat;
- origprice: este o variabilă de tip numeric și este prețul inițial;
- listprice: este o variabilă numerică , prețl de listă
- saleprice: este o varibilă numerică, prețul de vânzare al casei
- splppct: este o variabilă numerică
În vederea realizării următoarei analize privind prețul de vânzare a unei case am ales următoarele;
- Variabilele bedrooms și baths= variabile independente
- Variabila saleprice= variabila dependenta
În continuare am ales să creez o variabilă, pornind de la variabilă „listprice” , luând în considerare faptul că prețul de listă variază, le-am grupat astfel : 1 pentru valoarea cea mai mică , 2 și 3 pentru valorile de mijloc , iar 4 pentru cea mai mare valoare.
Preview document
Conținut arhivă zip
- Proiect Pachete Program de Statistica II.docx