Extras din curs
6.1. Măsurarea variaţiei în serii bidimensionale
(bivariate)
Sistematizarea datelor după două variabile (pe variante sau pe
intervale de variaţie) aşa cum s-a mai arătat are ca rezultat obţinerea unei
serii bidimensionale (bivariate). Presupunem în acest sens că valorile
variabilei X au fost sistematizate pe „K” variante (sau intervale) şi s-au
urmărit în fiecare din cele „p” intervale (grupe) formate după o altă variabilă
Y.
Adoptăm următoarele notaţii:
Xij – valoarea xi a variabilei observate X înregistrată în grupa j (cu i=1,k şi
j =1,p );
nij – numărul de unităţi de observare la care s-a înregistrat valoarea xij;
ni nij - numărul de unităţi la care s-a observat valoarea xi indiferent ce
valoare a înregistrat variabila y;
n j nij - numărul de unităţi la care s-a observat valoarea yi indiferent ce
valoare a fost înregistrată pentru variabila x;
n ni n n - numărul de unităţi din populaţia statistică
la care s-au observat cele două variabile.
Variabilitatea valorilor xij (variaţia generală) este determinată de
factori esenţiali (de grupare) şi factori aleatori (reziduali) care acţionează în
mod specific în interiorul fiecărei grupe. Aceasta înseamnă că după natura
factorilor de influenţă variaţia generală (VG) este formată dintr-o variaţie
explicată de factorul de grupare (VE) şi o variaţie reziduală (VR),
determinată de factori aleatori care acţionează în mod specific în interiorul
fiecărei grupe:
xij − x = (xij − x j )+ (x j − x), (∀) i = 1,k; j = 1,p (5.51)
Unde: x = media generală;
xj = media grupei (clasei) j (j=1,p)
VG VR VE
Anexe 171
În ipoteza în care între factorul de grupare Yj (j=1,p) şi factorii
aleatori (reziduali) din interiorul fiecărei grupe j=1,p nu există dependenţă
statistică, luînd în considerare frecvenţele corespunzătoare, la nivelul
ansamblului, relaţia (5.51) poate fi transformată şi scrisă sub următoarea
formă:
ΣΣ(xij x) n ΣΣ(x x ) n Σ(x x) n
= = = = =
− = − + − (5.52)
Din (5.52) se obţine, deci, relaţia de descompunere a dispersiei
generale, într-o serie bivariată, pe componente:
x σ = σ + δ (5.53)
unde:
n..
(x x ) nij
= = - dispersia generala care sintetizeaza pe
ansamblu influenţa factorilor indiferent natura lor;
δ = - dispersia dintre grupe care sintetizeaza doar
influenţa factorului de grupare luat în considerare – exprimă variaţia
mediilor condiţionate.
= = = - media dispersiilor condiţionate (de
grupe) care sintetizeaza influenţa factorilor aleatori (reziduali) din interiorul
fiecărei grupe j =1,p .
2
σ j = dispersia grupei j ( j =1,p )
Relaţia (5.53) mai poate fi scrisa şi sub următoarea formă:
1 x => 1 = K + R
= (5.54)
unde: R [0;1] 2
= - (pătratul mraportului de corelaţie) se numeşte
coeficient de determinare.
Preview document
Conținut arhivă zip
- Statistica Multidimensionala.pdf