Extras din curs
VI 1. Testarea statistică: aspecte generale conceptuale
VI.2. Testarea statistică: demersul general al testării, teoria probabilităţilor şi distribuţiile sau repartiţiile statistice
VI.3. Tipologia testelor statistice
VI.1. Testarea statistică: aspecte generale conceptuale
Aspecte introductive
Ştiinţele experimentale şi cele modelatoare (axate pe descoperirea legităţilor ştiinţifice cu ajutorul modelării sau a modelelor) fac apel deseori la metodele statisticii matematice îndeosebi la acelea privind verificarea unor ipoteze.
Exemplu:
Se introduce o nouă metodă, un nou model, o nouă tehnică.
A.Sunt noua metodă, noul model sau tehnica recent introdusă superioare celor vechi sau permit o cunoaştere îmbunătăţită?
B.Cum se demonstrează statistic acest lucru?
C.Cum se va derula experimentul prin care să se ajungă la concluzia superiorităţii noii metode, noului model sau tehnicii recent introduse?
D.Nu cumva rezultatele obţinute prin metodele noi utilizate se datoresc întâmplării?
Acceptarea sau neaceptarea superiorităţii noii metode, validităţii noului model sau tehnicii recent introduse se realizează prin metoda statistico – matematică a ipotezelor statistice
ÎNCEPUTURI
Dezvoltarea teoriei testării ipotezelor statistice a avut loc in paralel cu dezvoltarea teoriei estimării. Primele contribuţii
cu impact deosebit în fundamentarea matematicii testării ipotezelor statistice au aparţinut lui Jerzy Neyman şi E.A. Pearson, prin studiile publicate in revista Biometrica
(în 1928).
Ce reprezintă o ipoteză statistică ?
O ipoteză statistică este o presupunere asupra uneia sau mai multor repartiţii statistice care caracterizează anumite populaţii sau, mal precis, asupra unuia sau mai multor parametri ai unor astfel de repartiţii.
Presupunerea este numită ipoteză deoarece se referă la o situaţie care poate fi adevărată
Ipoteza statistică este o descriere concretă a unora sau mai multor aspecte, uneia sau mai multor populaţii.
Ipoteza statistică este întotdeauna o presupunere asupra populaţiei şi nu asupra selecţiei.
Ipotezele statistice nu sunt aproape niciodată echivalente cu cele ştiinţifice, care in mod obigatoriu sunt presupuneri asupra feno-menelor.
TIPOLOGIA IPOTEZELOR STATISTICE
Pornind de la o repartiţie unidimensională a cărei densitate de repartiţie p (x1, q) depinde de un parametru q se verifică ipoteza conform căreia parametrul q are valoarea q0.
Această ipoteza se notează astfel H0: q = q0.
Se presupune că în afară de valoarea q0, parametrul mai poate avea şi una din valorile q1, q2, ...
Ipotezele
H0: q = q0, H1: q = q1, H2: q = q2, …
sunt numite ipoteze admisibile.
TIPOLOGIA IPOTEZELOR STATISTICE
Pentru a o distinge de celelalte ipoteze, ipoteza H0: q = q0. este numită ipoteza nulă, în timp ce oricare altă ipoteză
este considerată o ipoteza alternativă.
TIPOLOGIA IPOTEZELOR STATISTICE
GENERALIZARE
Fie p(x, q0, q1, q2, …, q k) densitatea unei repartiţii ce depinde de mai mulţi parametri necunoscuţi q0, q1, q2, …, qk.
Ipoteza H: q1 = q10, q2 = q20, …, q k = q k0, care specifică valorile tuturor parametrilor necunoscuţi este numită
ipoteza simplă.
Fie q = ( q1, q2, …, qk) şi W spaţiul k dimensional al tuturor vectorilor q. Spaţiul W este numit spaţiul parametrilor.
Ipoteza H: q Î w , unde w este o submulţime a lui W care conţine cel puţin un punct, este denumită ipoteza compusă.
TIPOLOGIA IPOTEZELOR STATISTICE ŞI ALTE NOŢIUNI SPECIFICE TESTĂRII
Pentru început se consideră cazul a două ipoteze admisibile.
Fie H0: q = q0, ipoteza nulă şi
H1: q = q1 ipoteza alternativă.
Se verifică ipoteza H0 cu ajutorul valorii observate a unei statistici u sau o funcţie de observaţii. Fie V mulţimea valorilor statisticii u, astfel încât dacă ipoteza nulă este adevărată atunci P (uÎH) = a.
Mulţimii V îi corespunde în spaţiul de selecţie o mulţime W
astfel încât (xÎW| H0) = a ,
unde x = (x1, x2, …, xn), reprezintă vectorul de observaţii,
iar valoarea numerică a lui a poartă denumirea de prag de semnificaţie al testului.
Mulţimea W se numeşte regiune critică. Dacă x ÎW respingem ipoteza H0, echivalent în acest exemplu cu acceptarea ipotezei H1, iar dacă x Î unde este complementara mulţimii W se acceptă ipoteza H0.
Mulţimea este denumtă regiune de acceptare.
În general se pot identifica mai multe, respectiv chiar
o infinitate de submulţimi W ale spaţiului de selecţie )
o mulţime de elemente astfel încât orice evenment corespunde unui singur element al acestei mulţimi)
toate satisfăcând relaţia: (xÎW| H0) = a.
Se pune acum problema alegerii unei anumite mulţimi W. Rezolvarea acestei probleme este descrisă în continuare.
Există posibilitatea de a comite o eroare care constă în respingerea ipotezei H0 când ea este adevărată. O astfel de eroare este numită eroare de ordinul întâi. Probabilitatea acestei erori este a, deci probabilitatea erorii de ordinul intii este egală cu pragul de semnifi-caţie al testului. Natural se doreşte ca aceste erori să apară cât mai rar sau la un nivel cât mai redus, în general a se ia 0,01 sau 0,05.
Se mai poate comite însă şi o altă eroare, respectiv să se admită ipoteza H0 când ea este falsă şi o astfel de eroare este numită eroare de ordinul al doilea. Eroarea apare când xÏW, deşi q = q0.
Notând probabilitatea acestui eveniment prin b, atunci:
P( x Î l q1) = b sau P( x ÎWl q1) = 1 - b.
Probabilitatea de respingere a ipotezei H0, ca funcţie de q poartă numele de funcţie de putere a criteriului sau a testului. Această noţiune se poate nota cu p (W, q).
Deci p (W, q) = P ( x ÎWl q1), iar din definiţia lui a şi b
se obţin:
p (W, q0) = a ,
p (W, q1) = 1 - b .
Preview document
Conținut arhivă zip
- Testarea Statistica.doc