Cuprins
- 1.Recunoașterea probelor
- 1.1 Introducere
- 1.2 Proceduri preliminare
- - 1.2.1 Procesarea semnalului
- - 1.2.2 Pre-tratarea probelor
- - 1.2.3 Explorarea și recunoașterea nesupravegheată a modelului tehnicilor
- 1.3 Selecția și reducerea variabilei
- 1.4.Tehnici de recunoaștere a modelelor supravegheate
- - 1.4.1 Analiza discriminatorie liniară
- - 1.4.2 Analiza discriminatorie parțială cu cele mai mici pătrate
- - 1.4.3 Cel mai apropiat vecin
- - 1.4.4 SIMCA
- - 1.4.5 UNEQ
- - 1.4.6 Arborele de clasificare și regresie
- - 1.4.7 Vectorul suport-mașină
- - 1.4.8 Rețele neuronale artificiale
- 1.5 Validarea modelelor
- 1.6 Provocări greșite și erori
- 2. Aplicații în analiza produselor alimentare
- 3.Concluzie
Extras din proiect
1.Recunoasterea probelor
1.1 Introducere
Introducerea în prezent a instrumentelor analitice moderne permit producerea de cantități mari de informații (variabile sau caracteristici) pentru un număr mare de probe , care pot fi analizate în timp relativ scurt. Acest lucru duce la disponibilitatea unor matrici de date multivariate care necesită utilizarea unor proceduri matematice și statistice, în scopul de a extrage eficient datele care ne sunt utile .
Tehnicile pentru recunoașterea tehnicilor supravegheate utilizează informațiile despre clasa membrilor de mostre la un anumit tip de grup (clasă sau categorie) pentru a clasifică noi probe necunoscute într-una din clasele cunoscute bazate pe modelul său de măsurători .
Procedurile de recunoaștere a modelelor supravegheate utilizează o metodă comună ,o strategie, indiferent de algoritmul aplicat, care constă în următoarele etape :
- Selectarea unei metode, a unei calibrări și a unui set de teste, care constau în obiecte de membru de clasă cunoscute pentru care variabilele sunt măsurate. Setul de calibrare este utilizat pentru optimizarea parametrilor caracteristici pentru fiecare multivariat de tehnică.
- Selecție variabilă. Aceste variabile care conțîn informații pentru clasificarea vizată sunt păstrate, în timp ce aceste variabile codează zgomotul și / sau fără nici o putere de discriminare este eliminat.
- Construirea unui model folosind setul de antrenament. Un mathematic model este derivat între un anumit număr de variabile măsurat pe eșantioanele care constituie setul de antrenament și categoriile lor cunoscute.
- Validarea modelului utilizând un set independent de probe,pentru a evalua fiabilitatea clasificării realizate.
Au existat mai multe tipuri de metode de recunoaștere a modelului aplicate în știința alimentelor, dar ele diferă esențial de felul în care acestea obțîn clasificarea . Sunt două tipuri de metode de obicei distinse într-o primă abordare: cele concentrate privind discriminarea între clase, cum ar fi discriminarea liniară analiză (LDA), k-vecinii cel mai apropiat (kNN), clasificarea și arbori de regresie (CART), analiză discriminatorie parțială minimă (PLS-DA) și rețelele neuronale artificiale (ANN); și aceleaorientate spre cursuri de modelare, cum ar fi soft independentmodelarea analogiei de clasă (SIMCA) și inegal dispersateclase (UNEQ).
Tehnicile de discriminare sunt folosite pentru a construi modele bazate pe toate categoriile implicate în discriminare, întrucât metodele disjuncte de modelare a claselor creează o separare model pentru fiecare categorie. Unul dintre dezavantajele discriminării metodelor este că eșantioanele sunt întotdeauna clasificate într-una din categoriile respective, chiar dacă nu aparțîn niciuneia dintre ele. Metodele de modelare a claselor iau în considerare acele obiecte care se potrivesc modelului pentru o categorie că parte a modelului și clasificat că non-membri cei care nu. Cu toate acestea, în ceea ce privește clasificarea abilități, examinările empirice recente arată că SIMCA nu este la fel de puternic că și înainte; CAIMAN, CART și variantele de analiză discriminantă sunt mai bune .
Tehnicile de recunoaștere a modelelor supravegheate pot fi de asemenea grupate că parametrice / non-parametrice , deterministe /probabilistic sau liniar / neliniar. Tehnici parametrice cum ar fi LDA, PLS-DA, SIMCA și UNEQ .Statistici în metodele non-parametrice cum ar fi kNN și CART nu se bazează pe distribuție ,ipoteza, ceea ce face estimarea probabilităților de clasificare corectă mai dificilă.La linia liniară / neliniară, clasificarea se bazează pe natură funcțiilor discriminante, linear / non-linear, respectiv, folosit pentru a discrimina printre clase.
1.2 Proceduri preliminare
Se presupune că datele analitice sunt obținute prin validare ,metode analitice în ceea ce privește precizia, sensibilitatea, specificitate, incertitudine, robustețe și trasabilitate. În plus, datele utilizate pentru formare ar trebui să fie suficient de mari pentru a le acoperi variația posibilă cunoscută în domeniul problemei.
Supravegherea recunoașterii modelului necesită un set de antrenament cu obiecte de categorii cunoscute pentru a obține un model pentru identificarea probelor necunoscute. Prin urmare, este obligatoriu să stabiliți mai întâi dacă măsurătorile chimice sunt de fapt bune,suficient pentru a se încadra în clasele predeterminate, deoarece tehnicile de recunoaștere nu pot compensa modelele slab proiectate ,experimente sau date experimentale inadecvate . Această sarcină poate să fie dificilă datorită faptului că tehnicile analitice modern sunt capabile să genereze atât de multe date că informațiile esențiale nu pot fi evidente. Analiză datelor exploratorii (EDA) (și recunoașterea modelului nesupravegheat) este utilizat în mod obișnuit pentru simplificare și să obțînă o mai bună cunoaștere a seturilor de date. Provocarea este să eliminați redundanța și zgomotul, păstrând în același timp semnificația informației.
Exemplu de test EDA printr-o nouă tehnică pe bază de microparticule pentru proteina C
Tehnicile noi de testare au fost aplicate la un test nou dezvoltat pe bază de microparticule pentru proteina C reactivă (CRP). Prin utilizarea a două microparticule cu dimensiuni diferite acoperite covalent cu doi anticorpi monoclonali cu reactivitate diferită, o sensibilitate ridicată și o limită superioară de măsurare ce pot fi realizate simultan, rezultând un domeniu dinamic remarcabil de larg.
Preview document
Conținut arhivă zip
- Recunoasterea modelului de supraveghere in analiza produselor alimentare.docx