Extras din referat
Culegerea si Depozitarea Datelor in Industria Farmaceutica
Introducere
Cele mai multe procese in industria farmaceutica sunt data-driven.Abilitatea companiilor de a capta datele si de a se folosi de ele va creste in importanta si poate deveni factorul principal de diferentiere in industrie.Conceptele de baza ale culesului de date(data mining-DM),depozitarii de date(data warehousing-DW), si modelarii de date(data modeling-DM) sunt introdusi.Aceste noi concepte data-driven conduc la paradigma schimbarii in industria farmaceutica.
Fond
Volumul de date a crescut in mod surprinzator in industria farmaceutica.de exeplu,un microarray(echivalentul unui test) poate furniza mii de date.Aceste uriase seturi de date ofera provocari si oportunitati.Provocarile primare sunt stocarea de date, managementul si decoperirea stintifica.Industria farmaceutica este una din cele mai data-driven industrii si punerea in valoare a datelor este cheia succesului sau.Astfel procesarea datelor cu ajutorul noilor instrumente si metode de extras cunostinte utile pentru decoperirea rapida de medicamente si optima corepondenta a medicamentului cu pacientul poate deveni principalul factor diferential dintre copaniile farmaceutice.
Principalele surse farmaceutice de date sunt pacientii,testele genetice, resursele regulatoare, literatura farmaceutica,etc.Datele si inormatiile culese din diferite surse, agentii, clinici, au fost folosite in mod traditional pentru rapoartele limitate.Incercarile clinice masive pot duce la erori cum ar fi violari de protocol, erori in integritatea datelor, in formatul datelor, erori de transfer, etc.In mod traditional analiza in industria farmaceutica[cu prezicere de la stabilitatea medicamentelor(king et al.,1984) la tehnicile de decoperire a medicamentelor(Tye,2004)] este facuta folosind tehnicile statistice bazate pe populatie.Pentru a reduce posibilile erori si a mari increderea in predictii este nevoie de o metodologie vastapentru colectarea de date, inmagazinarea si analiza acestora.Automatizarea datelor farmaceutice in timpul vietii lor pare alternativa evidenta.
Viziunea pentru industria farmaceutica este surprinsa in Figura 1.A devenit cert faptul ca datele vor ocupa un rol principal in decoperirea de medicamente si disribuirea acestora unor anumiti indivizi.Suntem pe punctul de a vedea companiile farmaceutice distribuind medicamente, developand kituri pentru teste(incluzand testele AND) si programe pentru a livra cel mai bun medicament pacientului.Actualele unelte pentru cules date sunt capabile sa elibereze prescriptii personalizate, prevazand cele mai eficace medicamente si dozele cu cele mai putine efecte secundare.A devenit ceva practic a gandi la crearea, producerea si livrarea medicamentelor pentru un anume pacient sau pentru un mic grup de pacienti.Aici, analogia dintre productia de medicamente unicat si productia lor in masa merita o atentie sporita.Multe industrii incearca sa faca produse personalizate.Industria farmaceutica poate deveni in curand di ea una din acesta industrii.
Lovitura Principala
Paradigma Schimbarii
Predictia implica cunostinte avansate care, intr-un mediu de afaceri se traduce prin avantaj competitional.Un eveniment viitor poate fi prezis in doua moduri : bazat pe populatie sau bazat pe individ.Predictia bazata pe populatie spune de exemplu ca un medicament A a fost eficient in tratarea a 80% din pacientii populatie P, fapt ilustrat in Figura 2.Bineinteles ca inainte de a lua medicamentul A orice pacient ar dori sa faca parte din cei 80% decat din cei 20%.Printre altele,in industia farmaceutica, statisticile si alte mijloace au fost folosite frecvent pentru a sustine paradigma populatiei.
Predictia bazata pe individ sustinuta de numeroase algoritme DM pune accentul pe pacientul individ decat pe populatie.Unul din multele scenarii de luari de decizii este ilustrat in Figura 3, unde populatia originala P de pacienti este partitionata in doua segmente 1 si 2.Deciziile pentru fiecare pacient din segmentul 1 sunt facute cu mare confidentialitate ; sa spunem de 99%, in timp ce deciziile pentru segmentul 2 sunt facute cu un nivel scazut de confidentialitate.
Este posibil ca pacientii din Segmentul 2 sa caute o alternativa la medicament sau tratament.Exista mai multe moduri de a folosi algoritmii DM.Ei acopera distanta dintre paradigmele populatiei si individului.Algoritmele DM existente pot fi grupate in urmatoarele zece clase principale :
A. Mettode clasice statistice (e.g., lineare, patratice si alte analize logistice diferentiate)
B. Tehnici moderne statistice(e.g., estimerea densitatii, algoritmul Bayes, etc.)
C. Retele neurale
D. Masini vector suport
E. Arbori decizionali
F. Algoritmi decizionali
G. Algoritmi de reguli asociate
H. Sisteme clasificatoare de invatare
I. Algoritme de invatare inductiva
J. Algoritme de invatare text
Fiecare clasa contine numeroase algoritme, spre exemplu exista mai mult de 100 de implementari ale arborilor decizionali(calasa E).
Conceptul Depozitului de date
Un depozit trebuie sa fie conceput pentru a satisface nevoile utilizatorilor.Culesul de date, proesarea analitica online(OLAP) si raportarea sunt nevoile principale.Metodologiile conceperii sistemelor si mijloacele pot fi folosite pentru facilitarea cerintelor capturii.Exemple de metodologii pentru analiza cerintelor depozitului de date includ grafice AND /OR si calitatea depozitului.
Preview document
Conținut arhivă zip
- Culegerea si Depozitarea Datelor in Industria Farmaceutica.doc