Cuprins
- 1.1 Consideratii generale
- 1.2 Ce sunt retelele neurale artificiale ?
- 1.3 O privire asupra creierului uman
- 1.4 Aplicatii specifice
- 1.5 Legatura cu alte domenii
- 1.6 Note istorice
Extras din referat
CAPITOLUL 1: INTRODUCERE
Retele neurale, algoritmi genetici, sisteme fuzzy: iata numai câteva dintre notiunile
care pâna nu demult pareau mai degraba desprinse dintr-un roman stiintificofantastic
decât din cuprinsul unei publicatii stiintifice. Si totusi în zilele noastre atât
cercetatori din universitati cât si din marile companii utilizeaza în mod curent astfel
de tehnologii, într-un efort sustinut de a integra elemente de inteligenta artificiala
în proiecte concrete. Fiecare dintre aceste directii de cercetare utilizeaza
instrumente teoretice si terminologie specifice, prezinta deopotriva avantaje reale
dar si limitari recunoscute si au fost introduse deja cu mai mult sau mai putin
succes în circuitul comercial. În cele ce urmeaza vom face cunostinta cu subiectul
central al acestei lucrari, cel al retelelor neurale artificiale. Scopul urmarit este de a
ilustra motivatiile care justifica interesul pentru aceasta directie de cercetare, de a
introduce primele ele mente de terminologie si de a trece în revista o serie de
aplicatii. Spre final vom parcurge câteva file de istorie, enumerând principalele
momente care au jalonat evolutia acestui domeniu în ultimele decenii.
1.1 Consideratii generale
Desi nu exista o definitie general acceptata a retelelor neurale artificiale,
majoritatea cercetatorilor sunt de acord ca acestea reprezinta ansambluri de
elemente de procesare simple, interconectate prin canale de comunicatii prin care
se propaga informatie numerica. Din perspectiva istorica, multe dintre ideile
vehiculate în acest context sunt motivate de dorinta de a construi sisteme capabile
sa rezolve cu succes sarcini uzuale pentru creierul uman precum întelegerea
vorbirii sau recunoasterea formelor. În fapt, aceasta abordare s-a dovedit utila în
special pentru probleme dificil de formalizat sub forma unui algoritm (adica a unei
“retete” care sa garanteze rezultatul), situatie care presupune o întelegere profunda
a aplicatiei considerate. Astfel de situatii nu sunt de loc rare: sa ne închipuim
numai usurinta cu care reusim sa descifram scrisul de mâna al unei persoane
necunoscute sau cea cu care recunoastem prieteni vechi chiar daca nu i-am mai
întâlnit din scoala primara. Majoritatea retelelor neurale utilizeaza mecanisme pe
baza carora intensitatea legaturilor dintre neuroni sunt ajustate în functie de
calitatea raspunsului la stimuli externi. Ajungem astfel la principala trasatura a
acestor sisteme, anume capacitatea de a învata pe baza de exemple, folosind
“experienta” anterioara pentru a-si îmbunatati permanent performantele, dar si de a
oferi un anumit grad de generalizare, care se traduce printr-un raspuns adecvat la
informatii de intrare care nu au fost folosite în faza de “antrenare”. Iata un exemplu
foarte simplu: parintii folosesc deseori prilejul unor plimbari prin parc pentru a-i
învata pe copii rasele de câini. Dupa ce va fi înteles cum arata un dalmatian, copilul
1.1 Consideratii generale 3
va fi în stare sa recunoasca un astfel de exemplar chiar si atunci când îl vede în
celebrul film de desene animate!
Exista câteva motive întemeiate pentru a considera retelele neurale ca o solutie
atractiva într-o serie întreaga de aplicatii practice importante, dintre care amintim:
- acestea pot actiona ca module de tip black-box în situatiile în care ave m la
dispozitie un volum mare de date, fara a putea spune prea multe despre
procesul care le -a generat. De multe ori, desi identificarea unei dependente
între marimile de intrare si o anumita informatie de interes ar fi extrem de utila,
nu beneficiem de modele adecvate sau de valori ale parametrilor acestora. Un
exemplu concludent este oferit de aplicatiile financiare: valoarea unei actiuni
sau a unui indice bursier este în mod evident dependenta de ansamblul
informatiilor existente pe piata pâna la momentul considerat, însa modele
analitice pur si simplu nu exista. Retelele neurale sunt capabile sa descopere
astfel de dependente “ascunse” pornind numai de la baza de date disponibila,
fara a impune constrângeri de modelare. Scopul este atins folosind algoritmi
specifici, care modifica valorile interconexiunilor dintre neuroni astfel încât sa
“forteze” ca raspunsul retelei sa se apropie cât mai mult de cel dorit.
- în urma unui proces de învatare reusit, retelele neurale tolereaza în mod
remarcabil diferente (uneori, apreciabile) între datele aplicate la intrare în
procesul de operare si cele “vazute” în etapa de antrenare. Dar acesta reprezinta
si modul natural de functionare al creierului uman: odata ce am învatat sa citim
suntem de regula capabili sa întelegem scrisul de mâna al unor persoane
necunoscute (chiar si al unui farmacist!). Aceasta reprezinta o consecinta a asanumitei
capacitati de generalizare a retelelor neurale, care exprima
posibilitatea acestora de a oferi un raspuns corect chiar daca la intrare se aplica
versiuni incomplete, zgomotoase sau distorsionate ale informatiilor folosite în
antrenare.
- aplicatii extrem de diferite pot fi abordate folosind practic acelasi sistem, fara a
fi necesara reproiectarea completa. Mai mult, extinderea acestei tehnologii este
facilitata de prezenta pe piata a unor circuite integrate specializate si chiar a
unor placi compatibile PC, care ofera performante de viteza si precizie
suficiente pentru a permite implementarea unor algoritmi de procesare
complecsi, limitati în trecut numai la utilizarea în programe de simulare
dedicate. O serie de aplicatii practice realiste, care depasesc cadrul restrâns al
asa-numitelor toy problems, constituie deja obiectul de activitate al unor firme
de mare succes. În paralel, au fost dezvoltate si lansate în circuitul comercial o
serie de simulatoare puternice si flexibile, un exemplu concludent în acest sens
fiind oferit de produsul firmei americane
Preview document
Conținut arhivă zip
- Introducere in Teoria Retelelor Neurale Artificiale.pdf