Procesarea Semnalelor Vorbirii

Disertație
6.3/10 (4 voturi)
Domeniu: Electronică
Conține 3 fișiere: doc
Pagini : 63 în total
Cuvinte : 17698
Mărime: 552.73KB (arhivat)
Publicat de: Ladislau Antal
Puncte necesare: 14
Profesor îndrumător / Prezentat Profesorului: Mariana Jurian, Alin Berechet
UNIVERSITATEA DIN PITESTI FACULTATEA DE ELECTRONICA, COMUNICATII SI CALCULATOARE SPECIALIZAREA – SISTEME INTELIGENTE pentru COMUNICATII LUCRARE DE DISERTATIE

Cuprins

  1. Introducere pag. 3
  2. Capitolul I - Generarea vorbirii. Scheme echivalente
  3. 1.1 Caracteristici generale pag. 4
  4. 1.2 Analiza vocii si a vorbirii pag. 5
  5. 1.3 Modelarea mecanismului de producere a vorbirii pag. 6
  6. 1.4 Reprezentarea digitala a semnalelor vorbirii pag. 15
  7. 1.5 Perceptia semnalelor vorbirii pag. 21
  8. 1.6 Structura generala si functionarea unui
  9. sistem de recunoastere a vorbirii pag. 22
  10. Capitolul II - Parametrii semnalelor vorbirii
  11. 2.1 Compresia si codarea semnalelor audio... pag. 26
  12. 2.2 Extragerea parametrilor semnalului vocal pag. 27
  13. Capitolul III - Metode de analiza
  14. 3.1 Modele pentru productia vocala pag. 32
  15. 3.2 Teoria motorize a perceptiei vorbirii pag. 36
  16. 3.3 Arhitectura unui system de intelegere a vorbirii pag. 37
  17. 3.4 Modele Markov ascunse pag. 39
  18. 3.5 Modele cu retele neuronale pag. 40
  19. 3.6 Modele cu logica fuzzy pag. 44
  20. 3.7 Alinierea temporala dinamica (ATD) pag. 46
  21. Capitolul IV - Metode de sinteza ( recunoasterea vorbirii )
  22. 4.1 Arhitectura sistemelor de recunoastere a vorbirii pag. 48
  23. 4.2 Modele computationale pentru recunoasterea vorbirii pag. 51
  24. Capitolul V - Aplicatia “Wave to text”
  25. 5.1 Reprezentarea digitala a sunetului.
  26. Formatul de compresie audio Wav pag. 53
  27. 5.2 Aplicatia “Wave to text” pag. 55
  28. 5.2.1 Formatul intern al semnalului audio pag. 56
  29. 5.2.2 Implementarea metodei de lucru cu coeficientii LPC pag. 58
  30. Capitolul VI - Concluzii
  31. Bibliografie pag. 62

Extras din disertație

Recunoasterea vorbirii si identificarea vocala devin din ce în ce mai mult tehnologii populare în societatea de astazi. Pe lânga faptul ca are un cost ridicat si aduce un venit considerabil în toate cazurile în care este folosit, sistemul de recunoastere a vorbirii se adreseaza unei mari varietati de utilizari si implementari. Aceste implementari se întind de la domeniul securitatii pâna la tendinta sigura de crestere a productivitatii. Prin fixarea atentiei asupra tehnologiei si a companiilor care manevreaza sistemele actuale de recunoastere vocala si de identificare, putem învata din

implementarile actuale si sa stabilim tendintele viitoare.

De cele mai multe ori recunoasterea si verificarea vorbirii sunt procese de

antiteza, prima etapa în acest traseu fiind recunoasterea.

Recunoasterea vorbirii a fost mult timp unul dintre scopurile diferitilor proiectanti de software. Multi au încercat sa scrie programe care sa fie capabile sa înlocuiasca tastatura cu microfonul. Au existat mai multe aplicatii de acest tip, dar Office XP este prima suita importanta care ofera aceasta facilitate.

Principala dificultate cu care se confrunta programele de recunoastere vocala o reprezinta faptul ca vocile a doi oameni nu sunt deloc asemanatoare si chiar vocea aceleiasi persoane poate varia în anumite situatii.

Office XP încearca sa rezolve aceasta problema prin crearea de profiluri corespunzatoare fiecarui utilizator. Astfel, vor putea fi cunoscute caracteristicile vocilor diferitelor persoane.

La fel ca si celelalte programe de recunoastere vocala si Office XP comite uneori greseli. Microsoft sustine ca 95% dintre cuvinte sunt recunoscute corect, adica doar un cuvânt din douazeci este gresit. Exista unele aplicatii cu performante mai bune, dar nici una nu depaseste o rata de 97%. Totusi, este un prim pas pe drumul care va duce la eliminarea tastaturii.

Capitolul I

Generarea vorbirii. Scheme echivalente

1.1 Caracteristici generale

Sistemele actuale de recunoastere a vorbirii se situeaza deocamdata în limite restrânse ale parametrilor caracteristici si dedicate unor aplicatii specifice. Din punct de vedere a dimensiunii vocabularului si al modului de vorbire, sistemele de recunoastere cu performante acceptabile, se împart în trei categorii principale.

- sisteme cu vocabular mic (10 – 100 cuvinte) ;

- sisteme cu vocabular mediu si mare si vorbire izolata (10 000 – 20 000 cuvinte) ;

- sisteme cu vocabular mediu si vorbire conectata sau continua, restrictiva la un domeniu de aplicabilitate (1 000 - 5 000 cuvinte) .

Cele mai multe sisteme realizate, apar¬tin claselor sistemelor mici si mijlocii cu recunoasterea vorbirii izolate. Sistemele de recunoastere a vorbirii continue, în marea lor majoritate, exista doar în forma experimentala, în conditii de laborator. Chiar si sistemele utilizate în practica, cele pentru vorbirea izolata sau conectata, nu sunt destul de robuste la zgomotul mediului în care functioneaza si la variabilitatea vorbirii. Toate sistemele dau performante mai bune, daca numarul de utilizatori este mai redus si daca cei care folosesc sistemul sunt cei cu a caror voce s-a folosit pentru învatarea sistemului. Performantele se degradeaza semnificativ, daca vorbitorii se schimba sau daca sistemul este folosit cu alte cuvinte decât cu cele pentru care a fost antrenat.

Caracteristicile principale ale uni sistem de recunoastere automate a vorbirii, fara a aminti parametrii si metodele specifice prin care s-a implementat, sunt urmatoarele:

- dimensiunea vocabularului, adica numarul de cuvinte capabil sa le recunoasca;

- monolocutor sau multilocutor (aici se poate preciza si sexul vorbitorilor) ;

- vorbirea izolata sau continua;

- conditi de zgomot si robustetea sistemului;

- domeniul de aplicabilitate ;

- timpul de operare, care poate fi în timp real, cu întîrziere sau off-line ;

- procentajul de recunoastere;

- costul .

Pentru o mai buna întelegere a procesului de recunoastere a vorbirii, voi exemplifica fiecare din componentele acestui proces, astfel:

- analiza acustica este metoda prin care se extrag parametrii auditivi;

- analiza fonetica este metoda prin care ies în evidenta caracteristicile sunetelor;

- analiza sintactica este metoda prin care se analizeaza continutul sintactic al unui cuvânt pe baza cuvintelor exprimate în prealabil;

- analiza semantica este metoda prin care se verifica întelesul cuvântului ales;

- analiza pragmatica este metoda prin care se face o estimare a cuvintelor care ar putea fi rostite.

Preview document

Procesarea Semnalelor Vorbirii - Pagina 1
Procesarea Semnalelor Vorbirii - Pagina 2
Procesarea Semnalelor Vorbirii - Pagina 3
Procesarea Semnalelor Vorbirii - Pagina 4
Procesarea Semnalelor Vorbirii - Pagina 5
Procesarea Semnalelor Vorbirii - Pagina 6
Procesarea Semnalelor Vorbirii - Pagina 7
Procesarea Semnalelor Vorbirii - Pagina 8
Procesarea Semnalelor Vorbirii - Pagina 9
Procesarea Semnalelor Vorbirii - Pagina 10
Procesarea Semnalelor Vorbirii - Pagina 11
Procesarea Semnalelor Vorbirii - Pagina 12
Procesarea Semnalelor Vorbirii - Pagina 13
Procesarea Semnalelor Vorbirii - Pagina 14
Procesarea Semnalelor Vorbirii - Pagina 15
Procesarea Semnalelor Vorbirii - Pagina 16
Procesarea Semnalelor Vorbirii - Pagina 17
Procesarea Semnalelor Vorbirii - Pagina 18
Procesarea Semnalelor Vorbirii - Pagina 19
Procesarea Semnalelor Vorbirii - Pagina 20
Procesarea Semnalelor Vorbirii - Pagina 21
Procesarea Semnalelor Vorbirii - Pagina 22
Procesarea Semnalelor Vorbirii - Pagina 23
Procesarea Semnalelor Vorbirii - Pagina 24
Procesarea Semnalelor Vorbirii - Pagina 25
Procesarea Semnalelor Vorbirii - Pagina 26
Procesarea Semnalelor Vorbirii - Pagina 27
Procesarea Semnalelor Vorbirii - Pagina 28
Procesarea Semnalelor Vorbirii - Pagina 29
Procesarea Semnalelor Vorbirii - Pagina 30
Procesarea Semnalelor Vorbirii - Pagina 31
Procesarea Semnalelor Vorbirii - Pagina 32
Procesarea Semnalelor Vorbirii - Pagina 33
Procesarea Semnalelor Vorbirii - Pagina 34
Procesarea Semnalelor Vorbirii - Pagina 35
Procesarea Semnalelor Vorbirii - Pagina 36
Procesarea Semnalelor Vorbirii - Pagina 37
Procesarea Semnalelor Vorbirii - Pagina 38
Procesarea Semnalelor Vorbirii - Pagina 39
Procesarea Semnalelor Vorbirii - Pagina 40
Procesarea Semnalelor Vorbirii - Pagina 41
Procesarea Semnalelor Vorbirii - Pagina 42
Procesarea Semnalelor Vorbirii - Pagina 43
Procesarea Semnalelor Vorbirii - Pagina 44
Procesarea Semnalelor Vorbirii - Pagina 45
Procesarea Semnalelor Vorbirii - Pagina 46
Procesarea Semnalelor Vorbirii - Pagina 47
Procesarea Semnalelor Vorbirii - Pagina 48
Procesarea Semnalelor Vorbirii - Pagina 49
Procesarea Semnalelor Vorbirii - Pagina 50
Procesarea Semnalelor Vorbirii - Pagina 51
Procesarea Semnalelor Vorbirii - Pagina 52
Procesarea Semnalelor Vorbirii - Pagina 53
Procesarea Semnalelor Vorbirii - Pagina 54
Procesarea Semnalelor Vorbirii - Pagina 55
Procesarea Semnalelor Vorbirii - Pagina 56
Procesarea Semnalelor Vorbirii - Pagina 57
Procesarea Semnalelor Vorbirii - Pagina 58
Procesarea Semnalelor Vorbirii - Pagina 59
Procesarea Semnalelor Vorbirii - Pagina 60
Procesarea Semnalelor Vorbirii - Pagina 61
Procesarea Semnalelor Vorbirii - Pagina 62
Procesarea Semnalelor Vorbirii - Pagina 63

Conținut arhivă zip

  • Coperta.doc
  • Cuprins Proiect.doc
  • Proiect Dizertatie Master.doc

Alții au mai descărcat și

Dispozitiv pentru controlul iluminatului stradal cu LED-uri și panouri fotovoltaice

INTRODUCERE Iluminatul exterior în comunitățile urbane este utilizat atât pentru orientarea și deplasarea în siguranță pe timp de noapte a...

Detecția dacă se vorbește, din sunet

Introducere în temă Lucrarea de faţă îşi propune să analizeze semnalele vocale, să filtreze şi să detecteze aceste semnale astfel încât la final...

Proiect Semestrial APSC - Pitch Scaling

Pitch scaling Ce ne-am propus? Vrem sa modificam tonalitatea semnalului vocal dar fara sa ii schimbam caracteristicile.Ne propunem sa investigam...

Radio Data System

1.Introducere asupra functionarii unui Radio "Undele radio" transmit muzica,conversatii,imagini si date in mod invizibil,prin aer,deseori la...

Sisteme și tehnici multimedia

Modulație în frecvență (FM) este un sistem de transmisie radio în care unda purtătoare este modulată astfel încât frecvența sa variază în funcție...

Monitorul

O clasificare sumara a monitoarelor ar putea fi dupa unul din criteriile : a) dupa culorile de afisare -monitoare monocrome (afiseaza doar doua...

Stabilizator de Tensiune

3. Functionarea În general, pentru realizarea stabilizatoarelor de tensiune se folosesc proprietatile diodelor. Cel mai simplu tip de...

Te-ar putea interesa și

Nivelul Fizic al Sistemului de Comunicație GSM

CAPITOLUL I EVOLUŢIA CĂTRE SISTEMELE RADIO MOBILE CELULARE Trăim într-o lume a mişcării continue. Şi singura soluţie pentru a nu pierde...

Program de Sintetizare a Vocii

INTRODUCERE În lucrare dată am reprezentat mai multe metode de sinteză a semnalului vocal, analizîndu-le concomitent, şi am observat că predicţia...

Filtre Numerice

INTRODUCERE Filtrarea semnalelor reprezinta o operatie de baza in prelucrarea informaţiei.Poate facută fie analogic(cu ajutorul unor retele R L C...

Utilizarea Rețelelor Neuronale în Recunoașterea Vorbirii

1. Aspecte generale Recunoasterea vorbirii este unul din domeniile prelucrarii de semnal vocal de deosebit interes în momentul de fata. Succesul...

Sinteza Vorbirii în Dispozitivele de Calcul

Capitol I Domeniile tehnologiei vorbirii 1.1 Introducere Incă din cele mai vechi timpuri comunicarea prin voce a reprezentat modalitatea...

Strategii de formare-exersare a rolului de emitator-receptor al unui mesaj la copilul preșcolar

Pentru a delimita coordonatele unei didactici a comunicării remarcăm faptul că procesul comunicativ implică plasarea educatorului/educatoarei,...

Arhitecturi de magistrale memorie pentru procesoare DSP

Introducere. Ce este arhitectura de memorie? Caracteristicile organizării memoriei și interconectarea acesteia cu calea de date a procesorului se...

Subiecte senzori inteligenți

1. Senzori Quasi-Digitali. Senzori Digitali • Sensorii quasi-digitali combina simplitatea si universalitatea caracteristica unui senzor analog si...

Ai nevoie de altceva?