Motoare de căutare pe web

Proiect
8/10 (1 vot)
Domeniu: Calculatoare
Conține 1 fișier: doc
Pagini : 64 în total
Cuvinte : 14635
Mărime: 41.79KB (arhivat)
Publicat de: Stancu Păduraru
Puncte necesare: 11

Cuprins

  1. Introducere 4
  2. Partea I 12
  3. Prezentarea conceptelor implicate 12
  4. 1.1 INTERNET 13
  5. 1.1.1 ARPANET 13
  6. 1.1.2 NSFNET 17
  7. 1.1.3 Internet-ul 19
  8. 1.1.4 Adrese IP 29
  9. 1.2 WORLD WIDE WEB 31
  10. 1.2.1 Prezentarea WWW 31
  11. 1.2.2 HTML si URI 35
  12. 1.3 UNIX 38
  13. 1.3.1 Introducere 38
  14. 1.3.2 Istoria UNIX 38
  15. Partea II 46
  16. Proiectarea si implementarea 46
  17. motorului de cautare 46
  18. 2.1 SPECIFICAREA CERINTELOR 47
  19. 2.1.1 Abstractizarea cerintelor 47
  20. 2.1.2 Limitari ale posibilitatilor de realizare a obiectivelor si probleme care trebuiesc solutionate 48
  21. 2.1.3 Observatii privind alegerea cerintelor aplicatiei curente 53
  22. 2.1.4 Specificarea propriu zisa a cerintelor 55
  23. 2.2 STRATEGIILE ALESE IN IMPLEMENTARE 57
  24. 2.2.1. Spider-ul 57
  25. 2.2.2 Observatii asupra bazei de date 60
  26. 2.3 IMPLEMENTAREA 69
  27. 2.3.1 Alegerea strategiilor de implementare 69
  28. 2.3.2 Spider-ul 69
  29. Bibliografie 77

Extras din proiect

Introducere

Pana in 1990 Internetul a fost folosit cu precadere de catre cercetatori din domeniul academic, guvernamental si industrial. Cateva aplicatii (de exemplu e-mail*, telnet, ftp) erau intr-adevar de interes mai larg. Dar ceea ce a facut ca popularitatea sa sa creasca fara precedent, in randul a milioane de utilizatori din toate domeniile, a fost o aplicatie noua, WWW (World Wide Web - sau mai simplu : WEB). Acesta aplicatie, inventata de fizicianul Tim Berners Lee de la CERN, nu a modificat nici una din facilitatile existente, in schimb le-a facut mai usor de folosit. Impreuna cu programul de navigare Mosaic, scris la Centrul National pentru Aplicatiile Supercalculatoarelor, WWW-ul a facut posibil ca un sit sa puna la dispozitie un numar de pagini de informatii continand text, imagini, sunet si chiar imagini video in miscare, in fiecare pagina existand legaturi (referinte) catre alte pagini, lagaturi care puteau referi orice alta informatie din WWW. Printr-un sinplu “clic” cu mouse-ul pe o legatura, utilizatorul este imediat “transportat” la pagina indicata de legatura, oriunde in lume. De exemplu multe firme au pe WEB o pagina principala cu intrari care trimit la pagini cu informatii asupra produselor, liste de preturi, reduceri, suport tehnic (online), comunicare cu angajatii, informatii despre actionari, etc. Pagina poate contine si referinte la paginile altor sucursale (departate geografic) ale aceleiasi firme, toate putand fi accesate ca un tot unitar.

Intr-un timp foarte scurt au aparut alte tipuri de pagini: hartio, tabele de cotatii la bursa, cataloage de biblioteca, programe radio inregistrate si chiar pagini continand textele complete ale unor carti carora le-au expirat drepturile de autor (Mark Twain, Charles Dickens, etc). De asemenea multi oameni au pagini personale (home pages).

In primul an de la lansarea Mosaic-ului, numarul de servere WWW a crescut de la 1000 la 7000. Aceasta enorma crestere va continua, fara indoiala, in urmatorii ani si va reprezenta, probabil, forta care va conduce tehnologia si utilizarea Internet-ului in mileniul III. Informatia de pe WEB se mareste in fiecare secunda, noi si noi posibilitati deschizandu-se. Dar dupa o era de explozie a informatiei trebuie in mod necesar sa apara si o era de structurare a sa. Multe pagini WEB au inca o structura haotica, libertatea de legare a paginilor ducand deseori la structuri greu de urmarit si inteles. Pe langa acest aspect caruia in ultimul timp i se acorda o mai mare atentie, volumul mare de informatii creeaza inca o problema : problema gasirii si regasirii informatiei dorite. Daca pentru regasirea informatiei fiecare utilizator isi poate creea “Bookmarks-uri” cu diferite structuri, cautarea unei informatii este o sarcina mult mai grea. Adeseori cere experienta si chiar noroc. Din punct de vedere al structurii, WEB-ul reprezinta un graf cu o mare conectivitare (se poate avansa conjectura ca 90% din el este un graf conex, langa care coexista insulite mici neconectate). Astfel ca teoretic, pornind de la o pagina situata in aceste cel mai mare subgarf conex, poti parcurge 90% din informatia de pe Web, de fapt cvasitotalitatea informatiei de larg interes. Algoritmi de parcurgere si cautare intr-un graf conex exista. Dar problema nu este gasirea unui algoritm de parcurgere, ci timpul necesar acestei cautari, datorita dimensiunii grafului. Se pot imagina automate care sa caute pe Internet (pe nivele de exemplu, cautarea in adancime avand un grad prea mare de recursivitate), dar parcurgerea informatiilor intregului Web - datorita si vitezei conexiunilor - este o sarcina practic imposibila.

De aceea se cauta noi modalitati de structurare a informatiilor pe WEB. S-a inceput cu liste de pagini principale, cu o descriere sumara a ceea ce se gaseste pe respectivul sit. Aceasta a dat rezultate o vreme, dar in scurt timp listele au capatat dimensiuni enorme, trecandu-se la structurarea lor pe domenii si subdomenii. Dar si acestea s-au dovedit a nu fi in stare sa ofere o cantitate de informatii suficienta utilizatorului care vrea sa caute ceva pe WEB. Munca de intretinere a informatiilor era enorma, si chiar solutia de a limensiuni enorme, trecandu-se la structurarea lor pe domenii si subdomenii.

Preview document

Motoare de căutare pe web - Pagina 1
Motoare de căutare pe web - Pagina 2
Motoare de căutare pe web - Pagina 3
Motoare de căutare pe web - Pagina 4
Motoare de căutare pe web - Pagina 5
Motoare de căutare pe web - Pagina 6
Motoare de căutare pe web - Pagina 7
Motoare de căutare pe web - Pagina 8
Motoare de căutare pe web - Pagina 9
Motoare de căutare pe web - Pagina 10
Motoare de căutare pe web - Pagina 11
Motoare de căutare pe web - Pagina 12
Motoare de căutare pe web - Pagina 13
Motoare de căutare pe web - Pagina 14
Motoare de căutare pe web - Pagina 15
Motoare de căutare pe web - Pagina 16
Motoare de căutare pe web - Pagina 17
Motoare de căutare pe web - Pagina 18
Motoare de căutare pe web - Pagina 19
Motoare de căutare pe web - Pagina 20
Motoare de căutare pe web - Pagina 21
Motoare de căutare pe web - Pagina 22
Motoare de căutare pe web - Pagina 23
Motoare de căutare pe web - Pagina 24
Motoare de căutare pe web - Pagina 25
Motoare de căutare pe web - Pagina 26
Motoare de căutare pe web - Pagina 27
Motoare de căutare pe web - Pagina 28
Motoare de căutare pe web - Pagina 29
Motoare de căutare pe web - Pagina 30
Motoare de căutare pe web - Pagina 31
Motoare de căutare pe web - Pagina 32
Motoare de căutare pe web - Pagina 33
Motoare de căutare pe web - Pagina 34
Motoare de căutare pe web - Pagina 35
Motoare de căutare pe web - Pagina 36
Motoare de căutare pe web - Pagina 37
Motoare de căutare pe web - Pagina 38
Motoare de căutare pe web - Pagina 39
Motoare de căutare pe web - Pagina 40
Motoare de căutare pe web - Pagina 41
Motoare de căutare pe web - Pagina 42
Motoare de căutare pe web - Pagina 43
Motoare de căutare pe web - Pagina 44
Motoare de căutare pe web - Pagina 45
Motoare de căutare pe web - Pagina 46
Motoare de căutare pe web - Pagina 47
Motoare de căutare pe web - Pagina 48
Motoare de căutare pe web - Pagina 49
Motoare de căutare pe web - Pagina 50
Motoare de căutare pe web - Pagina 51
Motoare de căutare pe web - Pagina 52
Motoare de căutare pe web - Pagina 53
Motoare de căutare pe web - Pagina 54
Motoare de căutare pe web - Pagina 55
Motoare de căutare pe web - Pagina 56
Motoare de căutare pe web - Pagina 57
Motoare de căutare pe web - Pagina 58
Motoare de căutare pe web - Pagina 59
Motoare de căutare pe web - Pagina 60
Motoare de căutare pe web - Pagina 61
Motoare de căutare pe web - Pagina 62
Motoare de căutare pe web - Pagina 63
Motoare de căutare pe web - Pagina 64

Conținut arhivă zip

  • Motoare de Cautare pe Web.doc

Alții au mai descărcat și

Motoare de căutare

Motorul de căutare este un server care accesează Internet-ul în mod automat şi stochează titlul, cuvinte cheie şi conţinutul paginilor ce compun...

Arhitectura calculatoarelor - Intel vs AMD

Rezultatele din testul 3DS Max 7 SPECapc Test Testul alaturat consta in crearea modelelor 3D, modificarea si randarea scripturilor. Conform...

Autentificarea prin semnătură digitală

Introducere O semnatura digitala reprezinta o informatie care il identifica pe expeditorul unui document. Semnatura digitala este creata prin...

Sistem de Prognosticare a Unei Avarii

Acest sistem calculeaza gradul de avariere a unei cladiri în cazul unui cutremur, precum si posibila necesitate a reconstructiei cladirii (partiala...

Te-ar putea interesa și

Campania de promovare online a Pensiunii Montana

INTRODUCERE Fiind un sistem de schimbare a informatiilor, cel mai important aspect al Internetului este puterea lui de conectare, abilitatea de a...

Teză de licență - formarea unui portal informativ

Introducere Actualitatea temei: Societatea informaţională este societatea în care producerea şi consumul de informaţie este cel mai important tip...

Promovarea și Comercializarea Produselor IT cu Ajutorul Tehnologiei ASP

E-BUSINESS (COMERŢ ELECTRONIC) Odată cu trecerea timpului limitele internetului devin tot mai îndepărtate, acesta fiind foarte practic şi folosit...

Structura unui site web

Argument Am ales ca subiect această temă de proiect deoarece mi s-a părut foarte interesant. Sunt de părere că această tehnologie modernă este...

Marketing pe Internet

Capitolul 1 Scurt istoric al Internetului Lucrul extraordinar în ceea ce priveste Internetul este rapiditatea cu care acesta a patruns în viata...

Motoare de căutare

Un motor de căutare este un program care accesează Internetul în mod automat şi frecvent şi care stochează titlul, cuvinte cheie şi parţial chiar...

Internetul

1.Argumentul Multe persoane cred ca Internet-ul este un loc unde se discuta numai despre informatica, unde se întâlnesc numai pasionatii de...

Realizarea Site-urilor

Programul de creatie Microsoft® FrontPage – programul de creatie pentru Web, este inclus in unele versiuni ale pachetului Microsoft® Office (97,...

Ai nevoie de altceva?