Bazele Stiintei Informatiei

Imagine preview
(8/10)

Acest referat descrie Bazele Stiintei Informatiei.
Mai jos poate fi vizualizat un extras din document (aprox. 2 pagini).

Arhiva contine 1 fisier doc de 11 pagini .

Profesor indrumator / Prezentat Profesorului: Nicolae Dragulanescu

Iti recomandam sa te uiti bine pe extras si pe imaginile oferite iar daca este ceea ce-ti trebuie pentru documentarea ta, il poti descarca. Ai nevoie de doar 4 puncte.

Domeniu: Comunicare

Extras din document

Conceptul de <information retrieval> . Cuvantul “informatie” poate fi foarte inselator. In contextul regasirii de informatii, informatia, in sensul tehnic dat de teoria lui Shanon nu poate fi usor masurata. De fapt, in multe cazuri se poate descrie regasirea informatiei prin simpla inlocuire a cuvantului “document” cu “informatie”. Termenul de “regasire a informatiei” poate fi foarte vast. Simplul fapt ca scoti un card de credit din portofel pentru a scrie numarul cardului intr-un formular este o forma de regasire a informatiei. Totusi, o definitie academica poate fi formulata astfel:

Regasirea informatiei consta in cautarea materialelor (intr-o forma nestructurata, de obicei text) necesare pentru satisfacerea nevoile utilizatorului intr-o baza de date.

Regasirea informatiilor nu a inceput cu Web-ul. Ca raspuns la diferitele provocari de a furniza acces la informatii, domeniul de regasire a informatiilor a evoluat pentru a oferi mai multe posibilitati de abordare in cautarea diferitelor forme de continut. Acest domeniu a inceput cu publicatii stiintifice si inregistrari de biblioteca, insa curand a evoluat la alte forme de continut, in special informatii de specialitate. Totusi, in ultimii ani, principalul conducator al inovatiei a fost World Wide Web-ul, publicand informatii de ordinul milioanelor de creatori de continut.

Motoarele de căutare sunt cele mai importnate şi cele mai utilizate instrumente de regasire a informatiei, ce au indecşi foarte mari şi incearcă să utilizeze o arhitectură centralizată pentru rezolvarea problemei căutării informaţiilor într-un mediu descentralizat. Aceste motoare de căutare sunt echipate cu mai mulţi roboţi de căutare, ce explorează spaţiul informaţional al Web-ului.

Tehnici de regasire a informatiei sunt:

1. Robotii web. Motoarele de cautare stocheaza informatii despre un numar mare de pagini pe care le indentifica chiar ele pe Web. Aceste pagini sunt gasite de catre un robot web – un browser automat ce urmareste fiecare legatura gasita. Roboţii web sunt folosiţi în principal pentru a crea o copie a tuturor paginilor vizitate pentru o procesare ulterioară de către un motor de căutare. Acesta din urmă va indexa paginile descărcate pentru a facilita căutari rapide.

2. Serviciul de navigare (Favorites (bookmarks), History) prin intermediul cautarii dupa adresa paginii sau a site-ului care contine informatia.

3. Serviciul de cautare automata (Search engines) prin gasirea in continutul documentelor a cuvintelor cheie care definesc informatia cautata.

Tehnici de regasire a imaginilor sunt:

1. Google.com

2. Picassa.google.com

Tehnici de regasire a muzicii sunt:

1. Youtube.com

2. Trilulilu.com

Abordarea standard in ceea ce priveste regasirea informatiei are la baza notiunile de documente relevante sau irelevante. Atunci cand cautam o informatie, un anumit document dintr-o colectie primeste o combinatie binara care spune daca acesta este relevant sau nu cautarii noastre. Aceasta decizie este cunoscuta ca “standardul de aur” al relevantei.

Relevanta este evaluata sub forma unei interogari de forma “si” sau “nu”. Spre exemplu, o informatie cautata poate fi:

“Daca bei vin rosu ai mai putine sanse sa faci stop cardiac decat daca bei vin alb”

Aceasta formulare poate fi tradusa intr-o interogare sub forma:

“vin si rosu si alb si inima si stop cardiac”.

Astfel, un document este relevant daca se refera la informatia ceruta si nu pentru ca se intampla sa contina toate cuvintele din interogare. Aceasta distinctie este de obicei prost inteleasa in practica deoarece informatia necesitata nu este evidenta. Daca introducem o interogare formata dintr-un singur cuvant, vom primi rezultate referitoare la mai multe domenii care pot include acel cuvant. De aceea, atunci cand cautam o anumita informatie trebuie sa fim mai specifici pentru a primi exact rezultatele pe care le dorim.

Pentru aceasta, s-au formulat cateva reguli de urmat pentru o cautare eficienta cu ajutorul unui motor de cautare:

1. Utilizarea cuvintelor cheie – cuvintele cele mai semnificative pentru informatia dorita

2. Scrierea concisa a ceea ce dorim sa aflam (esentialul informatiei) – evitarea introducerii detaliilor in motorul de cautare.

3. Fraze integrale. Pentru a vedea doar site-urile care contin explicit cuvintele cheie cautate se pot folosi ghilimelele.

4. Excluderea anumitor cuvinte cheie. Presupunand ca vrem sa aflam informatii despre masini decapotabile dar nu ne intereseaza in mod special marca Ford. Pentru a elimina rezultatele care contin acest cuvant folosim simbolul “-“

5. x SAU y. Daca vrem sa cautam o informatie SAU alta, putem folosi cuvantul OR in interiorul interogarii.

6. Definitii de cuvinte. Pentru a afla definitia unui cuvant se foloseste define.

7. Pentru o cautare mai eficienta se introduc termenii cautati in limba engleza.

Cateva functionalitati accesibile prin motorul de cautare www.google.ro pot fi:

1. Cautare de imagini

2. Cautare de videoclipuri

3. Cautare de harti

4. Traducerea paginilor accesate

5. Posibilitatea instalarii unui motor de cautare in calculatorul propriu

Wikipedia este o enciclopedie libera, dezvoltata în mod colaborativ de către voluntari (oricine poate edita orice pagină din Wikipedia). De asemenea, este foarte important faptul că licenta sub care apar toate materialele din Wikipedia garantează faptul că orice contributie la Wikipedia este făcută în interes public, fără nici o posibilitate ca vreo persoană fizică sau juridică să-si însusească aceste materiale. Utilitatea acestei enciclopedii virtuale constă în posibilitatea găsirii foarte rapide a unor informaţii din orice domeniu.

In ceea ce priveste avantajele si dezavantajele translatorului electronic, spre exemplu translatorul electronic Google a ajuns la performanţa de a traduce în 41 de limbi, ceea ce înseamnă un beneficiu de 98% a celor ce utilizează acest tip de funcţionalitate Google. Google translate are avantajul de a putea găsi în cel mai rapid mod posibil traducerea la aproape orice cuvânt din aproape orice limbă. Unul dintre dezavantaje este acela că google translate conţine, în principal, cuvinte uzual utilizate, şi mai puţin cuvinte de specialitate.

Ca orice motor de căutare are şi limitări. Google translate ajută cititorul să înţeleagă contextul general al unei traduceri, dar nu redă întotdeauna acurateţea textului.

Fisiere in arhiva (1):

  • Bazele Stiintei Informatiei.doc