[ca]  [es]  [fr]  [it]  [pt]
Limbile şi culturile pe Internet ― Studiu 2007

Analiza evoluţiei motoarelor de căutare

Din 2005 ştim că rezultatele obţinute în ciberspaţiu indexat cu motoare de căutare (Google în 2005) nu reprezintă întregul spaţiu web pentru că motoarele de căutare acoperă numai 60-80 % din spaţiu. Acest studiu confirmă lipsa de fiabilitate a rezultatelor obţinute în 2006 prin acest motor şi stabileşte clar că Google prezintă anumite incoerenţe care ne obligă să-l eliminăm din metodologie.

În urma unor studii multiple am ajuns la concluzia că Altavista este motorul de căutare cel mai potrivit metodologiei noastre.

În acelaşi timp studiul obţine un rezultat care pune în pericol coerenţa în continuitatea rezultatelor. Până în 2005, valorile relative ale prezenţei limbilor pe Internet, conform unor motoare de căutare, erau foarte asemănătoare, situându-se în intervalele statistice de încredere. Reducerea proporţiei paginilor indexate şi strategiile comerciale proprii fiecărui motor de căutare au condus la o posibilă pierdere definitivă a acestei proprietăţi. Astfel, nu putem să afirmăm că rezultatele noastre reflectă situaţia limbilor pe Internet ci, mai curând, o panoramă a limbilor în spaţiul indexat cu motorul de căutare utilizat de studiu.

Pentru a ilustra situaţia descrisă mai sus, putem să cităm rezultatele obţinute cu motorul Exalead, care au fost considerabil mai ridicate pentru cercetările în limba franceză.

Trebuie să semnalăm un alt factor important în acest studiu, şi anume invazia de publicitate în pe Internet, care a produs efecte dificil de măsurat prin metodologia noastră. Numeroase pagini web abundă de anunţuri publicitare şi de alte anunţuri intertextuale (GoogleAds) considerate ca făcând parte integrantă din conţinut. Apar astfel termeni, care, fără nici o legătură cu conţinutul siteului dau valori unor termeni (se poate vizita, de exemplu, o pagină despre cai în care nu mai apăruse niciodată „amarillo” dar care, printr-un anunţ GoogleAds, propune vizitarea „rancho-ului Amarillo”). Publicitatea s-a transformat într-un amplificator care devine un avantaj pentru limbile predominante (engleza) şi, într-o mică măsură pentru limbile emergente (în special chineza, dar şi româna care înregistrează o creştere considerabilă). Pentru a face faţă acestei noi situaţii şi a influenţei sale dăunătoare asupra rezultatelor noastre (în special pentru spaniolă) am dezvoltat tehnici menite să neutralizeze efectele publicităţii.

 

 

 

 

STUDIU 2007
Analiza şi interpretarea rezultatelor
Anexă
Analiza evoluţiei motoarelor de căutare
STUDIU 2005
STUDIU 2002
STUDIU 2001

 

 

 

 

Terminometro | Lenguas y culturas en la red ― Estudio 2007 | Portalingua | Agenda | Otros enlaces

Unión Latina
Dirección Terminología e Industrias de la Lengua - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org