[es]  [fr]  [it]  [pt]  [ro]
Llengües i cultures a la Xarxa ― Estudi 2007

Anàlisis de l'evolució dels cercadors

Des de l'any 2005 entenem que els resultats obtinguts del ciberespai indexat pels cercadors (Google el 2005) no podien representar de manera vàlida tot l'espai de la Xarxa ja que la cobertura dels motors s'ha reduït a una finestra més estreta (60-80 % de l'espai). Aquest estudi confirma la poca fiabilitat de les dades obtingudes en 2006 pel mateix cercador i estableix clarament que Google presenta certes incongruències que ens obliguen a prescindir d'ell en tant que motor de cerca en el que basar la nostra metodologia. Després de llargs estudis s'arriba a la conclusió que Altavista té un funcionament més adequat per a participar a la nostra metodologia de manera fiable, atès que en aquesta última és important el factor de coherència en els resultats de comptabilitat d'ocurrències de paraules per motors.

Al mateix temps, l'estudi dóna un nou resultat que posa en perill la coherència en la continuïtat dels resultats. Fins a l'any 2005, els valors relatius a la presència de les llengües a la Xarxa, segons diferents motors de cerca, eren molt similars, i es trobaven dins dels intervals estadístics de confiança. La reducció de la proporció de pàgines indexades i les estratègies comercials pròpies de cada motor condueixen a la possible pèrdua definitiva d'aquesta propietat. Així, ja no podem afirmar que els nostres resultats reflecteixen la situació de les llengües a la Xarxa, sinó que només reflecteixen el panorama de les llengües a l'espai indexat pel motor de cerca utilitzat a l 'estudi.

Com demostració de la situació exposada anteriorment podem citar els resultats obtinguts amb el cercador Exalead, el qual ofereix resultats considerablement superiors a les cerques en francès.

Un altre factor important en aquesta edició ha estat la gran irrupció de la publicitat a la Xarxa, ocasionant efectes difícils de mesurar en la nostra metodologia. Existeixen innombrables pàgines que són simples llistes d'anuncis publicitaris i altres en les que apareixen anuncis intertextuals (GoogleAds) que són considerats com a part del contingut. Així doncs apareixen paraules que sense tenir res a veure amb el contingut de la pàgina donen valor a unes o altres paraules (podem visitar una pàgina de cavalls on abans mai apareixia la paraula “groc”, però ara un anunci de GoogleAds diu “visita el ranxo Groc”). La publicitat s'ha convertit en un amplificador que es tradueix en un avantatge pels idiomes predominants (anglès) i, encara que en menys grau, pels idiomes emergents (especialment el xinès) com en el cas del romanès, el qual aconsegueix un creixement considerable. Per a fer front a aquesta nova situació i la seva influència negativa en els nostres resultats (especialment per l'espanyol), hem desenvolupat tècniques destinades a contrarestar els efectes de la publicitat.

 

 

 

 

ESTUDI 2007
Anàlisis i interpretació dels resultats
Annex
Anàlisis de l'evolució dels cercadors
Resultats de l'estudi sobre la cultura
ESTUDI 2005
ESTUDI 2002
ESTUDI 2001

 

 

 

 

Terminometro | Llengües i cultures a la Xarxa ― Estudi 2007 | Portalingua | Agenda | Altres enllaços

Unió Llatina
Direcció Terminologia i Indústries de la Llengua - DTIL
131, rue du Bac - F-75007 París
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org