![]() |
|
||||||||||||||||
|
|||||||||||||||||
Des de l'any 2005 entenem que els resultats obtinguts del ciberespai indexat pels cercadors (Google el 2005) no podien representar de manera vàlida tot l'espai de la Xarxa ja que la cobertura dels motors s'ha reduït a una finestra més estreta (60-80 % de l'espai). Aquest estudi confirma la poca fiabilitat de les dades obtingudes en 2006 pel mateix cercador i estableix clarament que Google presenta certes incongruències que ens obliguen a prescindir d'ell en tant que motor de cerca en el que basar la nostra metodologia. Després de llargs estudis s'arriba a la conclusió que Altavista té un funcionament més adequat per a participar a la nostra metodologia de manera fiable, atès que en aquesta última és important el factor de coherència en els resultats de comptabilitat d'ocurrències de paraules per motors. Al mateix temps, l'estudi dóna un nou resultat que posa en perill la coherència en la continuïtat dels resultats. Fins a l'any 2005, els valors relatius a la presència de les llengües a la Xarxa, segons diferents motors de cerca, eren molt similars, i es trobaven dins dels intervals estadístics de confiança. La reducció de la proporció de pàgines indexades i les estratègies comercials pròpies de cada motor condueixen a la possible pèrdua definitiva d'aquesta propietat. Així, ja no podem afirmar que els nostres resultats reflecteixen la situació de les llengües a la Xarxa, sinó que només reflecteixen el panorama de les llengües a l'espai indexat pel motor de cerca utilitzat a l 'estudi. Com demostració de la situació exposada anteriorment podem citar els resultats obtinguts amb el cercador Exalead, el qual ofereix resultats considerablement superiors a les cerques en francès. Un altre factor important en aquesta edició ha estat la gran irrupció de la publicitat a la Xarxa, ocasionant efectes difícils de mesurar en la nostra metodologia. Existeixen innombrables pàgines que són simples llistes d'anuncis publicitaris i altres en les que apareixen anuncis intertextuals (GoogleAds) que són considerats com a part del contingut. Així doncs apareixen paraules que sense tenir res a veure amb el contingut de la pàgina donen valor a unes o altres paraules (podem visitar una pàgina de cavalls on abans mai apareixia la paraula “groc”, però ara un anunci de GoogleAds diu “visita el ranxo Groc”). La publicitat s'ha convertit en un amplificador que es tradueix en un avantatge pels idiomes predominants (anglès) i, encara que en menys grau, pels idiomes emergents (especialment el xinès) com en el cas del romanès, el qual aconsegueix un creixement considerable. Per a fer front a aquesta nova situació i la seva influència negativa en els nostres resultats (especialment per l'espanyol), hem desenvolupat tècniques destinades a contrarestar els efectes de la publicitat.
|
|
||||||||||||||||
| Lenguas y culturas en la red ― Estudio 2007 | Portalingua | | Unión Latina |