![]() |
||||||||||||||||||
|
||||||||||||||||||
Desde el año 2005 entendemos que los resultados obtenidos del ciberespacio indexado por los buscadores (Google en 2005) no podían representar de manera válida todo el espacio de la Red pues la cobertura de los motores se ha reducido a una ventana más estrecha (60-80 % del espacio). Este estudio confirma la poca fiabilidad de los datos obtenidos en 2006 por el mismo buscador y establece claramente que Google presenta ciertas incongruencias que nos obligan a prescindir de él como motor de búsqueda en el cual se pueda basar nuestra metodología. Después de largos estudios se concluye que Altavista tiene un funcionamiento más adecuado para participar en nuestra metodología de manera fiable, dado que en esta última es importante el factor de coherencia en los resultados de contabilidad de ocurrencias de palabras por motores. Al mismo tiempo, el estudio arroja un nuevo resultado que pone en peligro la coherencia en la continuidad de los resultados. Hasta el año 2005, los valores respectivos a la presencia de las lenguas en la Red, según distintos motores de búsqueda, eran muy similares, encontrándose dentro de los intervalos de confianza estadísticos. La reducción de la proporción de páginas indexadas y las estrategias comerciales propias de cada motor llevan a la posible pérdida definitiva de esta propiedad. Así, ya no podemos afirmar que nuestros resultados reflejan la situación de las lenguas en la Red, sino que solo reflejan el panorama de las lenguas en el espacio indexado por el motor de búsqueda utilizado en el estudio. Como demostración de la situación expuesta anteriormente podemos citar los resultados obtenidos con el buscador Exalead, el cual ofrece resultados considerablemente superiores en las búsquedas en francés. Otro factor importante en esta edición ha sido la gran irrupción de la publicidad en la Red, ocasionando efectos difíciles de medir en nuestra metodología. Existen innumerables páginas que son meras listas de anuncios publicitarios y otras en las que aparecen anuncios intertextuales (GoogleAds) que son considerados como parte del contenido. Así pues aparecen palabras que sin tener nada que ver con el contenido de la página les dan valor a unas u otras palabras (podemos visitar una página de caballos donde antes nunca aparecía la palabra “amarillo”, pero ahora un anuncio de GoogleAds dice “visita el rancho Amarillo”). La publicidad se ha convertido en un amplificador que se traduce en una ventaja para los idiomas predominantes (inglés) y, aunque en menor medida, para los idiomas emergentes (especialmente el chino) como en el caso del rumano que logra un crecimiento considerable. Para hacer frente a esta nueva situación y su influencia negativa en nuestros resultados (especialmente para el español), hemos desarrollado técnicas destinadas a contrarrestar los efectos de la publicidad.
|
|
|||||||||||||||||
| Lenguas y culturas en la red ― Estudio 2007 | Portalingua | | Unión Latina |