Español
[fr - it - pt - ro]

Publicaciones
Estudio sobre el lugar del francés en Internet
Introducción
Metodología
Límites de la metodología
Antecedentes
El lugar del francés en la red
Repartición de las páginas en francés por países
Conclusiones
Anexos

Titulares
Terminometro
Termilat
Agenda
Eventos
Eventos pasados
Estudio sobre el lugar del francés en Internet

Metodología  

 

 
 

El proceso que permite obtener datos en la web francófona se apoya en los trabajos realizados por FUNREDES desde 1996 sobre el lugar que ocupan las lenguas latinas en Internet (http://funredes.org/LC/) con el apoyo metodológico de la Unión Latina para la parte lingüística. Este estudio permite actualizar los resultados del estudio L5 llevado a cabo por FUNREDES en 2001. Los detalles relativos a la metodología, así como los resultados obtenidos en las precedentes mediciones, se encuentran disponibles en la página http://funredes.org/LC/francais/L5/.

El método se basa en el estudio del índice de un cierto número de motores de búsqueda tales como Google o Alltheweb, así como en la selección de una muestra de términos [1] según criterios lingüísticos [2] establecidos para garantizar la calidad de los resultados. El resultado obtenido aplicando métodos estadísticos clásicos [3] a los datos es una indicación [4] del peso relativo de las lenguas latinas en relación con el inglés. Para deducir de ello el valor absoluto del peso de las lenguas latinas en Internet, es necesario establecer una hipótesis acerca del peso absoluto del inglés en la Red, lo cual se hace por intersección. La utilización continua de este método desde 1998 permite presentar una imagen de la evolución del peso del francés en Internet en el transcurso de los últimos 5 años.

En cada iteración de este estudio, es necesario analizar el comportamiento de los motores de búsqueda tanto en su modo de indizar las páginas presentes en Internet como en la manera en que éstos gestionan el resultado de las búsquedas. Una vez este análisis hecho, se selecciona el motor que mejor responde a los criterios del estudio. En ciertos casos, cuando las anomalías detectadas responden de manera coherente a una lógica comprensible –como a menudo es el caso en la gestión de los diacríticos–, se corrigen los resultados.

La metodología utilizada para obtener la repartición del Internet francófono entre los distintos países retoma el procedimiento establecido para el caso de la lengua española en 2001, con motivo del Congreso Internacional de la Lengua Española de Valladolid [5]. Se aplica selectivamente el método de conteo a partir de las palabras de la muestra lingüística en el interior de los dominios de Internet en cuestión. El motor de búsqueda mide de este modo el número de ocurrencias de las palabras de la muestra por dominio [6] (.com, .net, .fr, .sn…). Para cada palabra de la muestra, se obtiene una repartición por dominio [7]. La media de estos resultados da una idea de la repartición del Internet francófono por dominio.


Notas
 

[1] Ver la muestra en la página
http://funredes.org/LC/francais/L5/L5appendix_3.html#table_15.

[2] Ver la lista de los criterios de selección lingüísticos que permiten acercarse a una significación y a un alcance semántico equivalentes, así como evitar las distorsiones: http://funredes.org/LC/francais/L5/L5appendix_7.html.

[3] El método de Fischer se aplica partiendo de la hipótesis de una repartición normal.

[4] La media de los valores, así como los "intervalos de confianza", se establecen a 90 y 99%.

[5] Documento original en español: http://funredes.org/LC/L5/valladolid.html.
Documento en francés que presenta los mismos trabajos:
http://funredes.org/LC/L5/CahiersNumFinal.html.

[6] Se toman en cuenta 85 dominios, o sea más de 11.000 búsquedas gestionadas automáticamente.

[7] Por ejemplo: una búsqueda en Google con la palabra "vérité" genera 700.000 ocurrencias. Si se restringe esta búsqueda al dominio .fr, el resultado se reduce a 202.000, es decir el 29% de 700.000; si se restringe al dominio canadiense .ca, se encuentran 75.000, o sea un poco más del 10%; si se aplica al dominio de Marruecos (.ma), el resultado es de 2.000, es decir aproximadamente un 0,3%.






131, rue du Bac - F-75007 Paris
T: (33 1) 45 49 60 62   /   F: (33 1) 45 49 67 39
dtil@unilat.org
webmaster