El proceso que permite obtener datos en la
web francófona se apoya en los trabajos
realizados por FUNREDES desde
1996 sobre el lugar que ocupan las lenguas
latinas en Internet (http://funredes.org/LC/)
con el apoyo metodológico de la Unión
Latina para la parte lingüística.
Este estudio permite actualizar los resultados
del estudio L5 llevado a cabo por FUNREDES en
2001. Los detalles relativos a la metodología,
así como los resultados obtenidos en las
precedentes mediciones, se encuentran disponibles
en la página http://funredes.org/LC/francais/L5/.
El método se basa en el estudio del índice
de un cierto número de motores de búsqueda
tales como Google o Alltheweb, así como
en la selección de una muestra
de términos [1]
según criterios
lingüísticos [2]
establecidos para garantizar la calidad de los
resultados. El resultado obtenido aplicando métodos
estadísticos clásicos
[3] a los datos es
una indicación [4] del
peso relativo de las lenguas latinas en relación
con el inglés. Para deducir de ello el
valor absoluto del peso de las lenguas latinas
en Internet, es necesario establecer una hipótesis
acerca del peso absoluto del inglés en
la Red, lo cual se hace por intersección.
La utilización continua de este método
desde 1998 permite presentar una imagen de la
evolución
del peso del francés en Internet en el
transcurso de los últimos 5 años.
En cada iteración de este estudio, es
necesario analizar el comportamiento
de los motores de búsqueda tanto
en su modo de indizar las páginas presentes
en Internet como en la manera en que éstos
gestionan el resultado de las búsquedas.
Una vez este análisis hecho, se selecciona
el motor que mejor responde a los criterios del
estudio. En ciertos casos, cuando las anomalías
detectadas responden de manera coherente a una
lógica comprensible –como a menudo
es el caso en la gestión de los diacríticos–,
se corrigen los resultados.
La metodología utilizada para obtener
la repartición del Internet francófono
entre los distintos países retoma el procedimiento
establecido para el caso de la lengua española
en 2001, con motivo del Congreso Internacional
de la Lengua Española de Valladolid
[5]. Se aplica selectivamente
el método de conteo a partir de las palabras
de la muestra lingüística en
el interior de los dominios de Internet en cuestión.
El motor de búsqueda mide de este modo
el número de ocurrencias de las palabras
de la muestra por dominio [6]
(.com, .net, .fr, .sn…). Para cada palabra
de la muestra, se obtiene una
repartición por dominio [7].
La media de estos resultados da una idea de la
repartición del Internet francófono
por dominio.
|