- Primera parte: las lenguas
1. Resultados del estudio lingüístico Los resultados se han obtenido procesando una muestra de 57 palabras, seleccionadas para permitir una comparación entre los idiomas lo más rigurosa posible. Para cada una de estas palabras, la relación de los idiomas latinos con respecto al inglés es usada como una variable aleatoria, y se aplican las técnicas de la estadística incluyendo como hipótesis una distribución matemática corriente de esta variable aleatoria (la curva de Gauss, también llamada distribución "normal"). Se han tomado en cuenta dos espacios de Internet para las mediciones: el espacio WWW, explorado con el motor de búsqueda HotBot, y el espacio Usenet, explorado con el motor de búsqueda DejaNews. El capítulo Metodología Internet explica por qué la elección de estos motores de búsqueda y comenta los límites del método, que dependen de los límites de los buscadores respectivos. El esfuerzo realizado en la selección de las palabras de la muestra (lo que se explica en el capítulo Metodología lingüística) ha permitido que los resultados sean estadísticamente de buena calidad, es decir, que la dispersión de las relaciones de cada idioma con respecto al inglés sea relativamente baja, lo que permite establecer un margen bastante estrecho en que la probabilidad de que el valor exacto esté incluido es de 99/100 (lo que los estadísticos llaman "intervalo de confianza"). Los resultados, desde este punto de vista, son mejores en el espacio WWW que en el espacio Usenet, lo que no es sorprendente si se tiene en cuenta el uso frecuente de abreviaciones en los grupos de discusión o tertulias. La calidad de los resultados (y la importancia del intervalo de confianza) varía según los idiomas: muy buena en francés, buena en castellano y en italiano en los dos espacios, buena en portugués en el espacio WWW, pobre en rumano y en portugués en el espacio Usenet. Véase en este sentido el anexo 2.
1.1 Síntesis de los resultados
El cuadro siguiente presenta la relación promedio entre cada idioma latino y el inglés, obtenida a partir de la medición de la cantidad de ocurrencias de las palabras de la muestra en cada uno de los dos espacios estudiados. El francés ocupa el primer lugar en el espacio Internet, seguido de cerca por el castellano. Por el contrario, fenómeno notable, su presencia en el espacio Usenet es pobre.
Cuadro
1:
1.2 Comentarios sobre el valor absoluto de la presencia del inglés
Los resultados obtenidos permiten evaluar la presencia de las lenguas latinas en relación con el inglés; pero para calcular la presencia en términos absolutos de las lenguas latinas en el espacio WWW, es necesario elaborar una hipótesis acerca de la presencia del inglés. El cuadro que sigue muestra los valores de presencia absoluta, establecidos a partir de los promedios a partir de diversas hipótesis en cuanto a la presencia del inglés. El resultado inscrito en rojo es el considerado más probable, más realista, a partir de los recortes realizados por los autores. En la actualidad, ningún método es totalmente seguro; sea cual fuere el que se elija para trabajar, subsistirá el obstáculo de la medición en las páginas multilingües. Pero trabajando a partir de los datos obtenidos, es posible estimar, aunque con un margen de aproximación relativamente grande, el valor de la presencia del inglés. El algoritmo de lengua de AltaVista es, entre otros, un elemento capaz de determinar este margen (véase en el estudio L3 el "método del complemento del universo vacío"). El porcentaje de páginas en inglés no tendría que ser inferior a 65%, según las mediciones realizadas con este método. Pero difícilmente sobrepasaría un 85%, dado el lugar que ocupan idiomas importantes, tales como el japonés, el alemán, el francés y el castellano, que pueden representar un 15%. Una cifra razonable parecería ser hoy de aproximadamente 75%, si se tiene en cuenta el porcentaje de idiomas que ocupan cada uno entre 0,5% y 1% (es decir, entre 7 y 10 idiomas que constituyen un total de 5%), el de idiomas de presencia menor, como el rumano (es decir, de 10 a 15 idiomas presentes en un 0,15% cada uno y un total de 2%) y, por último, las numerosas lenguas cuya presencia es marginal. La proporción de estas últimas es la más difícil de estimar; pero con la hipótesis de 200 lenguas presentes cada una en un 0,025%, alcanzan un total de 5%... Una incógnita importante, cuyas consecuencias habrá que evaluar llegado el caso, es la posible multiplicación de idiomas presentes en Internet, siendo que el total de los idiomas que se practican en el mundo es muy superior al de los estados-naciones, y el total de éstos es algo inferior a 200. Esta cifra de 75% para el inglés se aplica al espacio WWW; la elevaremos a 80% en el caso del espacio Usenet.
Cuadro
2:
1.3 Relación entre la cantidad de latinos y su presencia lingüística en Internet Está claro que los valores de presencia absoluta no son un indicador perfecto de la presencia de un idioma en Internet. Para obtener un resultado significativo, conviene relacionar los valores que expresan la presencia de los idiomas en Internet con la presencia efectiva de estos idiomas en el mundo real. Pero, para medir la importancia del uso real de los idiomas en el mundo, un primer obstáculo de envergadura es cuáles serán los criterios a tener en cuenta1 y hasta hoy no hay consenso entre los expertos. A los fines de este estudio, para apreciar la importancia de los idiomas latinos a nivel mundial los autores han optado arbitrariamente por el método que se explicita en el anexo 3 Cantidad de hablantes de los idiomas estudiados. Para que las estadísticas presentadas sean representativos de las características sociolingüísticas citadas en el citado anexo, los autores decidieron sumar las cifras correspondientes a:
Cuadro
3:
La presencia relativa de estos idiomas es así calculada sin tener totalmente en cuenta el factor "multilingüismo". Partiendo de la hipótesis de una población total de 6 000 000 000 de habitantes, la ponderación de la presencia de los idiomas en Internet se efectúa dividiendo el valor de su presencia en el espacio WWW por el valor de su presencia relativa en el mundo. Un cociente igual a 1 se considera resultado "normal"; inferior a 1, insuficiente; superior a 1, respetable.
Cuadro
4:
1.4 Relación entre la cantidad de latinos y su presencia lingüística en el espacio Usenet El esquema siguiente presenta el resultado del cálculo estadístico realizado a partir de la medición de la cantidad de ocurrencias de las palabras de la muestra en el espacio Usenet. El anexo 4 incluye los cuadros que establecen los intervalos de confianza.
Cuadro
5: Resultado más
verosímil
Cuadro
6:
1 ¿Hay que tener en cuenta solo los primeros idiomas, en el uso de los individuos plurilingües? ¿Hay que tener en cuenta las cifras referidas a las idiomas oficiales, aun cuando hay casos en que numerosas personas no hablan este idioma (como, por ejemplo, el francés en Haïtí)? ¿Hay que incluir los idiomas supranacionales y vehiculares?
|