PARTE 1: A LÍNGUA
|
1. RESULTADOS DO ESTUDO LINGÜÍSTICO
Os resultados foram obtidos arrolando uma amostragem de 57 palavras, selecionadas de modo a permitir uma comparação entre as línguas da maneira mais rigorosa possível. Para cada palavra, a relação das línguas latinas com o inglês é utilizada como uma variante aleatória e as técnicas da estatística são aplicadas tomando-se como hipótese uma distribuição matemática corrente dessa aleatória variável (a curva de Gauss chamada também de distribuição "normal"). Dois espaços da Internet foram levados em consideração para as medidas: o espaço WWW explorado com o motor de pesquisa HotBot e o espaço Usenet, explorado com o motor de pesquisa DejaNews. O capítulo Metodologia Internet explica a escolha dos motores de pesquisa e comenta os limites do método ligados aos limites dos motores escolhidos. Graças ao grande esforço dispensado na escolha das palavras da amostragem (que está explicado no capítulo Metodologia Lingüística), os resultados são estatisticamente de boa qualidade, quer dizer que a dispersão das relações de cada língua com o inglês é relativamente fraca, o que permite constituir uma margem bastante estreita onde a probabilidade de que o valor exato seja incluído é de 99/100 (o que os estatísticos chamam de "intervalo de confiança"). Desse ponto de vista, os resultados são melhores no espaço WWW do que no espaço Usenet, o que nos surpreende dado à freqüente utilização das abreviaturas nos grupos de discussão. A qualidade dos resultados (e logo a importância do intervalo de confiança) varia de acordo com as línguas: muito bom para o francês, bom para o espanhol e o italiano nos dois espaços, bom para o português no espaço WWW, fraco para o romeno e para o português no espaço Usenet. Ver Anexo 2.
O quadro abaixo apresenta a relação média entre cada língua latina e o inglês, obtido com a medida do número de citações dos termos da amostra, em cada um dos dois espaços estudados. O francês é o melhor colocado no espaço Internet, seguido de perto pelo espanhol. Por outro lado, e é um fenômeno notável, sua presença é fraca no espaço Internet.
Quadro
1:
1.2 Comentários a respeito do valor absoluto da presença do inglês
Os resultados obtidos permitem avaliar a presença das línguas latinas em relação ao inglês; para marcar a presença absoluta das línguas latinas no espaço WWW na Internet, é preciso primeiramente construir uma hipótese sobre a presença do inglês. O quadro seguinte mostra os valores da presença absoluta, estabelecidos a partir das diversas hipóteses da presença do inglês. O resultado inscrito em vermelho é considerado como o mais provável, levando-se em conta as verificações efetuadas pelos autores. Nenhum método é inteiramente seguro no momento e, qualquer que seja o escolhido, o obstáculo da contagem nas páginas multilíngües persistirá. No entanto, verificando os dados recolhidos, é possível fazer uma estimação, com uma aproximação rápida, do valor da presença do inglês. O algoritmo de língua na AltaVista é, entre outros, um elemento que permite determinar esse espaço (ver no estudo L3 o "método do complemento do universo vazio"). A percentagem de páginas em inglês dificilmente poderá ser inferior à 65%, levando-se em conta as medidas realizadas graça ao método citado. Dificilmente poderá ser superior a 85%, em função do lugar ocupado pelas línguas importantes: o japonês, o alemão, o francês e o espanhol, que pode ser igual a mais de 15%. Um número razoável hoje seria de 75%, levando-se em conta o lugar ocupado pelas línguas que representam entre 0,5% e 1% (quer dizer entre 7 e 10 línguas num total de 5%), das línguas que têm uma presença fraca, como o romeno (entre 10 e 15 línguas a 0,15% num total de 2%) e, finalmente, as inúmeras línguas cuja presença é marginal. Essa última proporção é a mais difícil de ser estimada; supondo-se 200 línguas a 0,025%, atingindo um total de 5% Uma das grandes incógnitas, cuja conseqüência será avaliada no futuro, é a possível multiplicação das línguas na Internet, as línguas faladas no mundo sendo muito superiores aos Estados-nações, ligeiramente inferiores a 200. Esse número de 75% é aplicado ao espaço WWW. Para o espaço Usenet nós o elevaremos a 80%.
Quadro
2:
1.3 Relação entre o número de latinos e o peso de sua presença na tela
É evidente que os valores de presença absoluta não são um indicativo da força de uma língua na Internet. Para se obter um resultado significativo é preciso fazer a proporção entre os valores que exprimem a presença das línguas na Internet com a importância de sua presença no mundo real. No entanto, medir a importância da verdadeira utilização das línguas no mundo necessita de uma definição de critérios1. Os peritos não conseguiram chegar a um acordo a esse respeito. Nesse estudo, a fim de avaliar da melhor maneira possível o lugar que ocupa verdadeiramente as línguas latinas no mundo, os autores decidiram arbitrariamente por um método detalhado no anexo 3 - número de falantes das línguas estudadas. A fim de que as presentes estatísticas sejam representativas das características sóciolingüísticas mencionadas nesse anexo, foram adicionados os resultados correspondendo às:
Quadro
3:
A presença relativa dessas línguas é, pois, calculada sem levar em conta o fator "multilinguismo". Supondo que a população total mundial seja de 6 000 000 000, medimos a presença das línguas na Internet dividindo o valor da presença no espaço WWW pelo valor da presença relativa no mundo. O quociente igual a 1 é considerado resultado "normal"; inferior a 1 insuficiente e superior a 1 respeitável.
Quadro
4:
1.4 Relação entre o número de latinos e peso de sua presença no espaço Usenet
O esquema abaixo mostra o resultado do cálculo estatístico feito a partir da freqüência do número de citações das palavras na amostragem do espaço Usenet. No anexo 4 mostraremos o quadro que estabelece os intervalos de confiança.
Quadro 5:
Quadro
6:
1 Podemos considerar somente as primeiras línguas ? Podemos considerar os resultados das línguas oficiais mesmo se algumas pessoas não falam a língua (como, por exemplo, o francês no Haiti)? Podemos dar a algumas línguas o papel de línguas supra nacionais, logo veiculares?
|