Apresentação

 

1. RESULTADOS DO ESTUDO LINGÜÍSTICO

 

Os resultados foram obtidos arrolando uma amostragem de 57 palavras, selecionadas de modo a permitir uma comparação entre as línguas da maneira mais rigorosa possível. Para cada palavra, a relação das línguas latinas com o inglês é utilizada como uma variante aleatória e as técnicas da estatística são aplicadas tomando-se como hipótese uma distribuição matemática corrente dessa aleatória variável (a curva de Gauss chamada também de distribuição "normal").

Dois espaços da Internet foram levados em consideração para as medidas: o espaço WWW explorado com o motor de pesquisa HotBot e o espaço Usenet, explorado com o motor de pesquisa DejaNews.

O capítulo Metodologia Internet explica a escolha dos motores de pesquisa e comenta os limites do método ligados aos limites dos motores escolhidos.

Graças ao grande esforço dispensado na escolha das palavras da amostragem (que está explicado no capítulo Metodologia Lingüística), os resultados são estatisticamente de boa qualidade, quer dizer que a dispersão das relações de cada língua com o inglês é relativamente fraca, o que permite constituir uma margem bastante estreita onde a probabilidade de que o valor exato seja incluído é de 99/100 (o que os estatísticos chamam de "intervalo de confiança"). Desse ponto de vista, os resultados são melhores no espaço WWW do que no espaço Usenet, o que nos surpreende dado à freqüente utilização das abreviaturas nos grupos de discussão.

A qualidade dos resultados (e logo a importância do intervalo de confiança) varia de acordo com as línguas: muito bom para o francês, bom para o espanhol e o italiano nos dois espaços, bom para o português no espaço WWW, fraco para o romeno e para o português no espaço Usenet. Ver Anexo 2.

 

1.1. Síntese dos Resultados

 

O quadro abaixo apresenta a relação média entre cada língua latina e o inglês, obtido com a medida do número de citações dos termos da amostra, em cada um dos dois espaços estudados. O francês é o melhor colocado no espaço Internet, seguido de perto pelo espanhol. Por outro lado, e é um fenômeno notável, sua presença é fraca no espaço Internet.

 

Quadro 1:
Média das línguas latinas em relação ao inglês

 

WWW

USENET

ESPANHOL

3,37%

2,41%

FRANCÊS

3,75%

1,44%

ITALIANO

2,00%

2,54%

PORTUGUÊS

1,09%

1,12%

ROMENO

0,20%

0,14%

 

1.2 Comentários a respeito do valor absoluto da presença do inglês

 

Os resultados obtidos permitem avaliar a presença das línguas latinas em relação ao inglês; para marcar a presença absoluta das línguas latinas no espaço WWW na Internet, é preciso primeiramente construir uma hipótese sobre a presença do inglês. O quadro seguinte mostra os valores da presença absoluta, estabelecidos a partir das diversas hipóteses da presença do inglês. O resultado inscrito em vermelho é considerado como o mais provável, levando-se em conta as verificações efetuadas pelos autores.

Nenhum método é inteiramente seguro no momento e, qualquer que seja o escolhido, o obstáculo da contagem nas páginas multilíngües persistirá. No entanto, verificando os dados recolhidos, é possível fazer uma estimação, com uma aproximação rápida, do valor da presença do inglês. O algoritmo de língua na AltaVista é, entre outros, um elemento que permite determinar esse espaço (ver no estudo L3 o "método do complemento do universo vazio").

A percentagem de páginas em inglês dificilmente poderá ser inferior à 65%, levando-se em conta as medidas realizadas graça ao método citado. Dificilmente poderá ser superior a 85%, em função do lugar ocupado pelas línguas importantes: o japonês, o alemão, o francês e o espanhol, que pode ser igual a mais de 15%. Um número razoável hoje seria de 75%, levando-se em conta o lugar ocupado pelas línguas que representam entre 0,5% e 1% (quer dizer entre 7 e 10 línguas num total de 5%), das línguas que têm uma presença fraca, como o romeno (entre 10 e 15 línguas a 0,15% num total de 2%) e, finalmente, as inúmeras línguas cuja presença é marginal. Essa última proporção é a mais difícil de ser estimada; supondo-se 200 línguas a 0,025%, atingindo um total de 5%… Uma das grandes incógnitas, cuja conseqüência será avaliada no futuro, é a possível multiplicação das línguas na Internet, as línguas faladas no mundo sendo muito superiores aos Estados-nações, ligeiramente inferiores a 200.

Esse número de 75% é aplicado ao espaço WWW. Para o espaço Usenet nós o elevaremos a 80%.

 

Quadro 2:
Presença absoluta das línguas latinas no espaço WWW

 

flh_red_do.gif (836 octets) Resultado mais verossímil

Se INGLÊS =

90,00%

85,00%

80,00%

75,00%

70,00%

65,00%

então ESPANHOL =

3,03%

2,86%

2,69%

3,37%

2,36%

2,19%

então FRANCÊS =

3,37%

3,19%

3,00%

3,75%

2,62%

2,44%

então ITALIANO =

1,80%

1,70%

1,60%

2,00%

1,40%

1,30%

então PORTUGUÊS =

0,98%

0,93%

0,87%

1,09%

0,76%

0,71%

então ROMENO =

0,18%

0,17%

0,16%

0,20%

0,14%

0,13%

 

1.3 Relação entre o número de latinos e o peso de sua presença na tela

 

É evidente que os valores de presença absoluta não são um indicativo da força de uma língua na Internet. Para se obter um resultado significativo é preciso fazer a proporção entre os valores que exprimem a presença das línguas na Internet com a importância de sua presença no mundo real. No entanto, medir a importância da verdadeira utilização das línguas no mundo necessita de uma definição de critérios1. Os peritos não conseguiram chegar a um acordo a esse respeito. Nesse estudo, a fim de avaliar da melhor maneira possível o lugar que ocupa verdadeiramente as línguas latinas no mundo, os autores decidiram arbitrariamente por um método detalhado no anexo 3 - número de falantes das línguas estudadas.

A fim de que as presentes estatísticas sejam representativas das características sóciolingüísticas mencionadas nesse anexo, foram adicionados os resultados correspondendo às:

Pessoas que dominam uma das línguas do estudo porque é sua língua materna e aqueles que a dominam em um país onde ela é oficial ou de ensino.

Pessoas cuja língua materna é uma das línguas do estudo mas que residem em um país onde ela não é reconhecida.

 

Quadro 3:
Peso das línguas latinas (em milhões)

Inglês

Espanhol

Português

Francês

Italiano

Romeno

Presença absoluta (número de falantes)

630

375

190

130

60

30

Presença relativa (percentagem mundial)

10,50%

6,25%

3,17%

2,17%

1%

0,50%

 

A presença relativa dessas línguas é, pois, calculada sem levar em conta o fator "multilinguismo".

Supondo que a população total mundial seja de 6 000 000 000, medimos a presença das línguas na Internet dividindo o valor da presença no espaço WWW pelo valor da presença relativa no mundo. O quociente igual a 1 é considerado resultado "normal"; inferior a 1 insuficiente e superior a 1 respeitável.

 

Quadro 4:
Presença ponderada das línguas latina na WWW

Presença Absoluta

Presença Ponderada

INGLÊS

75,00%

7,14

ESPANHOL

3,37%

0,40

FRANCÊS

3,75%

1,30

ITALIANO

2,00%

1,50

PORTUGUÊS

1,09%

0,26

ROMENO

0,20%

0,30

 

1.4 Relação entre o número de latinos e peso de sua presença no espaço Usenet

 

O esquema abaixo mostra o resultado do cálculo estatístico feito a partir da freqüência do número de citações das palavras na amostragem do espaço Usenet. No anexo 4 mostraremos o quadro que estabelece os intervalos de confiança.

 

Quadro 5:
Presença absoluta das línguas latinas no espaço Usenet

Resultado mais verossímil

Se INGLÊS =

90,00 %

85,00 %

80,00 %

75,00 %

70,00 %

65,00 %

então ESPANHOL =

2,17 %

2,05 %

2,41 %

1,81 %

1,69 %

1,57 %

então FRANCÊS =

1,29 %

1,22 %

1,44 %

1,08 %

1,01 %

0,93 %

então ITALIANO =

2,29 %

2,16 %

2,54 %

1,91 %

1,78 %

1,65 %

então PORTUGUÊS =

1,01 %

0,95 %

1,12 %

0,84 %

0,79 %

0,73 %

então ROMENO =

0,13 %

0,12 %

0,14 %

0,11 %

0,10 %

0,09 %

 

Quadro 6:
Medida da presença das línguas latinas no espaço Usenet

Presença Absoluta

Presença Ponderada

INGLÊS

80,00%

7,14

ESPANHOL

2,41%

0,31

FRANCÊS

1,44%

0,53

ITALIANO

2,54%

2,03

PORTUGUÊS

1,12%

0,28

ROMENO

0,14%

0,23

 


1 Podemos considerar somente as primeiras línguas ? Podemos considerar os resultados das línguas oficiais mesmo se algumas pessoas não falam a língua (como, por exemplo, o francês no Haiti)? Podemos dar a algumas línguas o papel de línguas supra nacionais, logo veiculares?

 

Continuação

Cultura