| |
O procedimento utilizado para a obtenção
dos dados na web francófona baseia-se nos
trabalhos realizados pela FUNREDES, desde
1996, sobre a posição das
línguas e culturas latinas na Internet
(http://funredes.org/LC/),
com o apoio metodológico da União
Latina no que se refere à parte lingüística.
Este estudo permite atualizar os resultados da
pesquisa L5 desenvolvida pela FUNREDES em 2001.
Os detalhes referentes à metodologia, bem
como os resultados obtidos nos estudos anteriores,
estão disponíveis na página
http://funredes.org/LC/francais/L5/.
O método baseia-se na análise do
índice de um certo número de programas
de busca como Google ou Alltheweb,
além da seleção de uma amostra
de termos [1], segundo
critérios
lingüísticos [2],
para garantir a qualidade dos resultados. O resultado
obtido através da aplicação
dos métodos
estatísticos clássicos [3]
dá-nos uma indicação
[4] do peso relativo das línguas
latinas em relação ao inglês.
Para deduzir o valor absoluto do peso das línguas
latinas na Internet, é preciso estabelecer
uma hipótese sobre o peso absoluto do inglês
na Rede, o que é feito através de
comparações. O uso contínuo
desse método desde 1998 permite que se
tenha uma imagem da evolução
do peso do francês na Internet nos últimos
cinco anos.
A cada nova etapa desse estudo, é necessário
avaliar o comportamento
dos programas de busca, tanto em seu modo
de indexar as páginas presentes na Internet,
quanto em seu modo de gerir o resultado das pesquisas.
Uma vez essa análise feita, seleciona-se
o programa que melhor responde aos critérios
do estudo. Em alguns casos, quando as anomalias
detectadas respondem de modo coerente a uma lógica
compreensível –como é freqüentemente
o caso na gestão dos diacríticos–,
os resultados são corrigidos.
A metodologia utilizada para obter a repartição
da Internet francófona entre os diferentes
países retoma o procedimento adotado para
o caso da língua espanhola, em 2001, por
ocasião do Congresso Internacional sobre
a Língua Espanhola de
Valladolid [5]. O método
de contagem a partir das palavras da amostra lingüística
é aplicado seletivamente dentro
dos domínios Internet avaliados.
O programa de busca mede então o número
de ocorrências das palavras da amostra por
domínio [6] (.com, .net,
.fr, .sn…). Para cada palavra da amostra,
obtemos uma repartição por
domínio [7]. A média
desses resultados dá-nos uma imagem da
repartição da Internet francófona
por domínio.
|