Português
[es - fr - it - ro]

Publicações
Estudo sobre a posição do francês na Internet
Introdução
Metodologia
Limites da metodologia
Antecedentes
A posição do francês na rede
Repartição das páginas em francês por país
Conclusões
Anexos

Manchetes
Termilat
Agenda
Eventos
Eventos passados
Estudo sobre a posição do francês na Internet

Metodologia  

 

 
 

O procedimento utilizado para a obtenção dos dados na web francófona baseia-se nos trabalhos realizados pela FUNREDES, desde 1996, sobre a posição das línguas e culturas latinas na Internet (http://funredes.org/LC/), com o apoio metodológico da União Latina no que se refere à parte lingüística. Este estudo permite atualizar os resultados da pesquisa L5 desenvolvida pela FUNREDES em 2001. Os detalhes referentes à metodologia, bem como os resultados obtidos nos estudos anteriores, estão disponíveis na página http://funredes.org/LC/francais/L5/.

O método baseia-se na análise do índice de um certo número de programas de busca como Google ou Alltheweb, além da seleção de uma amostra de termos [1], segundo critérios lingüísticos [2], para garantir a qualidade dos resultados. O resultado obtido através da aplicação dos métodos estatísticos clássicos [3] dá-nos uma indicação [4] do peso relativo das línguas latinas em relação ao inglês. Para deduzir o valor absoluto do peso das línguas latinas na Internet, é preciso estabelecer uma hipótese sobre o peso absoluto do inglês na Rede, o que é feito através de comparações. O uso contínuo desse método desde 1998 permite que se tenha uma imagem da evolução do peso do francês na Internet nos últimos cinco anos.

A cada nova etapa desse estudo, é necessário avaliar o comportamento dos programas de busca, tanto em seu modo de indexar as páginas presentes na Internet, quanto em seu modo de gerir o resultado das pesquisas. Uma vez essa análise feita, seleciona-se o programa que melhor responde aos critérios do estudo. Em alguns casos, quando as anomalias detectadas respondem de modo coerente a uma lógica compreensível –como é freqüentemente o caso na gestão dos diacríticos–, os resultados são corrigidos.

A metodologia utilizada para obter a repartição da Internet francófona entre os diferentes países retoma o procedimento adotado para o caso da língua espanhola, em 2001, por ocasião do Congresso Internacional sobre a Língua Espanhola de Valladolid [5]. O método de contagem a partir das palavras da amostra lingüística é aplicado seletivamente dentro dos domínios Internet avaliados. O programa de busca mede então o número de ocorrências das palavras da amostra por domínio [6] (.com, .net, .fr, .sn…). Para cada palavra da amostra, obtemos uma repartição por domínio [7]. A média desses resultados dá-nos uma imagem da repartição da Internet francófona por domínio.


Notas
 

[1] Ver a amostra na página
http://funredes.org/LC/francais/L5/L5appendix_3.html#table_15.

[2] Ver a lista dos critérios de seleção lingüísticos que permitem aproximar-se de um significado e de um alcance semântico equivalentes, assim como evitar as distorções :
http://funredes.org/LC/francais/L5/L5appendix_7.html.

[3] O método de Fischer é aplicado a partir da hipótese de uma distribuição normal.

[4] A média dos valores é estabelecida, bem como os "intervalos de confiança", entre 90 e 99%.

[5] Documento original em espanhol : http://funredes.org/LC/L5/valladolid.html.
Documento em francês com os mesmos trabalhos :
http://funredes.org/LC/L5/CahiersNumFinal.html.

[6] 85 domínios são levados em conta, ou seja, mais de 11 000 buscas geradas automaticamente.

[7] Por exemplo: uma busca com Google para a palavra "verdade" mostra 700 000 ocorrências. Se limitarmos essa busca ao domínio .fr, a quantidade reduz-se a 202 000, ou seja 29% de 700 000, se restringirmos a pesquisa ao domínio canadense .ca, encontramos 75 000, isto é, pouco mais de 10% ; se escolhermos o domínio do Marrocos (.ma), o resultado é de 2 000, ou seja, de aproximadamente 0,3%.

 





131, rue du Bac - F-75007 Paris
T: (33 1) 45 49 60 62   /   F: (33 1) 45 49 67 39
dtil@unilat.org
webmaster