Langues et cultures sur la Toile - étude 2005
Synthèse des résultats de l'étude des langues
Antécédents de l'étude
Méthodologie et limites
Résultats détaillés de l'étude
Analyses détaillées par langue
Résultats de l'étude sur la culture

 


Langues et cultures sur la Toile - étude 2005

Méthodologie  

 
 

Funredes mène des travaux sur la place des langues et cultures latines sur l'Internet depuis 1996. Bien que le principe méthodologique de base ait été conservé, plusieurs modifications ont été apportées au fil des années, afin de rendre l’étude toujours plus solide et pertinente.

À cette époque, l’étude était axée sur le français et l'espagnol. Elle consistait en des mesures comparatives, avec AltaVista, de la présence de mots dans l'espace Web, en anglais, français et espagnol, à partir d'un échantillon de 50 mots constitué sans réelle rigueur méthodologique sur le plan linguistique.

En 1998, Funredes obtient le soutien de l’Union latine. Des modifications sont apportées à la méthodologie ; en effet l’analyse des limitations des moteurs de recherche et de la présence relative des diacritiques conduit à l'abandon d’AltaVista, auquel est préférée l'utilisation de HotBot.

En 2001, d'importants changements sont apportés dans la méthode, qui gagne en rigueur : les résultats sont étendus à l’allemand, les moteurs de recherches Google et Fast sont sélectionnés après une étude approfondie, les calculs sont automatisés à l'aide d'un programme jouant le rôle d'interface entre les termes à mesurer, organisés en bases de données, et les moteurs de recherche et les erreurs concernant l'orthographe de certains termes de l'échantillon ainsi que l'omission de certains autres sont corrigées.

Enfin, en 2005, seul l’espace indexé par le moteur de recherche Google a été observé.

Voir le détail de la méthodologie


Limites de la méthodologie  

 
 

Les valeurs absolues du pourcentage de chaque langue se déduisent de la valeur absolue de l'anglais. Il n’existe pas de méthode sûre pour calculer cette valeur et l'estimation se fait par recoupement à partir de l'évaluation du poids du reste des langues. Ainsi les résultats sur les langues en valeur absolue sont approximatifs.

Les études détaillées par langue sont dépendantes du pourcentage de sites en dehors du domaine national. Or, à part dans le cas des pays de langue espagnole en 2001, nous n'avons pas pu réunir de données fiables.

Pour la plupart des pays ce pourcentage n'est pas très sensible ; mais il l’est extrêmement pour le cas des domaines « .US » et, en moindre proportion, pour le cas des domaines « .ES ».

Un travail de recoupement entre les différents tableaux par langues permet, en ajustant des totaux proches de 100%, de déduire des valeurs possibles pour ces données, sans toutefois apporter de sécurité sur le résultat qui doit donc être tenu comme approximatif.

 





131, rue du Bac - F-75007 Paris
Tél. : (33 1) 45 49 60 62   /   Télécopie : (33 1) 45 49 67 39
dtil@unilat.org
webmestre