[ca]  [es]  [it]  [pt]  [ro]
Langues et cultures sur la Toile Étude 2007

Analyse de l’évolution des moteurs de recherche

Depuis 2005, nous savons que les résultats obtenus du cyberespace indexé par les moteurs de recherche (Google en 2005) ne représentent pas tout l'espace de la Toile puisque la couverture des moteurs se réduit à une fenêtre plus étroite (60-80 % de l'espace). Cette étude confirme le manque de fiabilité des résultats obtenus en 2006 par ce même moteur et établit clairement que Google présente certaines incohérences qui nous obligent à l'écarter de notre méthodologie.

Après de multiples études, nous sommes arrivés à la conclusion qu'Altavista était le moteur dont le fonctionnement semblait le plus approprié à notre méthodologie.

En même temps, l'étude fait apparaître un nouveau résultat qui met en danger la cohérence dans la continuité des résultats. Jusqu'en 2005, les valeurs relatives à la présence des langues sur la Toile, selon différents moteurs de recherche, étaient très similaires, se situant dans les intervalles de confiance statistiques. La réduction de la proportion des pages indexées et les stratégies commerciales propres à chaque moteur conduisent à la possible perte définitive de cette propriété. Ainsi, nous ne pouvons pas affirmer que nos résultats reflètent la situation des langues sur le Web, mais plutôt le panorama des langues dans l'espace indexé par le moteur de recherche utilisé dans l'étude.

Pour démontrer la situation décrite plus haut, nous pouvons citer les résultats obtenus à partir du moteur Exalead, lesquels se sont révélés considérablement plus élevés dans les recherches en français.

Il convient de signaler un autre facteur important dans cette dernière étude, à savoir la grande invasion de publicités sur la Toile, provoquant des effets difficiles à mesurer dans notre méthodologie. D'innombrables pages abondent d'annonces publicitaires et autres annonces intertextuelles (GoogleAds) considérées comme faisant partie intégrante du contenu. Il apparaît ainsi des termes, qui sans avoir aucun rapport avec le contenu du site, donnent de la valeur à certains autres termes (on peut par exemple visiter une page sur les chevaux dans laquelle jamais auparavant n'apparaissait le terme « amarillo », mais qui comporte maintenant une annonce GoogleAds qui propose de « visiter le rancho Amarillo »). La publicité s'est transformée en un amplificateur qui devient un avantage pour les langues prédominantes (l'anglais) et, dans une moindre mesure, pour les langues émergentes (notamment le chinois, mais également le roumain qui connaît une croissance considérable). Pour faire face à cette nouvelle situation et à sa mauvaise influence sur nos résultats (surtout pour l'espagnol), nous avons développé des techniques destinées à neutraliser les effets de la publicité.

 

 

 

ÉTUDE 2007
Analyse et interprétation des résultats
Annexe
Analyse de l’évolution des moteurs de recherche
ÉTUDE 2005
ÉTUDE 2002
ÉTUDE 2001

 

 

 

 

Terminometro | Lenguas y culturas en la red ― Estudio 2007 | Portalingua | Agenda | Otros enlaces

Unión Latina
Dirección Terminología e Industrias de la Lengua - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org