Sur près de 6 000 l'on dit que deux langues disparaissent tous les mois.
[DIAPOSITIVA 5]
Les langues les plus parlées dans le monde sont :
Avec plus de 200 millions de locuteurs : le chinois (mandarin et autres variantes inclus), l'anglais et l'hindou, l'espagnol, le russe et l'arabe.
[DIAPOSITIVA 6]
Avec 100 à 200 millions de locuteurs : le bengalais, le portugais, le japonais, l'indonésien, l'allemand et le français.
[DIAPOSITIVA 7]
En ce qui concerne plus particulièrement les langues latines, la répartition est la suivante :
375 millions de locuteurs pour l'espagnol
190 millions de locuteurs pour le portugais
130 millions de locuteurs pour le français
60 millions de locuteurs pour l'italien
30 millions de locuteurs pour le roumain
Étant donné que notre étude comporte des données comparatives entre l'anglais et les langues néolatines, notons que l'anglais compte 630 millions de locuteurs, soit moins que l'ensemble des locuteurs de langues latines.
[DIAPOSITIVA 8]
En juillet 2001, Internet comptait 200 millions de serveurs, 400 millions d'usagers et 2 milliards de pages. Sachant que la croissance moyenne annuelle de ces trois élément est, respectivement, de plus 100 et 200 %, on estime aujourd'hui le nombre de pages Internet à 10 milliards.
[DIAPOSITIVA 9]
En février 2003, le nombre de pages référencées par les grands moteurs de recherche était réparti comme suit :
Google : 3 milliards
MSN Search : 3 milliards
Hotbot : 3 milliards
FAST : 2 milliards
WISENUT : 1,5 milliards
ALTAVISTA : 1 milliard
Avec une hypothèse de 10 milliards de pages sur l'Internet en 2003, Google, par exemple, n'indexe plus que 30 % de l'espace Internet visible total.
Le mode d'indexation de Google repose sur le critère de popularité d'une page. Le but de ce critère est de favoriser les pages les plus visitées et les plus référencées dans l'ordre d'apparition des réponses aux requêtes. Cependant, l'une de ces conséquences est qu'il élimine de l'espace de recherche les pages vers lesquelles le nombre de liens est très faible ou provient de sites eux-mêmes considérés comme peu populaires.
[DIAPOSITIVA 8]
En ce qui concerne la présence de l'anglais et des langues latines sur l'Internet, la répartition absolue de l'anglais et des langues latines sur l'Internet est déterminée à partir de chiffres relatifs obtenus par FUNREDES, d'autres facteurs tels que le nombre d'internautes par langue, un recoupement avec les résultats précédents, ainsi que d'études parallèles. On peut estimer les résultats fiables dans une fourchette de plus ou moins 10%. Il est évident que les valeurs de présence absolue ne sont pas un indicateur parfait de la vigueur d'une langue sur les réseaux. Pour obtenir un résultat significatif, il convient de proportionner les valeurs exprimant la présence des langues sur l'Internet à l'aune de leur présence dans le monde réel. La présence relative de ces langues est calculée sans tenir pleinement compte du facteur "plurilinguisme". Un quotient égal à 1 est à considérer comme un résultat "normal" ; s'il est inférieur à 1, comme faible et s'il est supérieur à 1, comme respectable.
On peut ainsi en déduire que l'anglais, le français et l'italien sont représentés de façon respectable, mais que l'espagnol, le portugais et le roumain sont faiblement représentés.
On note également une baisse dans la production de pages anglophones et roumanophones mais une nette augmentation de celle de pages en espagnol, français, italien et portugais : +95 % pour l'espagnol, +150 % pour le portugais, etc.
Le graphique suivant présente une vue plus générale de l'évolution du pourcentage relatif des langues latines par rapport à l'anglais au cours des 5 dernières années. L'évolution des langues latines et de l'allemand par rapport à l'anglais est passée par trois phases : une forte augmentation entre 1998 et 2000 (on notera que la présence du français passe sous celle de l'espagnol dès 1999), suivie d'une stagnation en 2001 et enfin d'une baisse à partir de 2002.
Le ralentissement et la baisse du poids des langues latines et de l'allemand sur la Toile à partir de 2002 pourraient s'expliquer par plusieurs facteurs :
le ralentissement sensible de la production de pages Internet dans les différents secteurs linguistiques latins et germanophones ;
l'influence indirecte des langues non prises en compte dans l'étude ;
la hausse importante du nombre de pages en anglais ;
une situation particulière liée aux moteurs de recherche.
[DIAPOSITIVA 10] |