Español
[fr - it - pt - ro]

Publicaciones
Estudio sobre el lugar del francés en Internet
Introducción
Metodología
Límites de la metodología
Antecedentes
El lugar del francés en la red
Repartición de las páginas en francés por países
Conclusiones
Anexos
Anexo 1: Producción de páginas en francés por dominio
Anexo 2: Producción de páginas en inglés por dominio
Anexo 3: Cálculo de la producción de páginas web en el dominio nacional
Anexo 4: Intersección de los resultados con ayuda de la función “búsqueda por país” de Google

Titulares
Terminometro
Termilat
Agenda
Eventos
Eventos pasados
Estudio sobre el lugar del francés en Internet

Anexos  

 

Anexo 3: Cálculo de la producción de páginas web en el dominio nacional
  Para establecer la proporción total de páginas en francés para cada país, hay que sumar las páginas contabilizadas en el dominio nacional de cada país y las páginas correspondientes a estos países alojadas en servidores que utilizan nombres de dominio genéricos [33]. El segundo sumando plantea problemas de definición y es particularmente difícil de establecer.

Se puede considerar como una definición aceptable que un sitio web está “presente” en un país si está alojado en un servidor ubicado en su territorio. Con esta definición, el sitio de una empresa francesa alojado en Estados Unidos será contabilizado como sitio estadounidense y el sitio de una organización senegalesa alojado en Francia deberá ser considerado como francés. Asimismo, el sitio de un organismo internacional como http://www.unesco.org que tiene su servidor en Francia será considerado como francés. Los límites de la definición aparecen claramente.

Para proceder a la detección de la localidad de los servidores, tres tipos de información se encuentran disponibles:

¿quién es el propietario del nombre de dominio (función whois [34])?

¿cuáles son los servidores que prestan el servicio de gestión del nombre de dominio (proporcionado también por la función whois)?

y ¿cuál es la dirección IP [35] del servidor?

Las dos primeras informaciones dan una idea acerca del lugar en que puede hallarse el servidor que aloja un sitio, pero no permiten en ningún caso tener la certeza (nada impide que el propietario de un sitio o un servidor de dominio se encuentren en un país diferente del del sitio). Ciertos organismos regionales (como arin.net) asignan los números IP por país y por proveedores. Es razonable pensar que mantienen una contabilidad de las secuencias de números IP atribuidos (tal como un banco central conserva los números de los billetes de banco) a destinatario.

Cuando el motor Google procede, independientemente del nombre de dominio, a la identificación de las páginas por país [36], debe necesariamente recurrir a una de las tres informaciones mencionadas. Avanzamos la hipótesis de que lo hace mediante una base de datos de los números IP que hace corresponder un país a un número IP.

Este método presenta ciertos límites. La observación muestra que varios sitios no están claramente asociados a un país (éste es el caso, por ejemplo, de nuestro sitio <funredes.org>). En numerosos casos, los Estados Unidos aparecen como el país de los sitios externos (es el caso del sitio haitiano <rehred-haiti.net>). La hipótesis de la base de datos (número IP, país) permite comprender estas anomalías. Un proveedor de un pequeño país adquiere a menudo sus series de números IP de un proveedor de Estados Unidos que no le entrega necesariamente series identificables en la base de datos. Por otra parte, la amplitud de los resultados muestra que Google sólo estaría en posesión para sus búsquedas de aproximadamente el 10% de esta base de datos (en otros términos, el 90% de los sitios queda fuera del alcance de la búsqueda por país de Google).

Habida cuenta de estos límites, la mejor opción sigue siendo solicitar la opinión de especialistas de la gestión de los dominios en cada país y tomar en cuenta su estimación, incluso si es muy intuitiva y por lo tanto aproximativa. En ausencia de respuesta, la única opción para evitar presentar cifras demasiado arbitrarias es reconstituir los valores con ayuda de la función de búsqueda por país de Google, procediendo posteriormente a un reajuste de las cifras para normalizarlas (de modo que el total cuadre y repartir los aumentos de manera coherente) y avanzando la hipótesis (hipótesis que afortunadamente parece ser corroborada por la coherencia de los resultados obtenidos) de que la deformación estadística no es excesiva y que se pueden extrapolar los resultados obtenidos a partir del 10% de los sitios.

Por lo tanto, es así como hemos calculado a partir de la organización por países del índice de Google, la proporción de páginas web en un dominio nacional. Se ha utilizado la técnica de complemento del conjunto vacío para cada dominio nacional [37], y a continuación para los dominios genéricos en cada país [38]. Por ejemplo, para Francia, se obtienen los resultados siguientes:

 
Dominio nacional (fr)
.com
.org
.net
.edu
.info
Otros
Número de páginas
(en miles)
8 740
5 550
3 200
2 880
26
248
149

 

Habría por lo tanto en Francia 8,7 millones de páginas indizadas en el dominio nacional y 12 millones en dominios genéricos. Se puede por consiguiente calcular que, según Google, el 42% [39] de las páginas presentadas en Francia pertenece al dominio nacional.

Los resultados para el conjunto de los países son los siguientes [40]:

EUROPA
 
.NAC
.genérico
%NAC
ALBANIA
16
0
100%
ALEMANIA
40700
10540
79%
BÉLGICA
2710
3524
43%
BULGARIA
384
686
36%
ESLOVENIA
439
957
31%
ESPAÑA
3780
7042
35%
FRANCIA
8740
12053
42%
ITALIA
8970
6864
57%
LITUANIA
927
74
93%
LUXEMBURGO
232
761
23%
MACEDONIA
162
10
94%
MOLDAVIA
127
18
88%
MÓNACO
35
46
43%
PAÍSES BAJOS
10600
6983
60%
POLONIA
7260
974
88%
PORTUGAL
1300
758
63%
REINO UNIDO
18000
16632
52%
REP. CHECA
6120
1176
84%
RUMANÍA
1400
243
85%
RUSIA
14500
3384
81%
SUIZA
6220
5613
53%
TOTAL
132622
78338
63%

ASIA Y OCEANÍA
 
.NAC
.genérico
%NAC
CAMBOYA
14,70
2
87%
CHINA
6530,00
5876
53%
JAPÓN
24500,00
8669
74%
LAOS
14,40
0
100%
MAURICIO
52,40
9
85%
NVA. CALEDONIA
46,90
36
56%
POL. FRANCESA
47,40
2
95%
SEYCHELLES
4,66
0
100%
VANUATU
95,60
0
100%
VIETNAM
175,00
47
79%
WALLIS Y FUTUNA
0,01
0
100%
TOTAL
31481,07
14643
68%

 
.NAC
.genérico
TOTAL
187240
160766

 

 

AMÉRICA
  .NAC .genérico %NAC
ARGENTINA
1640
1668
50%
BRASIL
7170
1632
81%
CANADÁ
6520
14730
31%
CHILE
766
342
69%
DOMINICA
2
0
100%
ESTADOS UNIDOS
6560
49078
12%
GUADALUPE
4
6,8
36%
GUYANA
3
0
100%
HAITÍ
0
0
MARTINICA
3
1,4
69%
S. PEDRO Y MIQUELÓN
0
0
SANTA LUCÍA
6
0
100%
TOTAL
22673
67458,2
25%

ÁFRICA Y MEDIO ORIENTE
 
.NAC
.genérico
%NAC
BENÍN
3,80
3,22
54%
BURKINA FASO
14,60
3,77
79%
BURUNDI
3,41
0,00
100%
CABO VERDE
3,15
0,00
100%
CAMERÚN
15,30
1,86
89%
CENTROÁFRICA
0,76
0,00
100%
COMORES
0,05
0,00
100%
COSTA DE MARFIL
40,80
4,13
91%
CHAD
0,45
0,00
100%
EGIPTO
76,80
201,06
28%
GABÓN
1,08
9,73
10%
GUINEA
0,95
4,42
18%
GUINEA ECUAT.
0,00
0,00
LÍBANO
69,70
30,00
70%
MADAGASCAR
14,50
0,07
100%
MALÍ
4,05
0,74
85%
MARRUECOS
57,70
40,84
59%
NIGERIA
5,34
0,00
100%
REP. CONGO
0,98
0,00
100%
REP. DEM. CONGO
40,00
0,00
100%
REUNIÓN
0,45
0,00
100%
RUANDA
4,33
0,95
82%
SENEGAL
37,50
7,25
84%
TOGO
2,97
4,41
40%
TÚNEZ
55,90
14,54
79%
YIBUTI
8,71
0,00
100%
TOTAL
463,28
327
59%

 

Todos los países de la Francofonía, así como la mayoría de los países productores de páginas web, se encuentran presentes en esta tabla. Como se puede constatar, el número total de páginas roza los 350 millones, mientras que el índice de Google comporta más de 3.000 millones de páginas indizadas. Se puede con todo esperar que este error en la indización de las páginas por país sea uniforme y pueda dar una imagen creíble de la proporción de páginas web por dominio nacional (%NAC).

Otra anomalía de estos resultados es claramente la de la cifra de los Estados Unidos que por consiguiente no hemos utilizado. Hemos multiplicado por 2 la cifra de 2%, que habíamos determinado en el momento del estudio de 2001, para tener en cuenta la progresión del dominio .us.

Utilizando la proporción de páginas web en un dominio nacional con los resultados calculados para cada dominio, obtenemos el resultado siguiente:

Antes de la repartición de los dominios genéricos:

Dominios genéricos
47,2%
Europa
41,2%
América
12,4%
África y Medio Oriente
0,6%
Asia y Oceanía
0,3%
Resto
0,7%
TOTAL
100%

 

Después de la repartición de los dominios genéricos:

Dominios genéricos
0%
Europa
93,9%
América
33,6%
África y Medio Oriente
0,9%
Asia y Oceanía
0,3%
Resto
1,4%
TOTAL
130%

 

Los porcentajes de sitios fuera del dominio nacional deberán ser “normalizados” para hacer corresponder el total a 100% [41]. Los resultados obtenidos se presentan en la tabla de la página 12.


Notas
 

[33] Es decir, por ejemplo, el número de páginas presentes en el territorio francés en sitios tipo “http://www.mi_sitio.com”, además de las páginas en sitios tipo “http://www.mi_sitio.fr”.

[34] Sitios como el de “Network Solutions” (http://www.networksolutions.com/) proporcionan información acerca del propietario de distintos sitios.

[35] La dirección en el Protocolo Internet: ver http://www.commentcamarche.net/internet/ip.php3 para la definición de una dirección IP.

[36] Se accede a esta opción a partir de la sección “Herramientas del idioma” de Google.

[37] Por ejemplo, una búsqueda tipo “-dasfsdafasdfasdfadbb site:.fr” dará el número total de páginas presentes en el índice de Google con el dominio .fr.

[38] Hay que llevar a cabo, en la sección “Herramientas del idioma” de Google, una búsqueda tipo “-dasfsdafasdfasdfadbb sitio:.DOM” en la que DOM toma los valores de los dominios genéricos y de países.

[39] 8,7/(8,7+12)

[40] Las cantidades de páginas se presentan en miles.

[41] Se aplica la ecuación Tx(x-1) en la cual T = 1,527. Se trata de un aumento no uniforme (en forma de parábola) de los valores para colmar los 30%, para así preservar los valores 0% y 100%.






131, rue du Bac - F-75007 Paris
T: (33 1) 45 49 60 62   /   F: (33 1) 45 49 67 39
dtil@unilat.org
webmaster