| |
Para establecer la proporción
total de páginas en francés
para cada país, hay que sumar las páginas
contabilizadas en el dominio nacional de cada país
y las páginas correspondientes a estos países
alojadas en servidores que utilizan nombres de dominio
genéricos [33]. El segundo
sumando plantea problemas de definición y
es particularmente difícil de establecer.
Se puede considerar como una definición
aceptable que un sitio web está “presente”
en un país si está alojado
en un servidor ubicado en su territorio. Con esta
definición, el sitio de una empresa francesa
alojado en Estados Unidos será contabilizado
como sitio estadounidense y el sitio de una organización
senegalesa alojado en Francia deberá ser
considerado como francés. Asimismo, el
sitio de un organismo internacional como http://www.unesco.org
que tiene su servidor en Francia será considerado
como francés. Los límites de la
definición aparecen claramente.
Para proceder a la detección de la localidad
de los servidores, tres tipos de información
se encuentran disponibles:
¿quién es el
propietario del nombre de dominio (función
whois [34])?
¿cuáles son los servidores que
prestan el servicio de gestión del nombre
de dominio (proporcionado también por
la función whois)?
y ¿cuál es la
dirección IP [35] del
servidor?
Las dos primeras informaciones dan una idea acerca
del lugar en que puede hallarse el servidor que
aloja un sitio, pero no permiten en ningún
caso tener la certeza (nada impide que el propietario
de un sitio o un servidor de dominio se encuentren
en un país diferente del del sitio). Ciertos
organismos regionales (como arin.net) asignan
los números IP por país y por proveedores.
Es razonable pensar que mantienen una contabilidad
de las secuencias de números IP atribuidos
(tal como un banco central conserva los números
de los billetes de banco) a destinatario.
Cuando el motor Google procede, independientemente
del nombre de dominio, a la identificación
de las páginas por país
[36], debe necesariamente recurrir
a una de las tres informaciones mencionadas. Avanzamos
la hipótesis de que lo hace mediante una
base de datos de los números IP que hace
corresponder un país a un número
IP.
Este método presenta ciertos límites.
La observación muestra que varios sitios
no están claramente asociados a un país
(éste es el caso, por ejemplo, de nuestro
sitio <funredes.org>). En numerosos casos,
los Estados Unidos aparecen como el país
de los sitios externos (es el caso del sitio haitiano
<rehred-haiti.net>). La hipótesis
de la base de datos (número IP, país)
permite comprender estas anomalías. Un
proveedor de un pequeño país adquiere
a menudo sus series de números IP de un
proveedor de Estados Unidos que no le entrega
necesariamente series identificables en la base
de datos. Por otra parte, la amplitud de los resultados
muestra que Google sólo estaría
en posesión para sus búsquedas de
aproximadamente el 10% de esta base de datos (en
otros términos, el 90% de los sitios queda
fuera del alcance de la búsqueda por país
de Google).
Habida cuenta de estos límites, la mejor
opción sigue siendo solicitar la opinión
de especialistas de la gestión de los dominios
en cada país y tomar en cuenta su estimación,
incluso si es muy intuitiva y por lo tanto aproximativa.
En ausencia de respuesta, la única opción
para evitar presentar cifras demasiado arbitrarias
es reconstituir los valores con ayuda de la función
de búsqueda por país de Google,
procediendo posteriormente a un reajuste de las
cifras para normalizarlas (de modo que el total
cuadre y repartir los aumentos de manera coherente)
y avanzando la hipótesis (hipótesis
que afortunadamente parece ser corroborada por
la coherencia de los resultados obtenidos) de
que la deformación estadística no
es excesiva y que se pueden extrapolar los resultados
obtenidos a partir del 10% de los sitios.
Por lo tanto, es así como hemos calculado
a partir de la organización
por países del índice de
Google, la proporción de páginas
web en un dominio nacional. Se ha utilizado la
técnica de complemento del conjunto vacío
para cada dominio nacional [37],
y a continuación para los
dominios genéricos en cada país
[38]. Por ejemplo, para Francia,
se obtienen los resultados siguientes:
| |
Dominio nacional (fr) |
.com |
.org |
.net |
.edu |
.info |
Otros |
Número de páginas
(en miles) |
8 740 |
5 550 |
3 200 |
2 880 |
26 |
248 |
149 |
Habría por lo tanto en Francia 8,7 millones
de páginas indizadas en el dominio nacional
y 12 millones en dominios genéricos. Se
puede por consiguiente calcular que,
según Google, el 42% [39]
de las páginas presentadas en Francia pertenece
al dominio nacional.
Los resultados para el conjunto
de los países son los siguientes [40]:
|
EUROPA |
| |
.NAC |
.genérico |
%NAC |
| ALBANIA |
16 |
0 |
100% |
| ALEMANIA |
40700 |
10540 |
79% |
| BÉLGICA |
2710 |
3524 |
43% |
| BULGARIA |
384 |
686 |
36% |
| ESLOVENIA |
439 |
957 |
31% |
| ESPAÑA |
3780 |
7042 |
35% |
| FRANCIA |
8740 |
12053 |
42% |
| ITALIA |
8970 |
6864 |
57% |
| LITUANIA |
927 |
74 |
93% |
| LUXEMBURGO |
232 |
761 |
23% |
| MACEDONIA |
162 |
10 |
94% |
| MOLDAVIA |
127 |
18 |
88% |
| MÓNACO |
35 |
46 |
43% |
| PAÍSES BAJOS
|
10600 |
6983 |
60% |
| POLONIA |
7260 |
974 |
88% |
| PORTUGAL |
1300 |
758 |
63% |
| REINO UNIDO |
18000 |
16632 |
52% |
| REP. CHECA |
6120 |
1176 |
84% |
| RUMANÍA |
1400 |
243 |
85% |
| RUSIA |
14500 |
3384 |
81% |
| SUIZA |
6220 |
5613 |
53% |
| TOTAL |
132622 |
78338 |
63% |
|
ASIA Y OCEANÍA |
| |
.NAC |
.genérico |
%NAC |
| CAMBOYA |
14,70 |
2
|
87% |
| CHINA |
6530,00 |
5876 |
53% |
| JAPÓN |
24500,00 |
8669 |
74% |
| LAOS |
14,40 |
0
|
100% |
| MAURICIO |
52,40 |
9
|
85% |
| NVA. CALEDONIA |
46,90 |
36 |
56% |
| POL. FRANCESA |
47,40 |
2
|
95% |
| SEYCHELLES |
4,66
|
0
|
100% |
| VANUATU |
95,60 |
0
|
100% |
| VIETNAM |
175,00 |
47 |
79% |
| WALLIS Y FUTUNA |
0,01 |
0
|
100% |
| TOTAL |
31481,07
|
14643 |
68% |
| |
.NAC |
.genérico |
| TOTAL |
187240 |
160766 |
|
|
AMÉRICA |
| |
.NAC |
.genérico |
%NAC |
| ARGENTINA |
1640 |
1668 |
50% |
| BRASIL |
7170 |
1632 |
81% |
| CANADÁ |
6520 |
14730 |
31% |
| CHILE |
766 |
342 |
69% |
| DOMINICA |
2
|
0
|
100% |
| ESTADOS UNIDOS |
6560 |
49078 |
12% |
| GUADALUPE |
4
|
6,8
|
36% |
| GUYANA |
3
|
0
|
100% |
| HAITÍ |
0 |
0 |
|
| MARTINICA |
3
|
1,4
|
69% |
S.
PEDRO Y MIQUELÓN |
0 |
0 |
|
| SANTA LUCÍA |
6
|
0
|
100% |
| TOTAL |
22673 |
67458,2 |
25% |
|
ÁFRICA Y MEDIO ORIENTE |
|
|
.NAC |
.genérico |
%NAC |
| BENÍN |
3,80 |
3,22 |
54% |
| BURKINA FASO |
14,60 |
3,77 |
79% |
| BURUNDI |
3,41 |
0,00 |
100% |
| CABO VERDE |
3,15 |
0,00 |
100% |
| CAMERÚN |
15,30 |
1,86 |
89% |
| CENTROÁFRICA
|
0,76 |
0,00 |
100% |
| COMORES |
0,05 |
0,00 |
100% |
COSTA
DE MARFIL |
40,80 |
4,13 |
91% |
| CHAD |
0,45 |
0,00 |
100% |
| EGIPTO |
76,80 |
201,06 |
28% |
| GABÓN |
1,08 |
9,73 |
10% |
| GUINEA |
0,95 |
4,42 |
18% |
| GUINEA ECUAT. |
0,00 |
0,00 |
|
| LÍBANO |
69,70 |
30,00 |
70% |
| MADAGASCAR |
14,50 |
0,07 |
100% |
| MALÍ |
4,05 |
0,74 |
85% |
| MARRUECOS |
57,70 |
40,84 |
59% |
| NIGERIA |
5,34 |
0,00 |
100% |
| REP. CONGO |
0,98 |
0,00 |
100% |
REP.
DEM. CONGO |
40,00 |
0,00 |
100% |
| REUNIÓN |
0,45 |
0,00 |
100% |
| RUANDA |
4,33 |
0,95 |
82% |
| SENEGAL |
37,50 |
7,25 |
84% |
| TOGO |
2,97 |
4,41 |
40% |
| TÚNEZ |
55,90 |
14,54 |
79% |
| YIBUTI |
8,71 |
0,00 |
100% |
| TOTAL |
463,28 |
327 |
59% |
|
Todos los países de la Francofonía,
así como la mayoría de los países
productores de páginas web, se encuentran
presentes en esta tabla. Como se puede constatar,
el número total de páginas roza
los 350 millones, mientras que el índice
de Google comporta más de 3.000 millones
de páginas indizadas. Se puede con todo
esperar que este error en la indización
de las páginas por país sea uniforme
y pueda dar una imagen creíble de la proporción
de páginas web por dominio nacional (%NAC).
Otra anomalía de estos resultados es claramente
la de la cifra de los Estados Unidos que por consiguiente
no hemos utilizado. Hemos multiplicado por 2 la
cifra de 2%, que habíamos determinado en
el momento del estudio de 2001, para tener en
cuenta la progresión del dominio .us.
Utilizando la proporción de páginas
web en un dominio nacional con los resultados
calculados para cada dominio, obtenemos el resultado
siguiente:
Antes de la repartición de los dominios
genéricos:
| Dominios genéricos |
47,2% |
| Europa |
41,2% |
| América |
12,4% |
| África y Medio
Oriente |
0,6% |
| Asia y Oceanía |
0,3% |
| Resto |
0,7% |
| TOTAL |
100% |
Después de la repartición de los
dominios genéricos:
| Dominios genéricos |
0% |
| Europa |
93,9% |
| América |
33,6% |
| África y Medio
Oriente |
0,9% |
| Asia y Oceanía |
0,3% |
| Resto |
1,4% |
| TOTAL
|
130% |
Los porcentajes de sitios fuera del dominio nacional
deberán ser “normalizados”
para hacer corresponder el total
a 100% [41]. Los resultados
obtenidos se presentan en la tabla de la página
12.
|