Il processo che permette di ottenere dei dati
sul web francofono si basa sui lavori realizzati
da FUNREDES dal 1996
sul posto delle lingue e culture latine in Internet
(http://funredes.org/LC/),
con l'aiuto metodologico dell'Unione Latina per
la parte linguistica. Questo studio permette di
aggiornare i risultati dello studio L5 svolto
da FUNREDES nel 2001. I dettagli relativi alla
metodologia, come pure i risultati ottenuti nelle
precedenti misurazioni, sono disponibili nella
pagina http://funredes.org/LC/francais/L5/.
La metodologia parte dallo studio dell'indice
di un certo numero di motori di ricerca quali
Google o Alltheweb, come pure
sulla selezione di un campione
di termini [1] secondo
criteri linguistici
[2] che garantiscano la qualità
dei risultati. Il risultato ottenuto applicando
dei metodi
statistici classici [3]
sui dati è una indicazione
[4] del peso relativo delle lingue
latine rispetto all'inglese. Per dedurre il valore
assoluto delle lingue latine in Internet, è
necessario stabilire un'ipotesi sul peso assoluto
dell'inglese nella Rete, e questo avviene grazie
a dei confronti. L’utilizzo continuo di
questo metodo dal 1998 permette di dare una immagine
dell'evoluzione
del peso del francese in Internet nel corso degli
ultimi 5 anni.
Ad ogni iterazione di questo studio, è
necessario analizzare il comportamento
dei motori di ricerca sia nel loro modo
di indicizzare le pagine presenti in Internet
che nel modo in cui gestiscono il risultato delle
richieste. Una volta fatta questa analisi, viene
selezionato il motore che risponde meglio ai criteri
dello studio. In certi casi, quando le anomalie
riscontrate rispondono in modo coerente a una
logica comprensibile –come spesso accade
nella gestione dei diacritici–, i risultati
vengono corretti.
La metodologia usata per ottenere la ripartizione
dell’Internet francofono tra i vari paesi
riprende il procedimento stabilito per il caso
della lingua spagnola nel 2001, in occasione del
Congresso internazionale sulla lingua spagnola
di Valladolid [5]. Il metodo
di conteggio a partire dalle parole campione linguistico
viene applicata selettivamente all’interno
dei domini Internet considerati. Il motore
di ricerca misura così il
numero di occorrenze delle parole campione per
dominio [6] (.com, .net, .fr,
.sn…). Per ogni parola
campione, si ottiene una ripartizione per dominio
[7]. La media di questi risultati
fornisce un'immagine della ripartizione dell’Internet
francofono per dominio.
|