Italiano
[es - fr - pt - ro]

Publicazioni
Studio sul posto del francese in Internet
Introduzione
Metodologia
Limiti della metodologia
Antecedenti
Il posto del francese nella rete
Ripartizione delle pagine in francese per paese
Conclusioni
Allegati

Scorciatoie
Terminometro
Termilat
Calendario
Manifestazioni
Manifestazioni passate
Studio sul posto del francese in Internet

Metodologia  

 

 
 

Il processo che permette di ottenere dei dati sul web francofono si basa sui lavori realizzati da FUNREDES dal 1996 sul posto delle lingue e culture latine in Internet (http://funredes.org/LC/), con l'aiuto metodologico dell'Unione Latina per la parte linguistica. Questo studio permette di aggiornare i risultati dello studio L5 svolto da FUNREDES nel 2001. I dettagli relativi alla metodologia, come pure i risultati ottenuti nelle precedenti misurazioni, sono disponibili nella pagina http://funredes.org/LC/francais/L5/.

La metodologia parte dallo studio dell'indice di un certo numero di motori di ricerca quali Google o Alltheweb, come pure sulla selezione di un campione di termini [1] secondo criteri linguistici [2] che garantiscano la qualità dei risultati. Il risultato ottenuto applicando dei metodi statistici classici [3] sui dati è una indicazione [4] del peso relativo delle lingue latine rispetto all'inglese. Per dedurre il valore assoluto delle lingue latine in Internet, è necessario stabilire un'ipotesi sul peso assoluto dell'inglese nella Rete, e questo avviene grazie a dei confronti. L’utilizzo continuo di questo metodo dal 1998 permette di dare una immagine dell'evoluzione del peso del francese in Internet nel corso degli ultimi 5 anni.

Ad ogni iterazione di questo studio, è necessario analizzare il comportamento dei motori di ricerca sia nel loro modo di indicizzare le pagine presenti in Internet che nel modo in cui gestiscono il risultato delle richieste. Una volta fatta questa analisi, viene selezionato il motore che risponde meglio ai criteri dello studio. In certi casi, quando le anomalie riscontrate rispondono in modo coerente a una logica comprensibile –come spesso accade nella gestione dei diacritici–, i risultati vengono corretti.

La metodologia usata per ottenere la ripartizione dell’Internet francofono tra i vari paesi riprende il procedimento stabilito per il caso della lingua spagnola nel 2001, in occasione del Congresso internazionale sulla lingua spagnola di Valladolid [5]. Il metodo di conteggio a partire dalle parole campione linguistico viene applicata selettivamente all’interno dei domini Internet considerati. Il motore di ricerca misura così il numero di occorrenze delle parole campione per dominio [6] (.com, .net, .fr, .sn…). Per ogni parola campione, si ottiene una ripartizione per dominio [7]. La media di questi risultati fornisce un'immagine della ripartizione dell’Internet francofono per dominio.


 
 

[1] Si veda il campione sulla pagina
http://funredes.org/LC/francais/L5/L5appendix_3.html#table_15.

[2] Si veda la lista dei criteri linguistici di selezione che permettono di avvicinarsi al significato e alla portata semantica equivalenti come pure di evitare le distorsioni:
http://funredes.org/LC/francais/L5/L5appendix_7.html.

[3] Il metodo di Fischer viene applicato partendo dall’ipotesi di una distribuzione normale.

[4] La media dei valori, come pure degli "intervalli di confidenza", sta tra 90 e 99%.

[5] Documento originale in spagnolo : http://funredes.org/LC/L5/valladolid.html.
Documento in francese che presenta gli stessi lavori:
http://funredes.org/LC/L5/CahiersNumFinal.html.

[6] Sono presi in considerazione 85 domini, vale a dire più di 11 000 ricerche gestite automaticamente.

[7] Per esempio : una recerca su Google per la parola "verità" dà 700 000 occorrenze. Se si restringe questa ricerca al dominio .fr, il conteggio si riduce a 202 000, vale a dire il 29% di 700 000 ; se la si restringe al dominio canadese .ca, se ne trovano 75 000, cioè un po’ più del 10% ; se lo si applica al dominio del Marocco (.ma), il risultato è di 2 000, cioè circa lo 0,3%.

 





131, rue du Bac - F-75007 Paris
T: (33 1) 45 49 60 62   /   F: (33 1) 45 49 67 39
dtil@unilat.org
webmaster