Il posto delle lingue
e delle culture latine in Internet
PARTE 1 : LA LINGUA
|
1. Risultati dello studio linguistico I risultati si sono ottenuti trattando un campione de 57 termini, selezionati in modo da permettere un confronto tra le lingue che fosse il più rigoroso possibile. Per ogni termine il rapporto delle lingue latine con linglese è utilizzato come variabile aleatoria, e le tecniche della statistica vengono applicate prendendo come ipotesi una distribuzione matematica corrente di questa variabile aleatoria (la curva di Gauss detta anche distribuzione "normale"). Per le misurazioni vengono presi in considerazione due spazi Internet: lo spazio WWW, esplorato con il motore di ricerca HotBot, e lo spazio Usenet, esplorato con il motore di ricerca DejaNews. Il capitolo Metodologia Internet spiega le scelte dei motori di ricerca e commenta i limiti del metodo legati ai limiti dei motori di ricerca scelti. Grazie al notevole sforzo consentito nella scelta dei termini del campione (spiegato nel capitolo Metodologia linguistica) i risultati sono statisticamente di buona qualità, vale a dire che la dispersione dei rapporti di ogni lingua rispetto allinglese è relativamente debole, il che permette di costituire una finestra assai stretta dove la probabilità che il valore esatto sia incluso è del 99/100 (ciò che gli statistici chiamano "intervallo di fiducia"). I risultati, da questo punto di vista, sono migliori per lo spazio WWW che non per lo spazio Usenet, cosa che non ha niente di sorprendente visto il frequente utilizzo delle abbreviazioni nel quadro dei gruppi di discussione. La qualità dei risultati (e quindi limportanza dellintervallo di fiducia) varia secondo le lingue: molto buono per il francese, buono per lo spagnolo e litaliano nei due spazi, buono per il portoghese nello spazio WWW, debole per il rumeno e per il portoghese nello spazio Usenet. Vedere a questo proposito lallegato 2.
La tabella successiva presenta il rapporto tra ogni lingua latina e linglese, ottenuto con la misurazione del numero di ricorrenze dei termini del campione, in ognuno degli spazi studiati. Il francese è il meglio collocato nello spazio Internet, seguito da vicino dallo spagnolo. In compenso, ed è un fenomeno notevole, la sua presenza è debole nello spazio Usenet.
Tabella
1:
1.2 Commenti riguardanti il valore assoluto della presenza dellinglese
I risultati ottenuti permettono di valutare la presenza delle lingue latine in rapporto allinglese; per quantificare la presenza assoluta delle lingue latine nello spazio WWW di Internet è necessario innanzitutto costruire unipotesi sulla presenza dellinglese. La tabella sotto riportata mostra i valori di presenza assoluta, stabiliti a partire dalle medie per diverse ipotesi di presenza dellinglese. Il risultato scritto in rosso è considerato come il più probabile, il più realistico, tenuto conto dei controlli incrociati effettuati dagli autori. Al momento nessun metodo è completamente sicuro e, quale che sia quello considerato, perdurerà lo scoglio del calcolo nelle pagine multilingue. Confrontando i dati raccolti, è tuttavia possibile, con unapprossimazione grossolana, stimare il valore della presenza dellinglese. L'algoritmo di lingua d'AltaVista è, tra gli altri, un elemento che permette di determinare questa forchetta (vedere nello studio L3 il "metodo del complemento delluniverso vuoto"). La percentuale di pagine in inglese può essere difficilmente inferiore al 65%, tenuto conto delle misurazioni effettuate grazie al metodo citato. Può essere difficilmente superiore all85%, a ragione del posto occupato dalle lingue importanti: il giapponese, il tedesco, il francese e lo spagnolo, che possono equivalere a più del 15%. Sembra che una cifra ragionevole oggi sia intorno al 75%, se si tiene conto del posto occupato dalle lingue che rappresentano tra lo 0,5% e l1% (ossia tra le 7 e le 10 lingue per un totale di 5%), quello delle lingue la cui presenza è assai debole, come il rumeno (ovvero tra le 10 e le 15 lingue allo 0,15% per un totale di 2%) e, infine, le numerosissime lingue la cui presenza rimane marginale. Questultima proporzione è la più difficile da valutare; considerando lipotesi di 200 lingue con lo 0,025%, si raggiunge un totale di 5%... Una delle grandi incognite, le cui conseguenze dovranno essere valutate in futuro, è la possibile moltiplicazione delle lingue su Internet, il numero totale delle lingue praticate nel mondo è molto superiore a quello degli Stati nazionali, leggermente inferiore a 200. Questa cifra del 75% si applica allo spazio WWW. Per lo spazio Usenet, la eleviamo all80%.
Tabella
2:
1.3 Rapporto tra il numero di latini e peso della loro presenza nella Rete
È evidente che i valori di presenza assoluta non sono un indicatore perfetto del vigore di una lingua su Internet. Per ottenere un risultato significativo conviene rapportare i valori che esprimono la presenza delle lingue su Internet al metro della loro presenza nel mondo reale. Tuttavia, misurare limportanza del reale utilizzo delle lingue nel mondo urta contro tutti gli scogli rappresentati dai criteri da definire per fare ciò 1 e gli esperti non sono mai riusciti a raggiungere un accordo su questo argomento. Nel quadro del presente studio, per valutare per quanto possibile il posto che occupano veramente le lingue latine sul piano mondiale, gli autori hanno deciso arbitrariamente per un metodo spiegato nellallegato 3 Numero di parlanti delle lingue studiate. Gli autori hanno convenuto, affinché le presenti statistiche siano rappresentative delle caratteristiche socio-linguistiche citate nel suddetto allegato, di sommare le cifre corrispondenti a:
Tabella
3:
La presenza relativa di queste lingue è dunque calcolata senza tenere pienamente conto del fattore "multilinguismo". Nellipotesi di una popolazione totale di 6 000 000 000 di uomini, la ponderazione della presenza delle lingue su Internet viene effettuata dividendo il valore della presenza nello spazio WWW per il valore della presenza relativa nel mondo. Un quoziente uguale a 1 è dunque da considerare un risultato "normale"; se è inferiore a 1 come insufficiente e se è superiore a 1 come un risultato discreto.
Tabella
4:
1.4 Rapporto tra il numero di latini e il peso della loro presenza nello spazio Usenet Lo schema seguente presenta il risultato del calcolo statistico effettuato a partire dalla misurazione del numero di ricorrenze dei termini del campione nello spazio Usenet. Nellallegato 4 troverete le tabelle che stabiliscono gli intervalli di fiducia.
Tabella
5:
Tabella
6:
1 Bisogna prendere in considerazione soltanto le prime lingue ? Bisogna prendere in considerazione le cifre delle lingue ufficili anche se certe persone non parlano la lingua (come per esempio il francese ad Haiti)? Bisogna riconoscere a certe lingue un ruolo di lingua sovrannazionale e quindi veicolare?
|