Il posto delle lingue
e delle culture latine in Internet

 

 

Indice

 

1. Risultati dello studio linguistico

I risultati si sono ottenuti trattando un campione de 57 termini, selezionati in modo da permettere un confronto tra le lingue che fosse il più rigoroso possibile. Per ogni termine il rapporto delle lingue latine con l’inglese è utilizzato come variabile aleatoria, e le tecniche della statistica vengono applicate prendendo come ipotesi una distribuzione matematica corrente di questa variabile aleatoria (la curva di Gauss detta anche distribuzione "normale").

Per le misurazioni vengono presi in considerazione due spazi Internet: lo spazio WWW, esplorato con il motore di ricerca HotBot, e lo spazio Usenet, esplorato con il motore di ricerca DejaNews.

Il capitolo Metodologia Internet spiega le scelte dei motori di ricerca e commenta i limiti del metodo legati ai limiti dei motori di ricerca scelti.

Grazie al notevole sforzo consentito nella scelta dei termini del campione (spiegato nel capitolo Metodologia linguistica) i risultati sono statisticamente di buona qualità, vale a dire che la dispersione dei rapporti di ogni lingua rispetto all’inglese è relativamente debole, il che permette di costituire una finestra assai stretta dove la probabilità che il valore esatto sia incluso è del 99/100 (ciò che gli statistici chiamano "intervallo di fiducia"). I risultati, da questo punto di vista, sono migliori per lo spazio WWW che non per lo spazio Usenet, cosa che non ha niente di sorprendente visto il frequente utilizzo delle abbreviazioni nel quadro dei gruppi di discussione.

La qualità dei risultati (e quindi l’importanza dell’intervallo di fiducia) varia secondo le lingue: molto buono per il francese, buono per lo spagnolo e l’italiano nei due spazi, buono per il portoghese nello spazio WWW, debole per il rumeno e per il portoghese nello spazio Usenet. Vedere a questo proposito l’allegato 2.

 

1.1 Sintesi dei risultati

 

La tabella successiva presenta il rapporto tra ogni lingua latina e l’inglese, ottenuto con la misurazione del numero di ricorrenze dei termini del campione, in ognuno degli spazi studiati. Il francese è il meglio collocato nello spazio Internet, seguito da vicino dallo spagnolo. In compenso, ed è un fenomeno notevole, la sua presenza è debole nello spazio Usenet.

 

Tabella 1:
Medie delle lingue latine in rapporto all’inglese

WWW

USENET

SPAGNOLO

3,37%

2,41%

FRANCESE

3,75%

1,44%

ITALIANO

2,00%

2,54%

PORTOGHESE

1,09%

1,12%

RUMENO

0,20%

0,14%

 

1.2 Commenti riguardanti il valore assoluto della presenza dell’inglese

 

I risultati ottenuti permettono di valutare la presenza delle lingue latine in rapporto all’inglese; per quantificare la presenza assoluta delle lingue latine nello spazio WWW di Internet è necessario innanzitutto costruire un’ipotesi sulla presenza dell’inglese. La tabella sotto riportata mostra i valori di presenza assoluta, stabiliti a partire dalle medie per diverse ipotesi di presenza dell’inglese. Il risultato scritto in rosso è considerato come il più probabile, il più realistico, tenuto conto dei controlli incrociati effettuati dagli autori.

Al momento nessun metodo è completamente sicuro e, quale che sia quello considerato, perdurerà lo scoglio del calcolo nelle pagine multilingue. Confrontando i dati raccolti, è tuttavia possibile, con un’approssimazione grossolana, stimare il valore della presenza dell’inglese. L'algoritmo di lingua d'AltaVista è, tra gli altri, un elemento che permette di determinare questa forchetta (vedere nello studio L3 il "metodo del complemento dell’universo vuoto").

La percentuale di pagine in inglese può essere difficilmente inferiore al 65%, tenuto conto delle misurazioni effettuate grazie al metodo citato. Può essere difficilmente superiore all’85%, a ragione del posto occupato dalle lingue importanti: il giapponese, il tedesco, il francese e lo spagnolo, che possono equivalere a più del 15%. Sembra che una cifra ragionevole oggi sia intorno al 75%, se si tiene conto del posto occupato dalle lingue che rappresentano tra lo 0,5% e l’1% (ossia tra le 7 e le 10 lingue per un totale di 5%), quello delle lingue la cui presenza è assai debole, come il rumeno (ovvero tra le 10 e le 15 lingue allo 0,15% per un totale di 2%) e, infine, le numerosissime lingue la cui presenza rimane marginale. Quest’ultima proporzione è la più difficile da valutare; considerando l’ipotesi di 200 lingue con lo 0,025%, si raggiunge un totale di 5%... Una delle grandi incognite, le cui conseguenze dovranno essere valutate in futuro, è la possibile moltiplicazione delle lingue su Internet, il numero totale delle lingue praticate nel mondo è molto superiore a quello degli Stati nazionali, leggermente inferiore a 200.

Questa cifra del 75% si applica allo spazio WWW. Per lo spazio Usenet, la eleviamo all’80%.

 

Tabella 2:
Presenza assoluta delle lingue latine nello spazio WWW

 flh_red_do.gif (836 octets) Risultato più verosimile

Se INGLESE =

90,00%

85,00%

80,00%

75,00%

70,00%

65,00%

allora SPAGNOLO =

3,03%

2,86%

2,69%

3,37%

2,36%

2,19%

allora FRANCESE =

3,37%

3,19%

3,00%

3,75%

2,62%

2,44%

allora ITALIANO =

1,80%

1,70%

1,60%

2,00%

1,40%

1,30%

allora PORTOGHESE =

0,98%

0,93%

0,87%

1,09%

0,76%

0,71%

allora RUMENO =

0,18%

0,17%

0,16%

0,20%

0,14%

0,13%

 

1.3 Rapporto tra il numero di latini e peso della loro presenza nella Rete

 

È evidente che i valori di presenza assoluta non sono un indicatore perfetto del vigore di una lingua su Internet. Per ottenere un risultato significativo conviene rapportare i valori che esprimono la presenza delle lingue su Internet al metro della loro presenza nel mondo reale. Tuttavia, misurare l’importanza del reale utilizzo delle lingue nel mondo urta contro tutti gli scogli rappresentati dai criteri da definire per fare ciò 1 — e gli esperti non sono mai riusciti a raggiungere un accordo su questo argomento. Nel quadro del presente studio, per valutare per quanto possibile il posto che occupano veramente le lingue latine sul piano mondiale, gli autori hanno deciso arbitrariamente per un metodo spiegato nell’allegato 3Numero di parlanti delle lingue studiate.

Gli autori hanno convenuto, affinché le presenti statistiche siano rappresentative delle caratteristiche socio-linguistiche citate nel suddetto allegato, di sommare le cifre corrispondenti a:

individui che dominano una delle lingue di studio perché è la loro lingua madre e quelli che la dominano in un paese dove essa è ufficiale o di insegnamento,

individui la cui lingua madre è una delle lingue di studio ma che risiedono in un paese dove essa non gode di alcun riconoscimento.

 

Tabella 3:
Peso delle lingue latine (cifre arrotondate al milione)

Inglese

Spagnolo

Portoghese

Francese

Italiano

Rumeno

Presenza assoluta (numero di parlanti)

630

375

190

130

60

30

Presenza relativa (percentuale mondiale)

10,50%

6,25%

3,17%

2,17%

1%

0,50%

 

La presenza relativa di queste lingue è dunque calcolata senza tenere pienamente conto del fattore "multilinguismo".

Nell’ipotesi di una popolazione totale di 6 000 000 000 di uomini, la ponderazione della presenza delle lingue su Internet viene effettuata dividendo il valore della presenza nello spazio WWW per il valore della presenza relativa nel mondo. Un quoziente uguale a 1 è dunque da considerare un risultato "normale"; se è inferiore a 1 come insufficiente e se è superiore a 1 come un risultato discreto.

 

Tabella 4:
Presenza ponderata delle lingue latine nello spazio WWW

Presenza WWW
Assoluta

Presenza WWW ponderata

INGLESE

75,00%

7,14

SPAGNOLO

3,37%

0,40

FRANCESE

3,75%

1,30

ITALIANO

2,00%

1,50

PORTOGHESE

1,09%

0,26

RUMENO

0,20%

0,30

 

1.4 Rapporto tra il numero di latini e il peso della loro presenza nello spazio Usenet

Lo schema seguente presenta il risultato del calcolo statistico effettuato a partire dalla misurazione del numero di ricorrenze dei termini del campione nello spazio Usenet. Nell’allegato 4 troverete le tabelle che stabiliscono gli intervalli di fiducia.

 

Tabella 5:
Presenza assoluta delle lingue latine nello spazio Usenet

Risultati più verosimili

Se INGLESE =

90,00 %

85,00 %

80,00 %

75,00 %

70,00 %

65,00 %

allora SPAGNOLO =

2,17 %

2,05 %

2,41%

1,81 %

1,69 %

1,57 %

allora FRANCESE =

1,29 %

1,22 %

1,44%

1,08 %

1,01 %

0,93 %

allora ITALIANO =

2,29 %

2,16 %

2,54%

1,91 %

1,78 %

1,65 %

allora PORTOGHESE =

1,01 %

0,95 %

1,12%

0,84 %

0,79 %

0,73 %

allora RUMENO =

0,13 %

0,12 %

0,14%

0,11 %

0,10 %

0,09 %

 

Tabella 6:
Presenza ponderata delle lingue latine nello spazio Usenet

Presenza Usenet
assoluta

Presenza Usenet
ponderata

INGLESE

80,00%

7,14

SPAGNOLO

2,41%

0,31

FRANCESE

1,44%

0,53

ITALIANO

2,54%

2,03

PORTOGHESE

1,12%

0,28

RUMENO

0,14%

0,23

 


1 Bisogna prendere in considerazione soltanto le prime lingue ? Bisogna prendere in considerazione le cifre delle lingue ufficili anche se certe persone non parlano la lingua (come per esempio il francese ad Haiti)? Bisogna riconoscere a certe lingue un ruolo di lingua sovrannazionale e quindi veicolare?

 

Continuare

La Cultura