Locul Limbilor și al Culturilor Latine
pe Internet

  • Partea I: Limba

 

 

Cuprins

 

1. Rezultatele studiului lingvistic

Rezultatele sunt obținute prin prelucrarea unui eșantion care conține 57 de termeni selecționați astfel încât să se permită o comparare, cât se poate de riguroasă, între limbile respective. Pentru fiecare termen, raportul limbilor latine față de engleză este utilizat ca o variabilă aleatoare, iar tehnicile statistice sunt aplicate luând drept ipoteză o distribuție matematică curentă a acestei variabile aleatoare (curba lui Gauss numită și distribuție "normală").

Au fost luate în considerare, pentru măsurători, două spații Internet: spațiul WWW, explorat cu serviciul de căutare HotBot, și spațiul Usenet, explorat cu serviciul de căutare DejaNews.

Capitolul Metodologie Internet explică alegerea utilitarelor de căutare și comentează limitele metodei legate de limitele serviciilor de căutare alese.

Grație efortului considerabil depus în alegerea termenilor eșantionului (care este explicat în capitolul Metodologie lingvistică), rezultatele sunt de bună calitate din punct de vedere statistic, adică dispersia rapoartelor fiecărei limbi față de engleză este relativ slabă, ceea ce permite constituirea unui spațiu destul de îngust unde probabilitatea ca valoarea exactă să fie inclusă este de 99/100 (ceea ce statisticienii numesc "interval de î ncredere"). Din acest punct de vedere rezultatele sunt mai bune pentru spațiul WWW decât cele pentru spațiul Usenet ceea ce nu are nimic surpinzător dată fiind frecventa utilizare a abrevierilor în cadrul grupurilor de discuție.

Calitatea rezultatelor (și deci importanța intervalului de î ncredere) variază în funcție de limbi: foarte bună pentru franceză, bună pentru spaniolă și italiană în cele două spații, bună pentru portugheză în spațiul WWW, slabă pentru portugheză și româ nă în spațiul Usenet. A se vedea în acest sens anexa 2.

 

1.1 Sinteza rezultatelor

 

Tabelul următor prezintă raportul mediu între fiecare limbă latină și limba engleză, obținut prin măsurarea numărului menționărilor termenilor eșantionului în fiecare din cele două spații Internet studiate. Limba franceză este cel mai bine reprezentată în spațiul Internet, urmată îndeaproape de spaniolă. În schimb, fenomen notabil, prezența sa este slabă în spațiul Usenet.

 

Tabelul 1:
Mediile limbilor latine în raport cu limba engleză

WWW

USENET

SPANIOLĂ

3,37%

2,41%

FRANCEZĂ

3,75%

1,44%

ITALIANĂ

2,00%

2,54%

PORTUGHEZĂ

1,09%

1,12%

ROMÂNĂ

0,20%

0,14%

 

1.2 Comentarii privind valoarea absolută a prezenței Limbii engleze

 

Rezultatele obținute permit evaluarea prezenței limbilor latine față de limba engleză; pentru a evalua prezența absolută a limbilor latine în spațiul Internet WWW este necesar, în prealabil, să se determine o prezență probabilă a limbii engleze. Tabelul de mai jos arată valorile prezenței absolute, stabilite plecâ nd de la mediile mai multor prezențe probabile ale limbii engleze. Rezultatul scris cu roșu este considerat ca cel mai probabil, cel mai realist, ținând cont de verificările efectuate de autori.

Nici o metodă nu este sigură în totalitate, la ora actuală, și oricare ar fi cea reținută pentru utilizare, va persista dificultatea numărării în paginile multilingve. Verificând datele culese, este totuși posibil să se aprecieze, printr-o estimare grosso modo, valoare prezenței limbii engleze. Algoritmul limbajului programului AltaVista este, printre altele, un element care permite să se determine acest interval (a se vedea în studiul L3 "metoda complementului universului vid").

Procentul paginilor în limba engleză este cu puțin inferior valorii de 65%, tinând cont de măsurătorile efectuate prin metoda citată. De asemenea este puțin probabil să fie superior valorii de 85%, ținând cont de locul ocupat de limbile importante: japoneza, germana, franceza și spaniola, care pot însuma mai mult de 15%. Se pare că o cifră rezonabilă ar fi de aproximativ 75%, dacă se ia în considerare locul ocupat de limbile care reprezintă între 0,5% și 1% (adică între 7 și 10 limbi pentru un total de 5%), locul ocupat de limbile a căror prezență este foarte slabă, cum este limba română (și anume între 10 și 15 limbi reprezentând 0,15% pentru un total de 2%) și, în sfârșit, foarte numeroasele limbi a căror prezență rămâ ne marginală. Această ultimă proporție este cel mai greu de estimat; considerând ipoteza că 200 de limbi reprezintă 0,025%, se ajunge la un total de 5%. Una din marile necunoscute, ale cărei consecințe vor fi evaluate în viitor, este posibila multiplicare a limbilor pe Internet, totalul limbilor vorbite în lume fiind cu mult superior celui al națiunilor, acesta fiind cu puțin mai mic de 200.

Această cifră de 75% este valabilă pentru spațiul WWW. Pentru spațiul Usenet, o vom ridica la 80%.

 

Tabelul 2:
Prezența absolută a limbilor latine î n spațiul WWW

 

flh_red_do.gif (836 octets) Rezultatul cel mai veridic

Dacă ENGLEZA =

90,00%

85,00%

80,00%

75,00%

70,00%

65,00%

atunci SPANIOLA =

3,03%

2,86%

2,69%

3,37%

2,36%

2,19%

atunci FRANCEZA =

3,37%

3,19%

3,00%

3,75%

2,62%

2,44%

atunci ITALIANA =

1,80%

1,70%

1,60%

2,00%

1,40%

1,30%

atunci PORTUGHEZA =

0,98%

0,93%

0,87%

1,09%

0,76%

0,71%

atunci ROMÂNA =

0,18%

0,17%

0,16%

0,20%

0,14%

0,13%

 

1.3 Relația între numărul latinilor și ponderea prezenței lor pe Internet

Este evident că valorile prezenței absolute nu sunt un indicator perfect al vigorii unei limbi pe Internet. Pentru a obține un rezultat semnificativ, s-a convenit să se proporționeze valorile care exprimă prezența limbilor pe Internet la valoarea prezenței lor în lumea reală. Totuși, măsurarea importanței utilizării reale a limbilor în lume se lovește de obstacolele ridicate de criteriile care trebuie definite în acest scop1 - iar experții nu au putut niciodată să ajungă la un acord în acest sens. În cadrul prezentului studiu, în scopul aprecierii cât mai exacte a locului pe care-l ocupă într-adevăr limbile latine pe plan mondial, autorii au ales, în mod arbitrar, o metodă descrisă în Anexa 3 - Numărul vorbitorilor limbilor studiate.

Autorii au convenit, pentru ca statisticile prezente să fie reprezentative prin caracteristicile sociolingvistice menționate în Anexa respectivă, să se adauge cifrele corespunzătoare numărului:

indivizilor care stăpâ nesc o limbă a studiului pentru că aceasta este limba lor maternă și ale celor care o stăpâ nesc într-o țară unde este limbă oficială sau de predare,

indivizilor a căror limbă maternă este una din limbile studiului dar ei sunt rezidenți într-o țară unde aceasta nu se bucură de nici o recunoaștere.

 

Tabelul 3:
Ponderea limbilor latine (cifre rotunjite în milioane)

Engleză

Spaniolă

Portugheză

Franceză

Italiană

Română

Prezență absolută (număr de vorbitori)

630

375

190

130

60

30

Prezență relativă (procentaj mondial)

10,50%

6,25%

3,17%

2,17%

1%

0,50%

 

Prezența relativă este deci calculată fără a ține cont, în totalitate, de factorul "multilingvism".

Luând în considerare o populație totală de 6 000 000 000 de oameni, ponderea prezenței limbilor pe Internet se calculează împărțind valoarea prezenței în spațiul WWW la valoarea prezenței relative în lume. Un rezultate egal cu 1 trebuie deci considerat ca un rezultat "normal" ; dacă este inferior cifrei 1, ca nesatisfăcător și dacă este superior cifrei 1, ca un rezultat notabil.

 

Tabelul 4:
Prezența ponderată a limbilor latine î n spațiul WWW

Prezență WWW absolută

Prezență WWW ponderată

ENGLEZĂ

75,00%

7,14

SPANIOLĂ

3,37%

0,40

FRANCEZĂ

3,75%

1,30

ITALIANĂ

2,00%

1,50

PORTUGHEZĂ

1,09%

0,26

ROMÂNĂ

0,20%

0,30

 

1.4 Relația între numărul latinilor și ponderea prezenței lor în spațiul Usenet

Schema următoare prezintă rezultatul calculului statistic efectuat plecând de la măsurarea numărului citărilor termenilor din eșantion în spațiul Usenet. În anexa 4 veți găsi tabelele care stabilesc intervalele de încredere.

 

Tabelul 5:
Prezența absolută a limbilor latine î n spațiul Usenet

Rezultatul cel mai veridic

Dacă ENGLEZA =

90,00 %

85,00 %

80,00 %

75,00 %

70,00 %

65,00 %

atunci SPANIOLA =

2,17 %

2,05 %

2,41 %

1,81 %

1,69 %

1,57 %

atunci FRANCEZA =

1,29 %

1,22 %

1,44 %

1,08 %

1,01 %

0,93 %

atunci ITALIANA =

2,29 %

2,16 %

2,54 %

1,91 %

1,78 %

1,65 %

atunci PORTUGHEZA =

1,01 %

0,95 %

1,12 %

0,84 %

0,79 %

0,73 %

atunci ROMÂ NA =

0,13 %

0,12 %

0,14 %

0,11 %

0,10 %

0,09 %

 

Tabelul 6:
Prezența ponderată a limbilor latine în spațiul Usenet

Prezență Usenet
absolută

Prezență Usenet
ponderată

ENGLEZĂ

80,00%

7,14

SPANIOLĂ

2,41%

0,31

FRANCEZĂ

1,44%

0,53

ITALIANĂ

2,54%

2,03

PORTUGHEZĂ

1,12%

0,28

ROMÂNĂ

0,14%

0,23

 


1 Trebuie luate în considerare numai limbile de pe primele locuri? Trebuie luat în considerare numărul limbilor oficiale, chiar dacă unele persoane nu vorbesc limba respectivă (cum ar fi, de exemplu, franceza în Haiti)? Trebuie recunoscut pentru anumite limbi rolul de limbă supranațională, deci propagatoare?

 

Continuare

Cultura