Româna
[es - fr - it - pt]

Publicatii
Studiu asupra locului limbii franceze pe Internet
Introducere
Metodologie
Limitele metodologiei
Antecedente
Locul ocupat de limba franceză pe Internet
Repartiţia paginilor in limba franceza pe ţari
Concluzii
Anexe

Pe scurt
Terminometro
Termilat
Agenda
Manifestari
Reuniuni care
au avut lac
Studiu asupra locului limbii franceze pe Internet

Metodologie  

 

 

Procesul care permite obţinerea de date pe web-ul francofon se sprijină pe lucrările realizate de FUNREDES începând cu 1996, referitoare la locul ocupat de limbile şi culturile latine pe Internet (http://funredes.org/LC/), cu sprijinul metodologic al Uniunii Latine pentru partea lingvistică. Acest studiu permite actualizarea rezultatelor studiului L5 realizat de FUNREDES în 2001. Detaliile privitoare la metodologie, precum şi rezultatele obţinute cu ocazia măsurătorilor precedente sunt disponibile la adresa: http://funredes.org/LC/francais/L5/.

Metoda se bazează pe studiul indexului câtorva motoare de căutare cum ar fi Google sau Alltheweb, precum şi pe selectarea unui eşantion de termeni [1] în funcţie de criterii lingvistice [2] care garantează calitatea rezultatelor. Rezultatul obţinut prin aplicarea metodelor statistice clasice [3] asupra datelor reprezintă un indiciu [4] al ponderii relative a limbilor latine faţă de limba engleză. Pentru a deduce valoarea absolută a ponderii limbilor latine pe Internet, trebuie stabilită o ipoteză asupra ponderii absolute a limbii engleze pe web, fapt realizabil prin diferite verificări. Utilizarea continuă a acestei metode începând cu 1998 permite oferirea unei imagini a evoluţiei ponderii limbii franceze pe Internet în ultimii 5 ani.

La fiecare repetare a acestui studiu este necesară analizarea comportamentului motoarelor de căutare, atât în ceea ce priveşte maniera de indexare a paginilor prezente pe Internet, cât şi în felul în care motoarele generează rezultatul căutărilor. O dată efectuată această analiză, este selecţionat motorul de căutare care răspunde cel mai bine criteriilor studiului. În anumite cazuri, când anomaliile detectate urmează în mod coerent o logică uşor de înţeles – cum se întâmplă de obicei în tratamentul semnelor diacritice –, rezultatele sunt ameliorate.

Metodologia utilizată pentru a obţine distribuţia între diferitele ţări a Internetului francofon reia procedura stabilită pentru limba spaniolă în 2001, cu ocazia Congresului Internaţional asupra Limbii Spaniole de la Valladolid [5]. Metoda de contorizare pornind de la cuvintele unui eşantion lingvistic este aplicată în mod selectiv în cadrul domeniilor Internet vizate. Motorul de căutare calculează astfel numărul de ocurenţe ale cuvintelor din eşantionul lingvistic, repartizate pe domenii [6] (.com, .net, .fr, .sn…). Pentru fiecare cuvânt din eşantion se obţine o distribuţie pe domenii [7]. Media acestor rezultate oferă o imagine a distribuţiei Internetului francofon pe domenii.


 
 

[1] Eşantion consultabil la adresa:
http://funredes.org/LC/francais/L5/L5appendix_3.html#table_15.

[2] Lista de criterii de selecţie lingvistică, permiţând apropierea de o semnificaţie şi de o valoare semantică echivalente, precum şi evitarea distorsiunilor, accesibilă la adresa: http://funredes.org/LC/francais/L5/L5appendix_7.html.

[3] Metoda lui Fischer este aplicată pornind de la ipoteza unei distribuţii normale.

[4] Media valorilor este stabilită, ca de altfel şi "intervalele de încredere", la 90 şi 99%.

[5] Document original în limba spaniolă: http://funredes.org/LC/L5/valladolid.html.
Document în limba franceză prezentând aceleaşi lucrări:
http://funredes.org/LC/L5/CahiersNumFinal.html.

[6] 85 de domenii sunt luate în consideraţie, fie peste 11 000 de căutări administrate în mod automat.

[7] De exemplu: o căutare pe Google a cuvântului "vérité" va da 700 000 de ocurenţe. Daca se restrânge aceasta căutare la domeniul .fr, rezultatul este redus la 202 000, deci 29% din 700 000; dacă se restrânge căutarea la domeniul canadian .ca, sunt găsite 75 000 rezultate, fie puţin peste 10%; dacă se aplică această căutare la domeniul Marocului (.ma), rezultatul obţinut este de 2 000, fie circa 0,3%.





131, rue du Bac - F-75007 Paris
T: (33 1) 45 49 60 62   /   F: (33 1) 45 49 67 39
dtil@unilat.org
webmaster