| |
Procesul care permite obţinerea de date pe
web-ul francofon se sprijină pe lucrările realizate
de FUNREDES începând
cu 1996, referitoare la locul ocupat de
limbile şi culturile latine pe Internet (http://funredes.org/LC/),
cu sprijinul metodologic al Uniunii Latine pentru
partea lingvistică. Acest studiu permite actualizarea
rezultatelor studiului L5 realizat de FUNREDES
în 2001. Detaliile privitoare la metodologie,
precum şi rezultatele obţinute cu ocazia măsurătorilor
precedente sunt disponibile la adresa: http://funredes.org/LC/francais/L5/.
Metoda se bazează pe studiul indexului câtorva
motoare de căutare cum ar fi Google sau Alltheweb,
precum şi pe selectarea unui
eşantion de termeni
[1] în funcţie de criterii
lingvistice [2] care garantează
calitatea rezultatelor. Rezultatul obţinut prin
aplicarea metodelor
statistice clasice [3]
asupra datelor reprezintă un
indiciu [4] al ponderii relative
a limbilor latine faţă de limba engleză. Pentru
a deduce valoarea absolută a ponderii limbilor
latine pe Internet, trebuie stabilită o ipoteză
asupra ponderii absolute a limbii engleze pe web,
fapt realizabil prin diferite verificări. Utilizarea
continuă a acestei metode începând cu 1998 permite
oferirea unei imagini a evoluţiei
ponderii limbii franceze pe Internet în ultimii
5 ani.
La fiecare repetare a acestui studiu este necesară
analizarea comportamentului
motoarelor de căutare, atât în ceea ce
priveşte maniera de indexare a paginilor prezente
pe Internet, cât şi în felul în care motoarele
generează rezultatul căutărilor. O dată efectuată
această analiză, este selecţionat motorul de căutare
care răspunde cel mai bine criteriilor studiului.
În anumite cazuri, când anomaliile detectate urmează
în mod coerent o logică uşor de înţeles – cum
se întâmplă de obicei în tratamentul semnelor
diacritice –, rezultatele sunt ameliorate.
Metodologia utilizată pentru a obţine distribuţia
între diferitele ţări a Internetului francofon
reia procedura stabilită pentru limba spaniolă
în 2001, cu ocazia Congresului Internaţional
asupra Limbii Spaniole de la Valladolid [5].
Metoda de contorizare pornind de la cuvintele
unui eşantion lingvistic este aplicată în mod
selectiv în cadrul
domeniilor Internet vizate. Motorul de
căutare calculează astfel numărul de ocurenţe
ale cuvintelor din eşantionul
lingvistic, repartizate pe domenii [6]
(.com, .net, .fr, .sn…). Pentru fiecare
cuvânt din eşantion se obţine o distribuţie pe
domenii [7]. Media acestor rezultate
oferă o imagine a distribuţiei Internetului francofon
pe domenii.
|