Locul Limbilor şi al Culturilor Latine
pe Internet

  • Partea I: Limba

 

 

Cuprins

 

ANEXA 6

 

Criterii ale selecţiei cuvintelor

Tabelul de mai jos ilustrează criteriile reţinute în vederea selectării termenilor eşantionului. Este vorba de criterii de filtrare pentru acceptarea cuvântului. Pentru a ajunge la cei 57 de termeni ai eşantionului au fost îndepărtaţi câteva sute.

 

Tabelul 13:
Criterii de selecţie lingvistică a cuvintelor eşantionului

 

CRITERIU DEFINIŢIE EXEMPLE METODĂ COMENTARII
Neutralitate culturală Proprietate a unui cuvânt în legătură cu frecvenţa apariţiei sale în limbaj, în funcţie de cultură. Vin, parfum, gastronomie şi cuvintele limbajului diplomatic nu sunt neutre cultural în limba franceză. Pentru a obţine un eşantion cu un coeficient de variaţie cât mai mic au fost eliminate cuvintele care nu sunt neutre cultural.  
Omografie translingvistică Ortografia unui cuvânt dintr-o limbă este identică cu cea a unui cuvânt dintr-o altă limbă. Aceasta priveşte tot atât de bine şi grafiile identice pentru un sens comun cât şi "falşii prieteni" . Se pot distinge omografiile cu sau fără diacritice. Exemplu de grafie identică: casa în spaniolă şi portugheză  înseamnă "casă".
Exemplu de "falşi prieteni": red în spaniolă ("reţea"), red în engleză ("roşu"); hier în franceză şi hier în germană ("aici").
Se elimină din eşantion cuvintele care prezintă aceste caracteristici (cu sau fără diacritice). Sunt luate în calcul numai omografiile între limbile studiului şi/sau ale limbilor foarte bine reprezentate pe Internet (cum ar fi germana). Pentru a evita riscul statistic de omografie cu limbile străine studiate, sunt eliminate cuvintele cu mai puţin de patru litere.
Omografie translingvistică având unul dintre elemente un cuvânt compus   Mardi gras în engleză. Trebuie supravegheate rezultatele cercetării pentru a detecta acest gen de intruşi. Este posibil să scadă scorul formelor străine.
Omografie translingvistică prin împrumut Când un cuvânt dintr-o limbă este acceptat ca atare într-o altă limbă. Anglicisme cum ar fi business, sandwich sau software. În mod reciproc, deja vu în engleză (omograf din franceză fără diacritice). Eliminarea eşantionului cuvintelor împrumutate.  
Omografie cu o abreviere   Cifra sept "şapte" în franceză cu abrevierea lui septembre "septembrie" în franceză şi mai ales September în engleză. A se evita aceste cuvinte. Suntem relativ protejaţi prin dispoziţia noastră de a fi evitate cuvintele cu mai puţin de patru litere.
Omografie cu un substantiv propriu frecvent   Windows înseamnă "fereastă" în engleză.... dar şi numele unui program foarte citat în spaţiul Internet. A se elimina cuvintele din această categorie  
Pseudo omografie translingvistică Scrierea unui cuvânt cu o eroare comună de ortografie face ca acesta să corespundă unui cuvânt dintr-o altă limbă. Ambasador în română şi ambas(s)ador în engleză. Cuvântul este eliminat numai dacă limba ţintă este limba engleză.  
Semnificaţii neechivalente   Prix "premiu" în franceză înseamnă şi premio şi precio (spaniolă), price şi prime (engleză). A se evita aceste cuvinte, sau dacă este posibil, să se urmărească compararea lor incluzând toate semnificaţiile care ar completa o semnificaţie echivalentă în limbile unde este necesar.  
Morfosintaxă neechivalentă: substantiv, verb Limba engleză, foarte diferită din punct de vedere sintactic faţă de alte limbi studiate, are adesea aceeaşi formă ca substantiv şi variantă verbală, aceasta din urmă fiind, de altfel, echivalentă cu mai multe forme ale conjugării verbelor în alte limbi. Love în engleză este în acelaşi timp substantiv "dragoste" şi verb "a iubi": la infinitiv (precedat de "to"), la prezent indicativ (iubesc, iubeşti, iubim, iubiţi,) etc. etc. A se evita aceste cuvinte. Această caracteristică a limbii engleze ne obligă să eliminăm a priori verbele
Morfosintaxă neechivalentă: adjective şi substantive Adjectivele, invariabile în limba engleză, variază în gen şi număr în celelalte limbi studiate. Substantivele, care nu variază în general decât ca număr în celelalte limbi, variază, de asemenea, şi după caz (nominativ, genitiv etc) şi diferenţă determinat / nedeterminat în limba română. Adjectivul englezesc yellow "galben" corespunde lui amarillo / amarilla / amarillos / amarillas în limba spaniolă. Substantivul englezesc instability / instabilities corespunde următoarelor variante: instabilitate / instabilitatea / instabilităţii / instabilităţi / instabilităţile / instabilităţilor (nu includem aici şi variantele fără diacritice). A se urmări multiplicarea variantelor în gen, număr şi caz, în celelalte limbi, când necesitatea de echivalenţă o cere.  
Pluricentrism lexic şi semantic Când o limbă are mai mult de un centru normativ lexico-semantic. După ţara hispanofonă, se spune nafta sau chiar gasolina ("benzină" ). Americano, în anumite ţări hispanofone din America Latină, nu are acelaşi sens ca în celelalte sau ca în Spania ("aparţinând continentului" sau "aparţinând Statelor Unite"). A se urmări, dacă este posibil, pentru echivalenţe, să se multiplice variantele sinonimice naţionale sau regionale.  
Pluricentrism ortografic Când o limbă are mai mult de un centru normativ ortografic. Este cazul limbii engleze şi mai ales al limbii portugheze. Anumite cuvinte se ortografiază diferit în Statele Unite şi în Marea Britanie , (theater şi theatre), în Portugalia şi în Brazilia (electricidade şi eletricidade). A se urmări, dacă este posibil, pentru echivalenţe, să se multiplice variantele ortografice naţionale.  

 

ANEXA 7

Tabelul 14:
Rezultatele măsurătorilor în spaţiul WWW

Pentru fiecare limbă apar, în tabelul de mai jos, valorile care corespund fiecărui termen care corespunde numărului ocurenţelor lor în spaţiul WWW, număraţi graţie serviciului HotBot pe baza următorilor parametri: "exact phrase", "anytime", "anywhere".

Astfel, sunt luate în calcul toate citările care apar în ansamblul paginilor Web la care se referă serviciul de căutare. Valorile marcate prin caractere cursive corespund anomaliilor în măsura rezultatelor muncii de pregătire lingvistică (a se vedea capitolul precedent).

 

 

CUVINTE

EN

ES

FR

IT

PT

RO

1

Ambiguity

144 766

2 072

5 466

2 169

706

317

2

causality

23 547

747

1 744

536

281

12

3

cheese

350 048

10 243

13 329

7 861

2 847

911

4

compatibility

619 141

6 248

9 140

8 584

2 272

869

5

contiguity

3 947

101

228

440

65

14

6

dangerous

422 323

15 423

20 639

8 854

3 327

82

7

december

4 202 193

119 649

152 966

60 469

41 827

5 295

8

density

573 362

9 277

16 396

5 052

3 156

314

9

disparity

62 899

1 499

3 428

1 819

526

8

10

divisibility

3 515

108

215

67

64

3

11

elasticity

43 374

1 377

1 623

1 538

579

50

12

electricity

380 218

16 721

24 586

2 500

3 280

286

13

february

4 072 110

105 941

129 898

53 753

19 515

3 523

14

femininity

15 281

430

870

570

129

19

15

fertility

113 268

2 097

2 317

903

1 254

48

16

fidelity

156 597

5 221

5 768

3 881

1 877

315

17

fraternity

197 787

2 978

5 878

1 988

1 533

75

18

friday

1 481 714

35 993

37 232

17 349

5 227

1 506

19

heterosexuality

6648

90

226

58

22

1

20

homosexuality

69 100

1 029

3 251

772

221

46

21

horse

373 770

6 454

11 311

11 120

1 527

127

22

humidity

201 190

8 158

6 447

2 896

2 257

114

23

illness

1 329 311

26 450

55 458

15 318

9 861

957

24

immortality

53 435

999

1 248

693

430

6

25

immunity

132 276

2 821

2 928

1 195

1 015

594

26

incompatibility

72 043

2 893

2 827

3 931

951

261

27

infallibility

7 468

196

221

130

83

0

28

inferiority

18 555

978

805

766

277

85

29

infidelity

19 343

801

542

472

219

14

30

instability

133 942

5 040

5 125

1 805

1 815

416

31

inviolability

4 634

863

392

222

247

63

32

irregularity

43 704

5 029

2 372

2 958

2 387

16

33

irresponsibility

11 420

1 727

741

281

384

232

34

june

4 466 960

118 879

159 146

66 627

27 606

3 786

35

knee

548 412

6 143

7 335

4 217

2 105

361

36

knife

325 334

3 672

6 878

3 386

3 500

664

37

lung

378 212

4 903

4 585

2 031

1 454

152

38

masculinity

19 436

352

338

104

131

8

39

monday

1 356 145

33 409

36 129

17 198

3 841

4 533

40

october

4 186 337

111 332

144 021

61 602

28 527

6 588

41

parity

398 500

18 244

22 870

9 553

4 004

1 408

42

probability

629 463

8 363

9 789

6 327

3 088

321

43

productivity

678 743

17 888

18 540

8 073

8 086

1 060

44

puberty

30 393

609

855

359

228

32

45

responsibility

3 076 317

64 057

79 070

31 791

20 552

2 310

46

sexuality

174 287

3 657

6 372

1 776

1 300

30

47

singularity

34 154

1 525

1 980

693

662

53

48

superiority

79 047

2 698

2 901

1 421

852

281

49

thursday

1 177 498

29 563

32 481

13 102

3 900

1 297

50

today

6 898 783

200 295

151 755

110 150

62 192

15 265

51

truth

1 109 455

50 004

32 219

18 042

22 785

7 740

52

tuesday

1 167 880

28 159

39 124

3 373

11 924

1 604

53

uniformity

74 001

1 940

2 814

1 927

565

54

54

universality

26 237

1 694

2 637

916

495

89

55

university

10 457 021

215 767

284 361

107 266

106 449

5 837

56

wednesday

2 231 584

56 276

54 576

23 020

7 217

3 221

57

yellow

2 379 190

90 170

47 471

28 431

7 605

1 358

  TOTAL

57 246 318

1 469 252

1 673 864

742 335

439 229

74 631

 

ANEXA 8

Tabelul 15:
Calcule statistice în spaţiul WWW

  CUVINTE EN ES FR IT PT RO
1 ambiguity 144 766 1,43% 3,78% 1,50% 0,49% 0,22%
2 causality 23 547 3,17% 7,41% 2,28% 1,19% 0,05%
3 cheese 350 048 2,93% 3,81% 2,25% 0,81% 0,26%
4 compatibility 619 141 1,01% 1,48% 1,39% 0,37% 0,14%
5 contiguity 3 947 2,56% 5,78% 11,15% 1,65% 0,35%
6 dangerous 422 323 3,65% 4,89% 2,10% 0,79% 0,02%
7 december 4 202 193 2,85% 3,64% 1,44% 1,00% 0,13%
8 density 573 362 1,62% 2,86% 0,88% 0,55% 0,05%
9 disparity 62 899 2,38% 5,45% 2,89% 0,84% 0,01%
10 divisibility 3 515 3,07% 6,12% 1,91% 1,82% 0,09%
11 elasticity 43 374 3,17% 3,74% 3,55% 1,33% 0,12%
12 electricity 380 218 4,40% 6,47% 0,66% 0,86% 0,08%
13 february 4 072 110 2,60% 3,19% 1,32% 0,48% 0,09%
14 femininity 15 281 2,81% 5,69% 3,73% 0,84% 0,12%
15 fertility 113 268 1,85% 2,05% 0,80% 1,11% 0,04%
16 fidelity 156 597 3,33% 3,68% 2,48% 1,20% 0,20%
17 fraternity 197 787 1,51% 2,97% 1,01% 0,78% 0,04%
18 friday 1 481 714 2,43% 2,51% 1,17% 0,35% 0,10%
19 heterosexuality 6 648 1,35% 3,40% 0,87% 0,33% 0,02%
20 homosexuality 69 100 1,49% 4,70% 1,12% 0,32% 0,07%
21 horse 373 770 1,73% 3,03% 2,98% 0,41% 0,03%
22 humidity 201 190 4,05% 3,20% 1,44% 1,12% 0,06%
23 illness 1 329 311 1,99% 4,17% 1,15% 0,74% 0,07%
24 immortality 53 435 1,87% 2,34% 1,30% 0,80% 0,01%
25 immunity 132 276 2,13% 2,21% 0,90% 0,77% 0,45%
26 incompatibility 72 043 4,02% 3,92% 5,46% 1,32% 0,36%
27 infallibility 7 468 2,62% 2,96% 1,74% 1,11% 0,00%
28 inferiority 18 555 5,27% 4,34% 4,13% 1,49% 0,46%
29 infidelity 19 343 4,14% 2,80% 2,44% 1,13% 0,07%
30 instability 133 942 3,76% 3,83% 1,35% 1,36% 0,31%
31 inviolability 4 634 18,62% 8,46% 4,79% 5,33% 1,36%
32 irregularity 43 704 11,51% 5,43% 6,77% 5,46% 0,04%
33 irresponsibility 11 420 15,12% 6,49% 2,46% 3,36% 2,03%
34 june 4 466 960 2,66% 3,56% 1,49% 0,62% 0,08%
35 knee 548 412 1,12% 1,34% 0,77% 0,38% 0,07%
36 knife 325 334 1,13% 2,11% 1,04% 1,08% 0,20%
37 lung 378 212 1,30% 1,21% 0,54% 0,38% 0,04%
38 masculinity 19 436 1,81% 1,74% 0,54% 0,67% 0,04%
39 monday 1 356 145 2,46% 2,66% 1,27% 0,28% 0,33%
40 october 4 186 337 2,66% 3,44% 1,47% 0,68% 0,16%
41 parity 398 500 4,58% 5,74% 2,40% 1,00% 0,35%
42 probability 629 463 1,33% 1,56% 1,01% 0,49% 0,05%
43 productivity 678 743 2,64% 2,73% 1,19% 1,19% 0,16%
44 puberty 30 393 2,00% 2,81% 1,18% 0,75% 0,11%
45 responsibility 3 076 317 2,08% 2,57% 1,03% 0,67% 0,08%
46 sexuality 174 287 2,10% 3,66% 1,02% 0,75% 0,02%
47 singularity 34 154 4,47% 5,80% 2,03% 1,94% 0,16%
48 superiority 79 047 3,41% 3,67% 1,80% 1,08% 0,36%
49 thursday 1 177 498 2,51% 2,76% 1,11% 0,33% 0,11%
50 today 6 898 783 2,90% 2,20% 1,60% 0,90% 0,22%
51 truth 1 109 457 4,51% 2,90% 1,63% 2,05% 0,70%
52 tuesday 1 167 880 2,41% 3,35% 0,29% 1,02% 0,14%
53 uniformity 74 001 2,62% 3,80% 2,60% 0,76% 0,07%
54 universality 26 237 6,46% 10,05% 3,49% 1,89% 0,34%
55 university 10 457 021 2,06% 2,72% 1,03% 1,02% 0,06%
56 wednesday 2 231 584 2,52% 2,45% 1,03% 0,32% 0,14%
57 yellow 2 379 190 3,79% 2,00% 1,19% 0,32% 0,06%
  Medie 3,37% 3,75% 2,00% 1,09% 0,20%
  Abatere-tip 3,07% 1,78% 1,76% 0,99% 0,33%
  Coeficient de variaţie 0,96 0,69 0,94 0,95 1,27

 

Valorile mult superioare mediei sunt semnalate pe fond negru.
Valorile mult inferioare mediei sunt semnalate pe fond gri.

Coeficientul de variaţie este rădăcina pătrată a abaterii standard la puterea a II-a împărţit la media la pătrat. O valoare superioară lui 1 indică o dispersie foarte mare, deci o medie puţin fiabilă. O valoare inferioară lui 1 indică o dispersie slabă şi deci un rezultat cu atât mai fiabil cu cât valoarea este mai mică.

 

Continuare

Cultura