Il posto delle lingue
e delle culture latine in Internet

 

 

Indice

 

Allegato 6

 

Criteri di selezione delle parole

La tavola seguente precisa l’insieme dei criteri considerati per procedere alla selezione dei termini del campione. Si tratta di criteri di filtraggio per l’accettazione di una parola. Per arrivare ai 57 termini del campione, ne sono così stati scartati centinaia di altri.

 

Tabella 13 :
Criteri di selezione linguistica delle parole del campione

 

CRITERIO DEFINIZIONE ESEMPI METODO COMMENTI
Neutralità culturale Proprietà di una parola rispetto alla frequenza di comparsa nella lingua in funzione della cultura. Vino, profumo, gastronomia e le parole del linguaggio diplomatico non sono culturalmente neutre in francese. Per ottenere un campione con coefficiente di variazione più debole, sono state scartate le parole non neutre culturalmente.  
Omografia translinguistica L'ortografia di una parola in una lingua è identica a quella di una parola in un'altra lingua. Questo riguarda allo stesso modo le grafie identiche per uno stesso senso e i "falsi amici". È possibile distinguere le omografie con o senza diacritici. Esempio di grafia identica: casa in spagnolo e portoghese significa "casa".
Esempi di "falsi amici": red in spagnolo ("rete"), red in inglese ("rosso"); hier in francese ("ieri") e hier in tedesco ("qui").
Rifiutare dal campione le parole che presentano questa caratteristica (con o senza i diacritici). Si tiene conto solo delle omografie tra le lingue dello studio e/o con delle lingue molto presenti su Internet (come il tedesco). Per evitare il rischio statistico di omografia con lingue straniere allo studio, sono state scartate le parole con meno di quattro lettere.
Omografia translinguistica con uno degli elementi di una parola composta   Mardi gras in inglese. Bisogna vigilare sui risultati delle ricerche per rilevare questo tipo di intrusi. È possibile scontare il punteggio delle forme straniere.
Omografia translinguistica incidentale Quando una parola di una lingua è accettata così com’è in un’altra lingua. Gli anglicismi come business, sandwich o software. Viceversa, deja vu in inglese (omografia del francese senza diacritici). Rifiuto del campione delle parole prese in prestito.  
Omografia con una abbreviazione   Il numero sept con le abbreviazioni di septembre e soprattutto September (inglese). Evitare queste parole. Siamo relativamente tutelati dalla nostra consegna di evitare le parole con meno di quattro lettere
Omografia con un nome proprio frequente Windows significa "finestra" in inglese.... ma è anche il nome di un programma molto citato nello spazio Internet. Rifiutare le parole di questa categoria.
Pseudo-omografia translinguistica La scrittura di una parola con un errore comune di ortografia corrisponde ad una parola in un’altra lingua. Ambasador in rumeno e ambas(s)ador in inglese. Il caso è rifiutato solo se la lingua bersaglio è l’inglese.  
Significati non equivalenti   Prix in francese significa al tempo stesso premio e prezzo (spagnolo), price e prime (inglese). Evitare queste parole o, se possibile, badare a confrontarle includendo tutti i significanti che completerebbero un significato equivalente nelle lingue dov’è necessario.  
Morfo-sintassi non equivalente : sostantivo, verbo L’inglese, molto diverso dal punto di vista sintattico dalle altre lingue studiate, ha spesso la stessa forma come sostantivo e variante verbale, equivalente quest’ultimo, peraltro, a molte forme di coniugazione nelle altre lingue. Love in inglese è allo stesso tempo un sostantivo che significa "amore" e il verbo amare: all’infinito (preceduto da "to"), al presente dell’indicativo (amo, ami, amiamo, amate, amano), ecc., ecc. Evitare queste parole. Queste caratteristiche dell’inglese ci fanno rifiutare a priori i verbi.
Morfo-sintassi non equivalente : aggettivi e sostantivi Gli aggettivi invariabili in inglese, variano nel genere e nel numero nelle altre lingue studiate. I sostantivi, che non variano nel genere se non nel numero nelle altre lingue, variano anche secondo il caso (nominativo, genitivo, ecc.) e differenza determinata/non determinata in rumeno. L'aggettivo inglese yellow corrisponde a amarillo / amarilla / amarillos / amarillas, in spagnolo. Il sostantivo inglese instability / instabilities nelle seguenti varianti rumene: instabilitate / instabilitatea / instabilităţii / instabilităţi / instabilităţile / instabilităţilor (non includiamo qui le varianti senza diacritici). Fare attenzione a moltiplicare le varianti di genere, numero e caso nelle altre lingue, quando la necessità di equivalenza lo richiede.  
Pluricentrismo lessico e semantico Quando una lingua ha più di un centro normativo lessico-semantico. Secondo il paese ispanofono, si dice nafta oppure gasolina ("benzina"). Americano, in alcuni paesi ispanofoni dell’America latina, non ha lo stesso significato che in altri o in Spagna ("appartenente all’insieme del continente" o "appartenente agli Stati Uniti"). Stare attenti a moltiplicare le varianti sinonimiche nazionali o regionali per le equivalenze, quando è possibile.  
Pluricentrismo ortografico Quando una lingua ha più di un centro normativo ortografico. È il caso dell’inglese e soprattutto del portoghese. Alcune parole hanno ortografia diversa negli Stati Uniti o in Inghilterra, (theater e theatre), in Portogalllo e in Brasile (electricidade e eletricidade). Stare attenti a moltiplicare le varianti ortografiche nazionali per le equivalenze, quando sia possibile.  

 

Allegato 7

Tabella 14 :
Risultati delle misurazioni nello spazio WWW

Nella tabella sottostante, per ogni lingua i valori compaiono rispetto ad ognuno dei termini corrispondenti al numero di ricorrenze dei suddetti termini nello spazio WWW, contati grazie al motore HotBot sulla base dei seguenti parametri: "exact phrase", "anytime", "anywhere".

Così, vengono prese in considerazione tutte le ricorrenze che compaiono nell’insieme delle pagine Web riferite dal motore. I valori segnati in italico corrispondono a delle anomalie nella misurazione risultanti dal lavoro di preparazione linguistica (vedere il capitolo precedente).

 

PAROLE

EN

ES

FR

IT

PT

RO

1

Ambiguity

144 766

2 072

5 466

2 169

706

317

2

causality

23 547

747

1 744

536

281

12

3

cheese

350 048

10 243

13 329

7 861

2 847

911

4

compatibility

619 141

6 248

9 140

8 584

2 272

869

5

contiguity

3 947

101

228

440

65

14

6

dangerous

422 323

15 423

20 639

8 854

3 327

82

7

december

4 202 193

119 649

152 966

60 469

41 827

5 295

8

density

573 362

9 277

16 396

5 052

3 156

314

9

disparity

62 899

1 499

3 428

1 819

526

8

10

divisibility

3 515

108

215

67

64

3

11

elasticity

43 374

1 377

1 623

1 538

579

50

12

electricity

380 218

16 721

24 586

2 500

3 280

286

13

february

4 072 110

105 941

129 898

53 753

19 515

3 523

14

femininity

15 281

430

870

570

129

19

15

fertility

113 268

2 097

2 317

903

1 254

48

16

fidelity

156 597

5 221

5 768

3 881

1 877

315

17

fraternity

197 787

2 978

5 878

1 988

1 533

75

18

friday

1 481 714

35 993

37 232

17 349

5 227

1 506

19

heterosexuality

6648

90

226

58

22

1

20

homosexuality

69 100

1 029

3 251

772

221

46

21

horse

373 770

6 454

11 311

11 120

1 527

127

22

humidity

201 190

8 158

6 447

2 896

2 257

114

23

illness

1 329 311

26 450

55 458

15 318

9 861

957

24

immortality

53 435

999

1 248

693

430

6

25

immunity

132 276

2 821

2 928

1 195

1 015

594

26

incompatibility

72 043

2 893

2 827

3 931

951

261

27

infallibility

7 468

196

221

130

83

0

28

inferiority

18 555

978

805

766

277

85

29

infidelity

19 343

801

542

472

219

14

30

instability

133 942

5 040

5 125

1 805

1 815

416

31

inviolability

4 634

863

392

222

247

63

32

irregularity

43 704

5 029

2 372

2 958

2 387

16

33

irresponsibility

11 420

1 727

741

281

384

232

34

june

4 466 960

118 879

159 146

66 627

27 606

3 786

35

knee

548 412

6 143

7 335

4 217

2 105

361

36

knife

325 334

3 672

6 878

3 386

3 500

664

37

lung

378 212

4 903

4 585

2 031

1 454

152

38

masculinity

19 436

352

338

104

131

8

39

monday

1 356 145

33 409

36 129

17 198

3 841

4 533

40

october

4 186 337

111 332

144 021

61 602

28 527

6 588

41

parity

398 500

18 244

22 870

9 553

4 004

1 408

42

probability

629 463

8 363

9 789

6 327

3 088

321

43

productivity

678 743

17 888

18 540

8 073

8 086

1 060

44

puberty

30 393

609

855

359

228

32

45

responsibility

3 076 317

64 057

79 070

31 791

20 552

2 310

46

sexuality

174 287

3 657

6 372

1 776

1 300

30

47

singularity

34 154

1 525

1 980

693

662

53

48

superiority

79 047

2 698

2 901

1 421

852

281

49

thursday

1 177 498

29 563

32 481

13 102

3 900

1 297

50

today

6 898 783

200 295

151 755

110 150

62 192

15 265

51

truth

1 109 455

50 004

32 219

18 042

22 785

7 740

52

tuesday

1 167 880

28 159

39 124

3 373

11 924

1 604

53

uniformity

74 001

1 940

2 814

1 927

565

54

54

universality

26 237

1 694

2 637

916

495

89

55

university

10 457 021

215 767

284 361

107 266

106 449

5 837

56

wednesday

2 231 584

56 276

54 576

23 020

7 217

3 221

57

yellow

2 379 190

90 170

47 471

28 431

7 605

1 358

TOTALE

57 246 318

1 469 252

1 673 864

742 335

439 229

74 631

 

Allegato 8

Tabella 15 :
Calcoli statistici nello spazio WWW

PAROLE

EN

ES

FR

IT

PT

RO

1

ambiguity

144 766

1,43%

3,78%

1,50%

0,49%

0,22%

2

causality

23 547

3,17%

7,41%

2,28%

1,19%

0,05%

3

cheese

350 048

2,93%

3,81%

2,25%

0,81%

0,26%

4

compatibility

619 141

1,01%

1,48%

1,39%

0,37%

0,14%

5

contiguity

3 947

2,56%

5,78%

11,15%

1,65%

0,35%

6

dangerous

422 323

3,65%

4,89%

2,10%

0,79%

0,02%

7

december

4 202 193

2,85%

3,64%

1,44%

1,00%

0,13%

8

density

573 362

1,62%

2,86%

0,88%

0,55%

0,05%

9

disparity

62 899

2,38%

5,45%

2,89%

0,84%

0,01%

10

divisibility

3 515

3,07%

6,12%

1,91%

1,82%

0,09%

11

elasticity

43 374

3,17%

3,74%

3,55%

1,33%

0,12%

12

electricity

380 218

4,40%

6,47%

0,66%

0,86%

0,08%

13

february

4 072 110

2,60%

3,19%

1,32%

0,48%

0,09%

14

femininity

15 281

2,81%

5,69%

3,73%

0,84%

0,12%

15

fertility

113 268

1,85%

2,05%

0,80%

1,11%

0,04%

16

fidelity

156 597

3,33%

3,68%

2,48%

1,20%

0,20%

17

fraternity

197 787

1,51%

2,97%

1,01%

0,78%

0,04%

18

friday

1 481 714

2,43%

2,51%

1,17%

0,35%

0,10%

19

heterosexuality

6 648

1,35%

3,40%

0,87%

0,33%

0,02%

20

homosexuality

69 100

1,49%

4,70%

1,12%

0,32%

0,07%

21

horse

373 770

1,73%

3,03%

2,98%

0,41%

0,03%

22

humidity

201 190

4,05%

3,20%

1,44%

1,12%

0,06%

23

illness

1 329 311

1,99%

4,17%

1,15%

0,74%

0,07%

24

immortality

53 435

1,87%

2,34%

1,30%

0,80%

0,01%

25

immunity

132 276

2,13%

2,21%

0,90%

0,77%

0,45%

26

incompatibility

72 043

4,02%

3,92%

5,46%

1,32%

0,36%

27

infallibility

7 468

2,62%

2,96%

1,74%

1,11%

0,00%

28

inferiority

18 555

5,27%

4,34%

4,13%

1,49%

0,46%

29

infidelity

19 343

4,14%

2,80%

2,44%

1,13%

0,07%

30

instability

133 942

3,76%

3,83%

1,35%

1,36%

0,31%

31

inviolability

4 634

18,62%

8,46%

4,79%

5,33%

1,36%

32

irregularity

43 704

11,51%

5,43%

6,77%

5,46%

0,04%

33

irresponsibility

11 420

15,12%

6,49%

2,46%

3,36%

2,03%

34

june

4 466 960

2,66%

3,56%

1,49%

0,62%

0,08%

35

knee

548 412

1,12%

1,34%

0,77%

0,38%

0,07%

36

knife

325 334

1,13%

2,11%

1,04%

1,08%

0,20%

37

lung

378 212

1,30%

1,21%

0,54%

0,38%

0,04%

38

masculinity

19 436

1,81%

1,74%

0,54%

0,67%

0,04%

39

monday

1 356 145

2,46%

2,66%

1,27%

0,28%

0,33%

40

october

4 186 337

2,66%

3,44%

1,47%

0,68%

0,16%

41

parity

398 500

4,58%

5,74%

2,40%

1,00%

0,35%

42

probability

629 463

1,33%

1,56%

1,01%

0,49%

0,05%

43

productivity

678 743

2,64%

2,73%

1,19%

1,19%

0,16%

44

puberty

30 393

2,00%

2,81%

1,18%

0,75%

0,11%

45

responsibility

3 076 317

2,08%

2,57%

1,03%

0,67%

0,08%

46

sexuality

174 287

2,10%

3,66%

1,02%

0,75%

0,02%

47

singularity

34 154

4,47%

5,80%

2,03%

1,94%

0,16%

48

superiority

79 047

3,41%

3,67%

1,80%

1,08%

0,36%

49

thursday

1 177 498

2,51%

2,76%

1,11%

0,33%

0,11%

50

today

6 898 783

2,90%

2,20%

1,60%

0,90%

0,22%

51

truth

1 109 457

4,51%

2,90%

1,63%

2,05%

0,70%

52

tuesday

1 167 880

2,41%

3,35%

0,29%

1,02%

0,14%

53

uniformity

74 001

2,62%

3,80%

2,60%

0,76%

0,07%

54

universality

26 237

6,46%

10,05%

3,49%

1,89%

0,34%

55

university

10 457 021

2,06%

2,72%

1,03%

1,02%

0,06%

56

wednesday

2 231 584

2,52%

2,45%

1,03%

0,32%

0,14%

57

yellow

2 379 190

3,79%

2,00%

1,19%

0,32%

0,06%

MEDIA

3,37%

3,75%

2,00%

1,09%

0,20%

Scarto-Tipo

3,07%

1,78%

1,76%

0,99%

0,33%

Coefficiente di varianza

0,96

0,69

0,94

0,95

1,27

 

I valori molto superiori alla media sono segnalati su fondo nero.
I valori molto inferiori alla media sono segnalati su fondo grigio.

Il coefficiente di varianza è la radice quadrata dello scarto tipo diviso per la media al quadrato. Un valore superiore a 1 indica una forte dispersione, dunque una media più affidabile. Un valore inferiore a 1 indica una scarsa dispersione, dunque un risultato tanto più affidabile quanto più il valore è debole.

 

Continuare

La Cultura