| Cuprins
ANEXA 6
Criterii ale selecţiei
cuvintelor
Tabelul de mai jos
ilustrează criteriile reţinute în vederea selectării termenilor eşantionului. Este
vorba de criterii de filtrare pentru acceptarea cuvântului. Pentru a ajunge la cei 57 de
termeni ai eşantionului au fost îndepărtaţi câteva sute.
Tabelul 13:
Criterii de selecţie lingvistică a cuvintelor eşantionului
| CRITERIU |
DEFINIŢIE |
EXEMPLE |
METODĂ |
COMENTARII |
| Neutralitate
culturală |
Proprietate
a unui cuvânt în legătură cu frecvenţa apariţiei sale în limbaj, în funcţie de
cultură. |
Vin,
parfum, gastronomie şi cuvintele limbajului diplomatic nu sunt neutre cultural
în limba franceză. |
Pentru a
obţine un eşantion cu un coeficient de variaţie cât mai mic au fost eliminate
cuvintele care nu sunt neutre cultural. |
|
| Omografie
translingvistică |
Ortografia
unui cuvânt dintr-o limbă este identică cu cea a unui cuvânt dintr-o altă limbă.
Aceasta priveşte tot atât de bine şi grafiile identice pentru un sens comun cât şi
"falşii prieteni" . Se pot distinge omografiile cu sau fără diacritice. |
Exemplu de
grafie identică: casa în spaniolă şi portugheză înseamnă "casă".
Exemplu de "falşi prieteni": red în spaniolă ("reţea"),
red în engleză ("roşu"); hier în franceză şi hier în
germană ("aici"). |
Se elimină
din eşantion cuvintele care prezintă aceste caracteristici (cu sau fără diacritice). |
Sunt luate
în calcul numai omografiile între limbile studiului şi/sau ale limbilor foarte bine
reprezentate pe Internet (cum ar fi germana). Pentru a evita riscul statistic de omografie
cu limbile străine studiate, sunt eliminate cuvintele cu mai puţin de patru litere. |
| Omografie
translingvistică având unul dintre elemente un cuvânt compus |
|
Mardi
gras în engleză. |
Trebuie
supravegheate rezultatele cercetării pentru a detecta acest gen de intruşi. |
Este posibil
să scadă scorul formelor străine. |
| Omografie
translingvistică prin împrumut |
Când un
cuvânt dintr-o limbă este acceptat ca atare într-o altă limbă. |
Anglicisme
cum ar fi business, sandwich sau software. În mod reciproc, deja
vu în engleză (omograf din franceză fără diacritice). |
Eliminarea
eşantionului cuvintelor împrumutate. |
|
| Omografie
cu o abreviere |
|
Cifra sept
"şapte" în franceză cu abrevierea lui septembre "septembrie"
în franceză şi mai ales September în engleză. |
A se evita
aceste cuvinte. |
Suntem
relativ protejaţi prin dispoziţia noastră de a fi evitate cuvintele cu mai puţin de
patru litere. |
| Omografie
cu un substantiv propriu frecvent |
|
Windows
înseamnă "fereastă" în engleză.... dar şi numele unui program
foarte citat în spaţiul Internet. |
A se elimina
cuvintele din această categorie |
|
| Pseudo
omografie translingvistică |
Scrierea
unui cuvânt cu o eroare comună de ortografie face ca acesta să corespundă unui cuvânt
dintr-o altă limbă. |
Ambasador
în română şi ambas(s)ador în engleză. |
Cuvântul
este eliminat numai dacă limba ţintă este limba engleză. |
|
| Semnificaţii
neechivalente |
|
Prix
"premiu" în franceză înseamnă şi premio şi precio (spaniolă),
price şi prime (engleză). |
A se evita
aceste cuvinte, sau dacă este posibil, să se urmărească compararea lor incluzând
toate semnificaţiile care ar completa o semnificaţie echivalentă în limbile unde este
necesar. |
|
| Morfosintaxă
neechivalentă: substantiv, verb |
Limba
engleză, foarte diferită din punct de vedere sintactic faţă de alte limbi studiate,
are adesea aceeaşi formă ca substantiv şi variantă verbală, aceasta din urmă fiind,
de altfel, echivalentă cu mai multe forme ale conjugării verbelor în alte limbi. |
Love
în engleză este în acelaşi timp substantiv "dragoste" şi verb "a
iubi": la infinitiv (precedat de "to"), la prezent
indicativ (iubesc, iubeşti, iubim, iubiţi,) etc. etc. |
A se evita
aceste cuvinte. |
Această
caracteristică a limbii engleze ne obligă să eliminăm a priori verbele |
| Morfosintaxă
neechivalentă: adjective şi substantive |
Adjectivele,
invariabile în limba engleză, variază în gen şi număr în celelalte limbi studiate.
Substantivele, care nu variază în general decât ca număr în celelalte limbi, variază,
de asemenea, şi după caz (nominativ, genitiv etc) şi diferenţă determinat /
nedeterminat în limba română. |
Adjectivul
englezesc yellow "galben" corespunde lui amarillo / amarilla
/ amarillos / amarillas în limba spaniolă. Substantivul englezesc instability
/ instabilities corespunde următoarelor variante: instabilitate / instabilitatea
/ instabilităţii / instabilităţi / instabilităţile / instabilităţilor
(nu includem aici şi variantele fără diacritice). |
A se urmări
multiplicarea variantelor în gen, număr şi caz, în celelalte limbi, când necesitatea
de echivalenţă o cere. |
|
| Pluricentrism
lexic şi semantic |
Când o limbă
are mai mult de un centru normativ lexico-semantic. |
După ţara
hispanofonă, se spune nafta sau chiar gasolina ("benzină" ).
Americano, în anumite ţări hispanofone din America Latină, nu are acelaşi sens
ca în celelalte sau ca în Spania ("aparţinând continentului" sau "aparţinând
Statelor Unite"). |
A se urmări,
dacă este posibil, pentru echivalenţe, să se multiplice variantele sinonimice
naţionale sau regionale. |
|
| Pluricentrism
ortografic |
Când o limbă
are mai mult de un centru normativ ortografic. |
Este cazul
limbii engleze şi mai ales al limbii portugheze. Anumite cuvinte se ortografiază diferit
în Statele Unite şi în Marea Britanie , (theater şi theatre), în
Portugalia şi în Brazilia (electricidade şi eletricidade). |
A se
urmări, dacă este posibil, pentru echivalenţe, să se multiplice variantele ortografice
naţionale. |
|
ANEXA
7
Tabelul 14:
Rezultatele măsurătorilor în spaţiul WWW
Pentru fiecare limbă
apar, în tabelul de mai jos, valorile care corespund fiecărui termen care corespunde
numărului ocurenţelor lor în spaţiul WWW, număraţi graţie serviciului HotBot pe
baza următorilor parametri: "exact phrase", "anytime",
"anywhere".
Astfel, sunt luate în
calcul toate citările care apar în ansamblul paginilor Web la care se referă serviciul
de căutare. Valorile marcate prin caractere cursive corespund anomaliilor în măsura
rezultatelor muncii de pregătire lingvistică (a se vedea capitolul precedent).
| |
CUVINTE |
EN |
ES |
FR |
IT |
PT |
RO |
1 |
Ambiguity |
144 766 |
2 072 |
5 466 |
2 169 |
706 |
317 |
2 |
causality |
23 547 |
747 |
1 744 |
536 |
281 |
12 |
3 |
cheese |
350 048 |
10 243 |
13 329 |
7 861 |
2 847 |
911 |
4 |
compatibility |
619 141 |
6 248 |
9 140 |
8 584 |
2 272 |
869 |
5 |
contiguity |
3 947 |
101 |
228 |
440 |
65 |
14 |
6 |
dangerous |
422 323 |
15 423 |
20 639 |
8 854 |
3 327 |
82 |
7 |
december |
4 202 193 |
119 649 |
152 966 |
60 469 |
41 827 |
5 295 |
8 |
density |
573 362 |
9 277 |
16 396 |
5 052 |
3 156 |
314 |
9 |
disparity |
62 899 |
1 499 |
3 428 |
1 819 |
526 |
8 |
10 |
divisibility |
3 515 |
108 |
215 |
67 |
64 |
3 |
11 |
elasticity |
43 374 |
1 377 |
1 623 |
1 538 |
579 |
50 |
12 |
electricity |
380 218 |
16 721 |
24 586 |
2 500 |
3 280 |
286 |
13 |
february |
4 072 110 |
105 941 |
129 898 |
53 753 |
19 515 |
3 523 |
14 |
femininity |
15 281 |
430 |
870 |
570 |
129 |
19 |
15 |
fertility |
113 268 |
2 097 |
2 317 |
903 |
1 254 |
48 |
16 |
fidelity |
156 597 |
5 221 |
5 768 |
3 881 |
1 877 |
315 |
17 |
fraternity |
197 787 |
2 978 |
5 878 |
1 988 |
1 533 |
75 |
18 |
friday |
1 481 714 |
35 993 |
37 232 |
17 349 |
5 227 |
1 506 |
19 |
heterosexuality |
6648 |
90 |
226 |
58 |
22 |
1 |
20 |
homosexuality |
69 100 |
1 029 |
3 251 |
772 |
221 |
46 |
21 |
horse |
373 770 |
6 454 |
11 311 |
11 120 |
1 527 |
127 |
22 |
humidity |
201 190 |
8 158 |
6 447 |
2 896 |
2 257 |
114 |
23 |
illness |
1 329 311 |
26 450 |
55 458 |
15 318 |
9 861 |
957 |
24 |
immortality |
53 435 |
999 |
1 248 |
693 |
430 |
6 |
25 |
immunity |
132 276 |
2 821 |
2 928 |
1 195 |
1 015 |
594 |
26 |
incompatibility |
72 043 |
2 893 |
2 827 |
3 931 |
951 |
261 |
27 |
infallibility |
7 468 |
196 |
221 |
130 |
83 |
0 |
28 |
inferiority |
18 555 |
978 |
805 |
766 |
277 |
85 |
29 |
infidelity |
19 343 |
801 |
542 |
472 |
219 |
14 |
30 |
instability |
133 942 |
5 040 |
5 125 |
1 805 |
1 815 |
416 |
31 |
inviolability |
4 634 |
863 |
392 |
222 |
247 |
63 |
32 |
irregularity |
43 704 |
5 029 |
2 372 |
2 958 |
2 387 |
16 |
33 |
irresponsibility |
11 420 |
1 727 |
741 |
281 |
384 |
232 |
34 |
june |
4 466 960 |
118 879 |
159 146 |
66 627 |
27 606 |
3 786 |
35 |
knee |
548 412 |
6 143 |
7 335 |
4 217 |
2 105 |
361 |
36 |
knife |
325 334 |
3 672 |
6 878 |
3 386 |
3 500 |
664 |
37 |
lung |
378 212 |
4 903 |
4 585 |
2 031 |
1 454 |
152 |
38 |
masculinity |
19 436 |
352 |
338 |
104 |
131 |
8 |
39 |
monday |
1 356 145 |
33 409 |
36 129 |
17 198 |
3 841 |
4 533 |
40 |
october |
4 186 337 |
111 332 |
144 021 |
61 602 |
28 527 |
6 588 |
41 |
parity |
398 500 |
18 244 |
22 870 |
9 553 |
4 004 |
1 408 |
42 |
probability |
629 463 |
8 363 |
9 789 |
6 327 |
3 088 |
321 |
43 |
productivity |
678 743 |
17 888 |
18 540 |
8 073 |
8 086 |
1 060 |
44 |
puberty |
30 393 |
609 |
855 |
359 |
228 |
32 |
45 |
responsibility |
3 076 317 |
64 057 |
79 070 |
31 791 |
20 552 |
2 310 |
46 |
sexuality |
174 287 |
3 657 |
6 372 |
1 776 |
1 300 |
30 |
47 |
singularity |
34 154 |
1 525 |
1 980 |
693 |
662 |
53 |
48 |
superiority |
79 047 |
2 698 |
2 901 |
1 421 |
852 |
281 |
49 |
thursday |
1 177 498 |
29 563 |
32 481 |
13 102 |
3 900 |
1 297 |
50 |
today |
6 898 783 |
200 295 |
151 755 |
110 150 |
62 192 |
15 265 |
51 |
truth |
1 109 455 |
50 004 |
32 219 |
18 042 |
22 785 |
7 740 |
52 |
tuesday |
1 167 880 |
28 159 |
39 124 |
3 373 |
11 924 |
1 604 |
53 |
uniformity |
74 001 |
1 940 |
2 814 |
1 927 |
565 |
54 |
54 |
universality |
26 237 |
1 694 |
2 637 |
916 |
495 |
89 |
55 |
university |
10 457 021 |
215 767 |
284 361 |
107 266 |
106 449 |
5 837 |
56 |
wednesday |
2 231 584 |
56 276 |
54 576 |
23 020 |
7 217 |
3 221 |
57 |
yellow |
2 379 190 |
90 170 |
47 471 |
28 431 |
7 605 |
1 358 |
| |
TOTAL |
57 246 318 |
1 469 252 |
1 673 864 |
742 335 |
439 229 |
74 631 |
ANEXA
8
Tabelul
15:
Calcule statistice în spaţiul WWW
| |
CUVINTE |
EN |
ES |
FR |
IT |
PT |
RO |
| 1 |
ambiguity |
144 766 |
1,43% |
3,78% |
1,50% |
0,49% |
0,22% |
| 2 |
causality |
23 547 |
3,17% |
7,41% |
2,28% |
1,19% |
0,05% |
| 3 |
cheese |
350 048 |
2,93% |
3,81% |
2,25% |
0,81% |
0,26% |
| 4 |
compatibility |
619 141 |
1,01% |
1,48% |
1,39% |
0,37% |
0,14% |
| 5 |
contiguity |
3 947 |
2,56% |
5,78% |
11,15% |
1,65% |
0,35% |
| 6 |
dangerous |
422 323 |
3,65% |
4,89% |
2,10% |
0,79% |
0,02% |
| 7 |
december |
4 202 193 |
2,85% |
3,64% |
1,44% |
1,00% |
0,13% |
| 8 |
density |
573 362 |
1,62% |
2,86% |
0,88% |
0,55% |
0,05% |
| 9 |
disparity |
62 899 |
2,38% |
5,45% |
2,89% |
0,84% |
0,01% |
| 10 |
divisibility |
3 515 |
3,07% |
6,12% |
1,91% |
1,82% |
0,09% |
| 11 |
elasticity |
43 374 |
3,17% |
3,74% |
3,55% |
1,33% |
0,12% |
| 12 |
electricity |
380 218 |
4,40% |
6,47% |
0,66% |
0,86% |
0,08% |
| 13 |
february |
4 072 110 |
2,60% |
3,19% |
1,32% |
0,48% |
0,09% |
| 14 |
femininity |
15 281 |
2,81% |
5,69% |
3,73% |
0,84% |
0,12% |
| 15 |
fertility |
113 268 |
1,85% |
2,05% |
0,80% |
1,11% |
0,04% |
| 16 |
fidelity |
156 597 |
3,33% |
3,68% |
2,48% |
1,20% |
0,20% |
| 17 |
fraternity |
197 787 |
1,51% |
2,97% |
1,01% |
0,78% |
0,04% |
| 18 |
friday |
1 481 714 |
2,43% |
2,51% |
1,17% |
0,35% |
0,10% |
| 19 |
heterosexuality |
6 648 |
1,35% |
3,40% |
0,87% |
0,33% |
0,02% |
| 20 |
homosexuality |
69 100 |
1,49% |
4,70% |
1,12% |
0,32% |
0,07% |
| 21 |
horse |
373 770 |
1,73% |
3,03% |
2,98% |
0,41% |
0,03% |
| 22 |
humidity |
201 190 |
4,05% |
3,20% |
1,44% |
1,12% |
0,06% |
| 23 |
illness |
1 329 311 |
1,99% |
4,17% |
1,15% |
0,74% |
0,07% |
| 24 |
immortality |
53 435 |
1,87% |
2,34% |
1,30% |
0,80% |
0,01% |
| 25 |
immunity |
132 276 |
2,13% |
2,21% |
0,90% |
0,77% |
0,45% |
| 26 |
incompatibility |
72 043 |
4,02% |
3,92% |
5,46% |
1,32% |
0,36% |
| 27 |
infallibility |
7 468 |
2,62% |
2,96% |
1,74% |
1,11% |
0,00% |
| 28 |
inferiority |
18 555 |
5,27% |
4,34% |
4,13% |
1,49% |
0,46% |
| 29 |
infidelity |
19 343 |
4,14% |
2,80% |
2,44% |
1,13% |
0,07% |
| 30 |
instability |
133 942 |
3,76% |
3,83% |
1,35% |
1,36% |
0,31% |
| 31 |
inviolability |
4 634 |
18,62% |
8,46% |
4,79% |
5,33% |
1,36% |
| 32 |
irregularity |
43 704 |
11,51% |
5,43% |
6,77% |
5,46% |
0,04% |
| 33 |
irresponsibility |
11 420 |
15,12% |
6,49% |
2,46% |
3,36% |
2,03% |
| 34 |
june |
4 466 960 |
2,66% |
3,56% |
1,49% |
0,62% |
0,08% |
| 35 |
knee |
548 412 |
1,12% |
1,34% |
0,77% |
0,38% |
0,07% |
| 36 |
knife |
325 334 |
1,13% |
2,11% |
1,04% |
1,08% |
0,20% |
| 37 |
lung |
378 212 |
1,30% |
1,21% |
0,54% |
0,38% |
0,04% |
| 38 |
masculinity |
19 436 |
1,81% |
1,74% |
0,54% |
0,67% |
0,04% |
| 39 |
monday |
1 356 145 |
2,46% |
2,66% |
1,27% |
0,28% |
0,33% |
| 40 |
october |
4 186 337 |
2,66% |
3,44% |
1,47% |
0,68% |
0,16% |
| 41 |
parity |
398 500 |
4,58% |
5,74% |
2,40% |
1,00% |
0,35% |
| 42 |
probability |
629 463 |
1,33% |
1,56% |
1,01% |
0,49% |
0,05% |
| 43 |
productivity |
678 743 |
2,64% |
2,73% |
1,19% |
1,19% |
0,16% |
| 44 |
puberty |
30 393 |
2,00% |
2,81% |
1,18% |
0,75% |
0,11% |
| 45 |
responsibility
|
3 076 317 |
2,08% |
2,57% |
1,03% |
0,67% |
0,08% |
| 46 |
sexuality |
174 287 |
2,10% |
3,66% |
1,02% |
0,75% |
0,02% |
| 47 |
singularity |
34 154 |
4,47% |
5,80% |
2,03% |
1,94% |
0,16% |
| 48 |
superiority |
79 047 |
3,41% |
3,67% |
1,80% |
1,08% |
0,36% |
| 49 |
thursday |
1 177 498 |
2,51% |
2,76% |
1,11% |
0,33% |
0,11% |
| 50 |
today |
6 898 783 |
2,90% |
2,20% |
1,60% |
0,90% |
0,22% |
| 51 |
truth |
1 109 457 |
4,51% |
2,90% |
1,63% |
2,05% |
0,70% |
| 52 |
tuesday |
1 167 880 |
2,41% |
3,35% |
0,29% |
1,02% |
0,14% |
| 53 |
uniformity |
74 001 |
2,62% |
3,80% |
2,60% |
0,76% |
0,07% |
| 54 |
universality |
26 237 |
6,46% |
10,05% |
3,49% |
1,89% |
0,34% |
| 55 |
university |
10 457 021 |
2,06% |
2,72% |
1,03% |
1,02% |
0,06% |
| 56 |
wednesday |
2 231 584 |
2,52% |
2,45% |
1,03% |
0,32% |
0,14% |
| 57 |
yellow |
2 379 190 |
3,79% |
2,00% |
1,19% |
0,32% |
0,06% |
| |
Medie |
3,37% |
3,75% |
2,00% |
1,09% |
0,20% |
| |
Abatere-tip |
3,07% |
1,78% |
1,76% |
0,99% |
0,33% |
| |
Coeficient de variaţie |
0,96 |
0,69 |
0,94 |
0,95 |
1,27 |
Valorile mult
superioare mediei sunt semnalate pe fond negru.
Valorile mult inferioare mediei sunt semnalate pe fond gri.
Coeficientul de variaţie este
rădăcina pătrată a abaterii standard la puterea a II-a împărţit la media la
pătrat. O valoare superioară lui 1 indică o dispersie foarte mare, deci o medie puţin
fiabilă. O valoare inferioară lui 1 indică o dispersie slabă şi deci un rezultat cu
atât mai fiabil cu cât valoarea este mai mică.
Continuare
Cultura
|