Índice

 

Anexo 6

 

Criterios para la selección de las palabras

El cuadro siguiente detalla los criterios de selección de las palabras de la muestra de referencia. Se trata de criterios de filtro. Para llegar a las 57 que han quedado, se filtraron centenas de palabras.

 

Cuadro 13:
Criterios de selección lingüística de las palabras de la muestra

 

CRITERIO DEFINICIÓN EJEMPLOS MÉTODO COMENTARIOS
Neutralidad cultural Propiedad de una palabra en relación con su frecuencia de uso en la lengua en función de la cultura respectiva. Las palabras francesas vin, parfum, gastronomie y las palabras del lenguaje diplomático no son neutras culturalmente, en relación con el francés. Para obtener una muestra con el coeficiente de variación menor posible, se dejaron de lado las palabras que no son neutras culturalmente.  
Homografía translingüística La grafía de una palabra en un idioma es idéntica a la de otra palabra en otro idioma, incluido el caso de faux amis (significación diferente). Puede haber homografías con o sin diacríticos. Ejemplo de grafía idéntica (con el mismo sentido): casa en castellano y portugués.
Ejemplos de faux amis: red en castellano y red en inglés ("rojo"); hier en francés ("ayer") y hier en allemand ("aquí").
Rechazar las palabras homógrafas (con o sin diacríticos). Se han tenido en cuenta, para rechazarlas, las homografías entre los idiomas del estudio o con un idioma muy presente en Internet, como el alemán. Para evitar el riesgo estadístico de homografías con otros idiomas, se descartan por principio las palabras de menos de cuatros letras.
Homografía translingüística de una palabra compuesta, de la que se guarda un elemento simple Una palabra del estudio, al entrar en composición, es homógrafa de otra palabra compuesta en otro idioma. Mardi gras ("martes de carnaval") en inglés y francés, con respecto a tuesday en inglés y mardi en francés. Es necesario controlar los resultados de las búsquedas para detectar este tipo de intrusos. Es posible descontar las ocurrencias que provocan, al formar palabras compuestas, homografías.
Homografía translingüística por préstamo Cuando una palabra de un idioma es aceptada tal cual en otro. Anglicismos comme business, sandwich o software. El galicismo, deja vu en inglés, castellano, etc. (homógrafo de la expresión francesa sin diacríticos). Excluir sistemáticamente de la muestra  
Homografía con una abreviación   Sept, siete en francés, homógrafo de las abreviaciones de septiembre en varios idiomas, sobre todo en inglés. Evitar estas palabras. Estamos relativamente protegidos por la consigna de evitar palabras de menos de cuatros letras.
Homografía con un nombre propio frecuente   Windows significa "ventana" en inglés.... pero es asimismo el nombre de un programa muy citado en Internet. Evitar estas palabras.  
Pseudohomografía translingüística La escritura de una palabra con une error de ortografía frecuente en un idioma corresponde a otra en otro idioma. Ambasador en rumano puede confundirse con ambas(s)ador en inglés. Se rechazan estas palabras solamente si la lengua con que se confunde es el inglés.  
Significados no equivalentes   Prix en francés equivale en su significado a premio y a precio –a price y a prime en inglés. Evitar estas palabras, salvo si fuera posible incluir todos los significantes que completarían el sentido en las lenguas que lo necesiten.  
Morfosintaxis no equivalente: sustantivo, verbo El inglés, muy diferente morfosintácticamente de los demás idiomas estudiados, suele tener una misma forma como sustantivo y variante verbal, ésta última equivalente a su vez de muchas formas conjugadas en los demás idiomas. Love en inglés es el sustantivo que significa "amor" y el verbo amar: en el infinitivo (cuando sigue a to), en el presente del indicativo (amo, amas, ama, amamos, amáis, aman), etc., etc. Evitar estas palabras. Esta característica del inglés nos lleva a excluir los verbos.
Morfosintaxis no equivalente: adjetivos y sustantivos Los adjetivos, invariables en inglés, varían en género y en número en los demás idiomas estudiados. Los sustantivos, que en general sólo varían en número en los demás idiomas, varían en rumano también según el caso (nominativo, genitivo, etc.) y la diferencia determinado / no determinado. El adjetivo inglés yellow corresponde a amarillo / amarilla / amarillos / amarillas. Ele sustantivo inglés instability / instabilities a las variantes rumanas siguientes: instabilitate / instabilitatea / instabilităţii / instabilităţi / instabilităţile / instabilităţilor. (no incluimos aquí las variantes sin diacríticos). Incluir las variantes de género, número y caso en los idiomas en la necesidad de equivalencia lo exige.  
Pluricentrismo léxico y semántico Cuando un idioma tiene más de un centro normativo léxico-semántico. Según el país hispanohablante, se dice nafta o gasolina. Americano, en muchos países de América Latina, no tiene el mismo sentido que en otros o en España. Incluir las variantes sinonímicas nacionales o regionales cuando corresponda.  
Pluricentrismo ortográfico Cuando un idioma tiene más de un centro normativo ortográfico. Casos del inglés y del portugués: ortografía diferente en EE. UU. y en el Reino Unido (theater y theatre), en Portugal y en Brasil (electricidade y eletricidade). Incluir las variantes ortográficas nacionales o regionales cuando corresponda.  

 

Anexo 7

Cuadro 14.
Resultados de las mediciones en el espacio WWW

En el cuadro siguiente, los valores correspondientes a cada idioma en relación con cada una de las palabras de la muestra corresponden a la cantidad de ocurrencias de estas palabras en el espacio WWW, contadas con el motor de búsqueda HotBot siguiendo los parámetros: "exact phrase", "anytime", "anywhere".

Esto permite incluir todas las ocurrencias en el conjunto de las páginas web referenciadas por HotBot. Los valores señalados en letra cursiva corresponden a anomalías en la medición resultado del trabajo de preparación lingüística (véanse los capítulos y anexos respectivos).

 

  PALABRAS EN ES FR IT PT RO
1 ambiguity 144 766 2 072 5 466 2 169 706 317
2 causality 23 547 747 1 744 536 281 12
3 cheese 350 048 10 243 13 329 7 861 2 847 911
4 compatibility 619 141 6 248 9 140 8 584 2 272 869
5 contiguity 3 947 101 228 440 65 14
6 dangerous 422 323 15 423 20 639 8 854 3 327 82
7 december 4 202 193 119 649 152 966 60 469 41 827 5 295
8 density 573 362 9 277 16 396 5 052 3 156 314
9 disparity 62 899 1 499 3 428 1 819 526 8
10 divisibility 3 515 108 215 67 64 3
11 elasticity 43 374 1 377 1 623 1 538 579 50
12 electricity 380 218 16 721 24 586 2 500 3 280 286
13 february 4 072 110 105 941 129 898 53 753 19 515 3 523
14 femininity 15 281 430 870 570 129 19
15 fertility 113 268 2 097 2 317 903 1 254 48
16 fidelity 156 597 5 221 5 768 3 881 1 877 315
17 fraternity 197 787 2 978 5 878 1 988 1 533 75
18 friday 1 481 714 35 993 37 232 17 349 5 227 1 506
19 heterosexuality 6648 90 226 58 22 1
20 homosexuality 69 100 1 029 3 251 772 221 46
21 horse 373 770 6 454 11 311 11 120 1 527 127
22 humidity 201 190 8 158 6 447 2 896 2 257 114
23 illness 1 329 311 26 450 55 458 15 318 9 861 957
24 immortality 53 435 999 1 248 693 430 6
25 immunity 132 276 2 821 2 928 1 195 1 015 594
26 incompatibility 72 043 2 893 2 827 3 931 951 261
27 infallibility 7 468 196 221 130 83 0
28 inferiority 18 555 978 805 766 277 85
29 infidelity 19 343 801 542 472 219 14
30 instability 133 942 5 040 5 125 1 805 1 815 416
31 inviolability 4 634 863 392 222 247 63
32 irregularity 43 704 5 029 2 372 2 958 2 387 16
33 irresponsibility 11 420 1 727 741 281 384 232
34 june 4 466 960 118 879 159 146 66 627 27 606 3 786
35 knee 548 412 6 143 7 335 4 217 2 105 361
36 knife 325 334 3 672 6 878 3 386 3 500 664
37 lung 378 212 4 903 4 585 2 031 1 454 152
38 masculinity 19 436 352 338 104 131 8
39 monday 1 356 145 33 409 36 129 17 198 3 841 4 533
40 october 4 186 337 111 332 144 021 61 602 28 527 6 588
41 parity 398 500 18 244 22 870 9 553 4 004 1 408
42 probability 629 463 8 363 9 789 6 327 3 088 321
43 productivity 678 743 17 888 18 540 8 073 8 086 1 060
44 puberty 30 393 609 855 359 228 32
45 responsibility 3 076 317 64 057 79 070 31 791 20 552 2 310
46 sexuality 174 287 3 657 6 372 1 776 1 300 30
47 singularity 34 154 1 525 1 980 693 662 53
48 superiority 79 047 2 698 2 901 1 421 852 281
49 thursday 1 177 498 29 563 32 481 13 102 3 900 1 297
50 today 6 898 783 200 295 151 755 110 150 62 192 15 265
51 truth 1 109 455 50 004 32 219 18 042 22 785 7 740
52 tuesday 1 167 880 28 159 39 124 3 373 11 924 1 604
53 uniformity 74 001 1 940 2 814 1 927 565 54
54 universality 26 237 1 694 2 637 916 495 89
55 university 10 457 021 215 767 284 361 107 266 106 449 5 837
56 wednesday 2 231 584 56 276 54 576 23 020 7 217 3 221
57 yellow 2 379 190 90 170 47 471 28 431 7 605 1 358
  TOTAL 57 246 318 1 469 252 1 673 864 742 335 439 229 74 631

 

Anexo 8

Cuadro 15.
Cálculos estadísticos en el espacio WWW

  PALABRAS EN ES FR IT PT RO
1 ambiguity 144 766 1,43% 3,78% 1,50% 0,49% 0,22%
2 causality 23 547 3,17% 7,41% 2,28% 1,19% 0,05%
3 cheese 350 048 2,93% 3,81% 2,25% 0,81% 0,26%
4 compatibility 619 141 1,01% 1,48% 1,39% 0,37% 0,14%
5 contiguity 3 947 2,56% 5,78% 11,15% 1,65% 0,35%
6 dangerous 422 323 3,65% 4,89% 2,10% 0,79% 0,02%
7 december 4 202 193 2,85% 3,64% 1,44% 1,00% 0,13%
8 density 573 362 1,62% 2,86% 0,88% 0,55% 0,05%
9 disparity 62 899 2,38% 5,45% 2,89% 0,84% 0,01%
10 divisibility 3 515 3,07% 6,12% 1,91% 1,82% 0,09%
11 elasticity 43 374 3,17% 3,74% 3,55% 1,33% 0,12%
12 electricity 380 218 4,40% 6,47% 0,66% 0,86% 0,08%
13 february 4 072 110 2,60% 3,19% 1,32% 0,48% 0,09%
14 femininity 15 281 2,81% 5,69% 3,73% 0,84% 0,12%
15 fertility 113 268 1,85% 2,05% 0,80% 1,11% 0,04%
16 fidelity 156 597 3,33% 3,68% 2,48% 1,20% 0,20%
17 fraternity 197 787 1,51% 2,97% 1,01% 0,78% 0,04%
18 friday 1 481 714 2,43% 2,51% 1,17% 0,35% 0,10%
19 heterosexuality 6 648 1,35% 3,40% 0,87% 0,33% 0,02%
20 homosexuality 69 100 1,49% 4,70% 1,12% 0,32% 0,07%
21 horse 373 770 1,73% 3,03% 2,98% 0,41% 0,03%
22 humidity 201 190 4,05% 3,20% 1,44% 1,12% 0,06%
23 illness 1 329 311 1,99% 4,17% 1,15% 0,74% 0,07%
24 immortality 53 435 1,87% 2,34% 1,30% 0,80% 0,01%
25 immunity 132 276 2,13% 2,21% 0,90% 0,77% 0,45%
26 incompatibility 72 043 4,02% 3,92% 5,46% 1,32% 0,36%
27 infallibility 7 468 2,62% 2,96% 1,74% 1,11% 0,00%
28 inferiority 18 555 5,27% 4,34% 4,13% 1,49% 0,46%
29 infidelity 19 343 4,14% 2,80% 2,44% 1,13% 0,07%
30 instability 133 942 3,76% 3,83% 1,35% 1,36% 0,31%
31 inviolability 4 634 18,62% 8,46% 4,79% 5,33% 1,36%
32 irregularity 43 704 11,51% 5,43% 6,77% 5,46% 0,04%
33 irresponsibility 11 420 15,12% 6,49% 2,46% 3,36% 2,03%
34 june 4 466 960 2,66% 3,56% 1,49% 0,62% 0,08%
35 knee 548 412 1,12% 1,34% 0,77% 0,38% 0,07%
36 knife 325 334 1,13% 2,11% 1,04% 1,08% 0,20%
37 lung 378 212 1,30% 1,21% 0,54% 0,38% 0,04%
38 masculinity 19 436 1,81% 1,74% 0,54% 0,67% 0,04%
39 monday 1 356 145 2,46% 2,66% 1,27% 0,28% 0,33%
40 october 4 186 337 2,66% 3,44% 1,47% 0,68% 0,16%
41 parity 398 500 4,58% 5,74% 2,40% 1,00% 0,35%
42 probability 629 463 1,33% 1,56% 1,01% 0,49% 0,05%
43 productivity 678 743 2,64% 2,73% 1,19% 1,19% 0,16%
44 puberty 30 393 2,00% 2,81% 1,18% 0,75% 0,11%
45 responsibility 3 076 317 2,08% 2,57% 1,03% 0,67% 0,08%
46 sexuality 174 287 2,10% 3,66% 1,02% 0,75% 0,02%
47 singularity 34 154 4,47% 5,80% 2,03% 1,94% 0,16%
48 superiority 79 047 3,41% 3,67% 1,80% 1,08% 0,36%
49 thursday 1 177 498 2,51% 2,76% 1,11% 0,33% 0,11%
50 today 6 898 783 2,90% 2,20% 1,60% 0,90% 0,22%
51 truth 1 109 457 4,51% 2,90% 1,63% 2,05% 0,70%
52 tuesday 1 167 880 2,41% 3,35% 0,29% 1,02% 0,14%
53 uniformity 74 001 2,62% 3,80% 2,60% 0,76% 0,07%
54 universality 26 237 6,46% 10,05% 3,49% 1,89% 0,34%
55 university 10 457 021 2,06% 2,72% 1,03% 1,02% 0,06%
56 wednesday 2 231 584 2,52% 2,45% 1,03% 0,32% 0,14%
57 yellow 2 379 190 3,79% 2,00% 1,19% 0,32% 0,06%
  PROMEDIO 3,37% 3,75% 2,00% 1,09% 0,20%
  Desviación tipo 3,07% 1,78% 1,76% 0,99% 0,33%
  Coeficiente de variación 0,96 0,69 0,94 0,95 1,27

 

Los valores muy superiores al promedio están señalados con fondo negro.
Los valores muy inferiores al promedio están señalados con fondo gris.

El coeficiente de variación es la raíz cuadrada de la variación tipo al cuadrado dividida por el promedio al cuadrado. Un valor superior a 1 indica una dispersión importante, luego un promedio poco fiable. Un valor inferior a 1 indica una dispersión pequeña, luego un resultado tanto más fiable cuanto menor es ese valor.

 

Continuación del estudio

La cultura