[ca]  [es]  [fr]  [pt]  [ro]
Lingua e cultura nella Rete ― Studio 2007

Analisi dell’evoluzione dei motori di ricerca

Dal 2005, sappiamo che i risultati ottenuti del ciberspazio indicizzato dai motori di ricerca (Google nel 2005) non rappresentano tutto lo spazio della Rete visto che la copertura di questi motori si riduce ad una finestra più stretta (60-80% dello spazio). Questo studio conferma la mancanza di affidabilità dei risultati ottenuti nel 2006 da questo stesso motore di ricerca e stabilisce chiaramente che Google presenta alcune incoerenze che ci obbligano a scartarlo dalla nostra metodologia.

Dopo diversi studi, siamo arrivati alla conclusione che Altavista era il motore il cui funzionamento sembrava essere quello più appropriato per la nostra metodologia.

Allo stesso tempo, lo studio ha fatto trasparire un nuovo risultato che attenta alla coerenza nella continuità dei risultati. Fino al 2005, i valori relativi alla presenza delle lingue in Rete, secondo diversi motori di ricerca, erano piuttosto simili, e si situavano negli intervalli di affidabilità statistici. La riduzione della proporzione delle pagine indicizzate e le strategie commerciali proprie ad ogni motore portano alla possibile perdita definitiva di tale proprietà. Di conseguenza, non possiamo affermare che i nostri risultati riflettono la situazione della lingue nel Web, ma piuttosto il panorama delle lingue nello spazio indicizzato dal motore di ricerca utilizzato nello studio.

Per illustrare la situazione descritta sopra, possiamo citare i risultati ottenuti a partire dal motore Exalead, che si sono rivelati decisamente più elevati nelle ricerche in francese.

È necessario inoltre segnalare un altro aspetto importante nel nostro studio, rappresentato dalla non trascurabile invasione della pubblicità in Rete, che provoca degli effetti difficili da misurare nella nostra metodologia. Numerose pagine abbondano di annunci pubblicitari e altri annunci intertestuali (GoogleAds) considerati come parte integrante del contenuto. Sembra quindi che dei termini, che non hanno alcun rapporto con il contenuto del sito, apportino del valore a certi altri termini (si può per esempio visitare una pagina sui cavalli in cui mai prima d’ora appariva il termine “amarillo”, ma che ora comporta un annuncio GoogleAds che propone di “visitare il ranch Amarillo”). La pubblicità si è trasformata in un amplificatore che diventa un vantaggio per le lingue predominanti (l’inglese) e, in minor misura, per le lingue emergenti (in particolare il cinese, ma anche il rumeno che conosce una crescita considerevole). Per affrontare questa nuova situazione e l’influenza negativa che ne deriva sui nostri risultati (soprattutto per lo spagnolo), abbiamo sviluppato delle tecniche destinate a neutralizzare gli effetti della pubblicità.

 

 

 

 

STUDIO 2007
Analisi e interpretazione dei risultati
Appendice
Analisi dell’evoluzione dei motori di ricerca
STUDIO 2005
STUDIO 2002
STUDIO 2001

 

 

 

 

Terminometro | Lenguas y culturas en la red ― Estudio 2007 | Portalingua | Agenda | Otros enlaces

Unión Latina
Dirección Terminología e Industrias de la Lengua - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org