[ca]  [es]  [fr]  [it]  [ro]
Línguas e Culturas na Web Estudo 2007

Análise da evolução dos motores de pesquisa

Sabemos, desde 2005, que os resultados obtidos no ciberespaço, indexado pelos motores de pesquisa (Google em 2005), não são representativos de todo o espaço da Rede, dado que os ditos motores cobrem apenas uma parcela mais estreita (60-80 % desse mesmo espaço). Este estudo confirma a pouca fiabilidade dos resultados obtidos em 2006 com o Google, o que demonstra claramente que este revela certas incoerências que nos obrigam a afastá-lo da nossa metodologia.

Após várias pesquisas, chegámos à conclusão que Altavista era o motor cujo funcionamento parecia o mais apropriado à nossa metodologia.

Paralelamente, o estudo deixa transparecer um novo resultado que põe em perigo a coerência na continuidade dos resultados. Até 2005, os valores relativos à presença das línguas na Rede, segundo diferentes motores de pesquisa, eram bastante semelhantes, situando-se nos intervalos de confiança estatísticos. A redução da proporção das páginas indexadas e das estratégias comerciais próprias a cada motor, conduzem à possível perda definitiva desta propriedade. Desta forma, não podemos afirmar que os nossos resultados reflectem a situação das línguas na Web, mas são sobretudo o panorama das línguas existentes no ciberespaço, indexado pelo motor de pesquisa utilizado neste estudo.

Para demonstrar a situação acima descrita, poderemos citar os resultados obtidos a partir do motor Exalead, os quais se revelaram consideravelmente mais elevados nas pesquisas em francês.

Convém aqui salientar um outro factor importante neste último estudo, ou seja, a grande invasão de anúncios publicitários na Rede, o que provoca efeitos dificilmente comensuráveis pela nossa metodologia. Em inúmeras páginas, abundam anúncios publicitários e outros anúncios intertextuais (GoogleAds), considerados como parte integrante do conteúdo. Aparecem assim termos que, não tendo qualquer relação com o conteúdo do sítio, conferem um certo valor a outros termos (podemos, por exemplo, visitar uma página sobre os cavalos na qual nunca teria aparecido anteriormente o termo “amarillo”, mas que comporta agora um anúncio GoogleAds que propõe “visitar o rancho Amarillo”). A publicidade transformou-se assim num amplificador que se torna uma vantagem para as línguas predominantes (inglês) e, numa proporção menor, para as línguas emergentes (nomeadamente o chinês, mas também o romeno que conhece um crescimento considerável). Para fazer face a esta nova situação e à sua influência nefasta para os nossos resultados (sobretudo para o espanhol), desenvolvemos uma série de técnicas destinadas a neutralizar os efeitos da publicidade.

 

 

 

ESTUDO 2007
Análise e interpretação dos resultados
Anexo
Análise da evolução dos motores de pesquisa
ESTUDO 2005
ESTUDO 2002
ESTUDO 2001

 

 

 

 

Terminometro | Línguas e Culturas na Web ― Estudo 2007 | Portalingua | Agenda | Outros endereços web

União Latina
Direção Terminologia e Indústrias da Língua - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org