English | Español | Français | Português

           
          |    Programa - Índice
 
A Tradução na Sociedade de Informação

Palmira Marrafa - Universidade de Lisboa, Faculdade de Letras - Departamento de Linguística Geral e Românica e Grupo de Computação do Conhecimento - Léxico Gramatical (CLUL)- Instituto Camões

 

0 Introdução

Todas as línguas e todas as culturas de todas as comunidades devem ter um tratamento equitativo e não discriminatório, nos meios de comunicação em todo o mundo.
Declaração Universal dos Direitos Linguísticos, Artº 38

 

Os termos Sociedade de Informação, Tecnologias de Informação, Tecnologias de Comunicação são hoje de uso corrente para milhões de falantes, ainda que com uma denotação com contornos mal definidos para muitos.

Essa imprecisão, a despeito do que possa significar, não prejudica, contudo, a facilidade e a rapidez com que disseminamos e recebemos informação ou comunicamos, em tempo real, com o outro lado do mundo.

Nunca como agora nos cruzámos tão facilmente com outras gentes, outras culturas, outras fontes de conhecimento, numa rede em expansão exponencial. Mas também, nunca como agora, surgiram tantas dúvidas quanto ao impacto de tais cruzamentos nas nossas identidades como povos e como indivíduos, para não falar, que não caberia aqui, no minorar ou acentuar das desigualdades sociais a nível mundial. Tais dúvidas encontrarão fundamento, além do mais, no facto de os bits e os bytes que chegam até nós miraculosa e imperiosamente se transformarem em linguagem natural, mas, lamentavelmente, em situação de iniquidade para as diferentes línguas.

Esta situação faz temer imperialismos, reacende nacionalismos exacerbados e reaviva ideais de construção de "línguas" socialmente neutras. Geralmente com fortes motivações ideológicas e fraca sustentação científica e técnica, estes posicionamentos vêem a sua eficiência reduzida a quase nada.

E, no entanto, muito há a fazer para contrariar a acima referida iniquidade.

Não teria sentido pretender discutir neste âmbito a vastíssima problemática relacionada com as questões aludidas, ou sequer uma abordagem com soluções, programáticas que fossem, dos numerosos problemas que caem no escopo do título deste trabalho.

Os objectivos são, pois, simultaneamente menos e mais ambiciosos. Menos, porque se circunscreve drasticamente a temática. Mais, porque se trazem à tona caminhos concretos e sustentados.

Assim, na secção 1 Sociedade de Informação, Informação Intercultural e Tradução, discutem-se brevemente os fenómenos de interculturalidade e de multilinguismo que contextuam a tradução na sociedade de informação; na secção 2  Tecnologias de Informação Linguística e Tradução, evidencia-se a relevância das tecnologias de informação linguística para a tradução, no contexto geral da preservação e da promoção dos patrimónios linguísticos e culturais; finalmente, em 3  Tecnologias de Informação Linguística do Português na Internet, apresentam-se alguns projectos de desenvolvimento de tecnologias de informação para o Português. A concluir, 4 Considerações finais.

 

1 Sociedade de Informação, Informação Intercultural e Tradução

O chamado ciberespaço trouxe às sociedades humanas transformações aos mais diversos níveis, sendo ainda cedo para avaliar o seu alcance profundo (para uma discussão sobre a matéria, cf. Castells (1996) e Alberts, D. S. e Daniel S. Papp (1998), entre outros).

Em todo o caso, todos sabemos que as distâncias se encurtaram, as fronteiras se esbateram, as trocas de conhecimento e tecnologia passaram a transferências "de escala", passe a imagem economicista.

Nunca antes comunicámos tanto. Graças em grande medida ao intensíssimo tráfego informacional que a imensa auto-estrada que é a Internet permite.

Cabe, contudo, salientar aqui que por ela não passam todas as cerca de 6000 línguas que se falam actualmente no mundo. Nem sequer a maioria. Muito longe disso.

É hoje assunção comum que o Inglês é a língua dominante, que entrava o uso das restantes. A despeito do facto de tal assunção carecer de confronto com evidências que mostrem que a mesma tem aderência à realidade, o certo é que a língua franca da era do digital é hoje tida por muitos como uma ameaça para as outras línguas, minoritárias ou não.

O sucesso editorial de Linguistic Imperialism (Philipson (1992)) poderá ser visto como um dos muitos indícios de preocupação com essa virtual ameaça.

Um pouco por todo o mundo não anglófono o fantasma de que o Inglês se torne a língua universal tem dado origem a reacções de todo o tipo. São conhecidas as tensões na União Europeia relacionadas com a escolha das chamadas línguas pivot (actualmente, o Inglês, o Francês, o Alemão, o Espanhol e o Polaco); são conhecidas as declarações do presidente da Associação Alemã das Línguas, expressando o seu receio de que o Inglês venha a relegar o Alemão para o tempo “dos avós”; é conhecido o incidente protocolar provocado por Jacques Chirac numa reunião de trabalho da Cimeira de Chefes de Estado e de Governo do Conselho da Europa, que interpelou o presidente da União das Confederações da Indústria e dos Empregadores da Europa, Ernest-Antoine Seillière, por este fazer a sua intervenção em Inglês, acabando por abandonar a sala, juntamente com dois dos seus ministros (curiosamente o ministro da Economia e o dos Negócios Estrangeiros).

Em todos estes casos, como certamente em numerosos outros que poderiam ser aqui referidos, se deixa adivinhar uma disputa de poder. Com efeito, todos sabemos há muito que o poder já não está só, nem fundamentalmente, na “ponta das baionetas”. Uma parte significativa deslocou-se para forças de outra natureza: informação e comunicação. E, por inerência, para as línguas (refira-se a este propósito a realização em Bangkok, quase em simultâneo com este Seminário, do 1º Congresso Mundial sobre o Poder das Línguas); para as línguas, dizia, ou, mais precisamente, para a visibilidade das línguas, que é por certo função do seu peso nas tecnologias de informação e comunicação.

De acordo com um relatório do projecto multidisciplinar Iniciativa B@bel, promovido pela UNESCO, que visa a defesa da diversidade cultural, em geral, e a protecção das línguas menos usadas, em particular, está por demonstrar que o Inglês seja língua de "dominação", impedindo as outras de conservar ou de adquirir o lugar que lhes cabe, pelo menos face à Declaração Universal dos Direitos Humanos e à Declaração Universal dos Direitos Linguísticos (decorrente do espírito da primeira, e em particular do seu artigo 2º).

O que é hoje tomado como adquirido é que o fenómeno da globalização trouxe à “aldeia”, passe o lugar-comum, uma diversidade cultural e linguística que constitui um importante pilar do seu desenvolvimento, e que, em consequência, não pode deixar-se perigar, seja por venais interesses hegemónicos seja por autodeclaradas nobres intenções de democrática uniformização.

Não se pode eludir o estatuto de língua franca que o Inglês adquiriu. E é perda de tempo, a não ser como exercício académico, pretender desenvolver artificialmente uma língua natural, o que, sendo, já de si, contraditório nos termos, é um projecto sem viabilidade, como é o caso do Esperanto, já que restam poucas dúvidas hoje quanto ao facto de as línguas naturais serem instanciações da faculdade da linguagem que faz parte do património genético da espécie humana. Como é ocioso pretender recuar no tempo e ressuscitar o Latim, como pretendem os (menos universalistas) defensores do Latim Moderno. As línguas românicas são, em última instância, os modernos dialectos do Latim, a evidenciarem uma natural tendência para a diversidade. E não o contrário.

Neste contexto, a tradução tem um papel crucial. Austermühl (http://gandalf.aksis.uib.no/AcoHum/abs/Austermuehl.htm)confere-lhe o estatuto de organon da comunicação técnica internacional. Mas a sua relevância não se fica por aí. Face à crescente disponibilização de informação relativa a todos os sectores da vida social, em variadas línguas, ainda que nem todas tenham aí a mesma proeminência, a tradução medeia as interacções sociais aos mais diversos níveis.

Por outro lado, só a tradução nos permite aceder às especiosas especificidades das línguas. Posso comunicar em Inglês com um coreano, por exemplo, mas perco a informação relativa às marcas morfológicas que veiculam o estatuto que ele se atribui relativamente a mim, enquanto ele perde informação sobre a forma de tratamento diferencial que eu considerar oportuna na nossa comunicação, no caso de podermos entender-nos falando cada um a sua língua.

Parece, pois, indiscutível o papel de relevo que cabe à tradução na sociedade de informação. Mas parece também evidente que a tradução tem agora de ser perspectivada com níveis de grande exigência. As transferências de conhecimento requerem uma abordagem orientada para o conhecimento. Que terá ela própria de encontrar sustentação nas tecnologias de informação, destacando-se aqui, em particular, as tecnologias de informação linguística, a que se refere a secção seguinte.

 

2  Tecnologias de Informação Linguística e Tradução

A tradução assume na sociedade de informação um carácter multidisciplinar. Traduzir requer não só uma exímia competência nas línguas envolvidas – desejavelmente um conhecimento explícito das mesmas – como também conhecimentos especializados em áreas específicas, algumas das quais emergentes da própria sociedade de informação: tecnologias de informação, telecomunicações, cibernética, entretenimento multimédia, entre outras – são aliás estas áreas que, na década passada, como reconhece Stevens (1999), fizeram explodir o mercado da tradução, a nível global. Adicionalmente, a tradução envolve ainda um conjunto, cada vez mais prolífero, de ferramentas auxiliares: bases de conhecimento enciclopédico (desde logo a Internet), bases de conhecimento linguístico, bancos de dados terminológicos, bases de dados de memórias de tradução, sistemas de tradução automática, não pretendendo uma lista exaustiva.

Aqui chegados, cabe uma reflexão, ainda que breve, sobre este tipo de ferramentas, em particular sobre os sistemas de tradução automática, que suscitam antagonismos quanto ao seu real papel.

Muitos tradutores receiam concorrência desleal por parte dos "tradutores automáticos" –mais rápidos e de mais baixos custos –, não perdendo oportunidades de proclamação da superioridade do homem sobre a máquina. Outros associam à tradução automática uma vaga, mas persistente, ideia de fracasso, materializado, além do mais, em expressões bizarramente agramaticais, polissemias e ambiguidades estruturais mal resolvidas, modalizações não captadas, relações discursivas desajustadas.

As empresas, por seu turno, acenam com as vantagens, medidas sobretudo em rapidez, baixa de custos, possibilidade de expansão por via incremental.

E eu, que não falo Swahili, gostaria de, sem sair de casa, ficar a saber quais são os temas das principais notícias que os jornais de Nairobi vendem hoje aos quenianos. E para isso bastava-me um medianamente dotado sistema de tradução automática.

Esta problemática é obviamente complexa, merecendo uma discussão prolongada, livre de interesses e de anacronismos. Não cabendo essa discussão nos limites desta palestra, fica um breve comentário sobre algumas questões centrais.

É, evidentemente, estultícia negar qualquer utilidade às ferramentas computacionais auxiliares de tradução e, em particular, aos sistemas de tradução automática. Como é revelador de ignorância ou demagogia pretender que a tradução automática é, mutatis mutandis, comparável à tradução humana.

Equacionado com distanciamento, o problema parece colocar-se nos seguintes termos: os sistemas de tradução automática são importantes instrumentos para o tradutor profissional, mas também – e talvez sobretudo – para o cidadão comum, que é, cada vez com mais propriedade, um socrático "cidadão do mundo"; mas os sistemas actuais são efectivamente insatisfatórios. Alguns, mesmo muito insatisfatórios.

A tradução automática, um dos instrumentos com maiores potencialidades de contribuição para a convivência das línguas e das culturas em situação de equidade, é porventura o maior desafio que se coloca às tecnologias de informação linguística. No limite, implica modelizar estruturas cognitivas e conhecimento do mundo. É, assim, natural que o objectivo esteja longe de ser atingido.

Vale, contudo, a pena salientar que, se os progressos qualitativos estão muito longe de acompanhar o crescimento deste subsector, tal resulta, em grande medida, da opção por caminhos ínvios, ou, alternativamente, por vias demasiado rápidas.

Dos excessivamente ambiciosos projectos, como o projecto EUROTRA (financiado pela Comissão Europeia, em finais da década de 80, início da década de 90) ou a mais recente plataforma UNL-Universal Networking Language (financiada pelas Nações Unidas, na segunda metade da década de 90), restam apenas alguns recursos linguísticos susceptíveis de reutilização.

Os projectos comerciais, em contrapartida, têm história mais curta e resultados mais visíveis. Mas, neste caso, os progressos qualitativos, já de si difíceis de atingir por razões endógenas, vêem-se ainda fortemente condicionados por implicarem investimentos que conflituam com os lídimos propósitos de obtenção de lucro.

Apesar de logo as primeiras experiências na área do processamento automático das línguas naturais, nos longínquos anos 50, terem demonstrado que os sistemas que tratem as expressões linguísticas com uma organização meramente linear têm probabilidade nula de sucesso (cf. Marrafa (1993)), o certo é que os sistemas baseados em conhecimento linguístico são dispendiosos: requerem investigação fundamental e são dificilmente acomodáveis nas linguagens artificiais que asseguram maior eficiência, dado o seu baixo poder expressivo (a este propósito, ver Marrafa (2004)).

A tradução automática, e as tecnologias de informação linguística, de uma forma geral, padecem de uma correlação negativa significativa entre adequação linguística e eficiência. Que não se vislumbra ultrapassável no quadro estrito do mercado.

Resulta, pois, evidente que cabe às entidades governamentais um papel de relevo nesse sentido.

 

3  Tecnologias de Informação Linguística do Português: os projectos TemaNet e Lextec

Os projectos que são objecto desta secção são financiados pelo Instituto Camões, e inscrevem-se numa política de desenvolvimento de tecnologias de informação linguística multi-função de elevada fiabilibilidade e robustez.

A equipa de especialistas que os desenvolve, sob minha coordenação, reúne, em consequência, competências multidisciplinares: Linguística Teórica, Linguística Computacional, Engenharia da Linguagem e Engenharia Informática.

O TemaNet e o Lextecsão apenas dois dos projectos que o Instituto Camões tem em curso. Destacam-se aqui por se tratar, em ambos os casos, de projectos de longo prazo e de amplo alcance.

Estes projectos partilham ainda o objectivo de desenvolvimento de aplicações computacionais que integram informação lexical estruturada, no pressuposto teórico de que o Léxico não é um repositório de informação idiossincrática, evidenciando, antes, uma estruturação regulada por princípios translinguísticos, como as Ciências Cognitivas e a Linguística têm vindo a demonstrar.

Como é sabido, a representação do conhecimento lexical é hoje de importância crítica no desenvolvimento de qualquer sistema de processamento computacional das línguas naturais, o que justifica o desenvolvimento de recursos lexicais de larga escala com formatos que sirvam aplicações diversas, como é o caso aqui.

O TemaNet visa a construção de redes léxico-conceptuais (internacionalmente designadas como wordnets) organizadas por domínios semânticos [1].

Uma wordnet é uma rede léxico-conceptual que se estrutura em torno de nós que correspondem a conceitos, representados por todas as suas lexicalizações, e de um conjunto de relações entre os conceitos que permite derivar o sentido das expressões linguísticas que constam da rede.

Tal como a WordNet.PT (Marrafa (2001) e (2002); cf. nota 1), o TemaNet está a ser desenvolvido no quadro geral da EuroWordNet (Vossen (1999), uma base de dados multilingue que integra wordnets individuais (mas relacionadas entre si) de várias línguas europeias, sendo que as wordnets individuais seguem, no essencial, a arquitectura da precursora WordNet de Princeton (Fellbaum, (1998); Miller et al. (1990).

A ligação dos conceitos codificados nas wordnets do TemaNet a registos do Inter-Lingual-Index (ILI) [2] da EuroWordNet, permite aceder às lexicalizações dos mesmos conceitos nas línguas que a integram. Esta ligação potencia, como é evidente, a sua utilização em aplicações multilingues, aí incluída a tradução automática.

Como informação adicional, a cada conceito é associada uma glosa e um exemplo que evidencia restrições de co-ocorrência, tanto sintácticas como semânticas, quando é caso disso.

O LexTec assenta nos mesmos pressupostos teóricos, incluindo igualmente wordnets. Distingue-se, contudo, do TemaNet, tanto ao nível dos domínios, como ao nível da natureza da informação codificada: só integra domínios técnicos (Turismo, Banca, Comércio e Seguros, na fase actual); a cada conceito é associada uma definição o mais informativa possível; inclui uma base de textos ilustrativos da distribuição de todos os itens e com informação complementar de utilidade para o conhecimento do domínio; para todas as expressões é dada a correspondência em Inglês, estejam os respectivos conceitos representados ou não no ILI.

Num caso, como no outro, são ainda utilizadas etiquetas para codificar informação relativa a empréstimos, neologismos ou tipos de registo, para dar apenas alguns exemplos.

Há que sublinhar que o trabalho é desenvolvido manualmente, não estando, assim, a fiabilidade dos resultados ameaçada pela extracção automática de informação não controlada.

Os resultados destes projectos serão progressivamente disponibilizados na Internet e em CD-ROM (podendo, deste modo, chegar a um maior número de potenciais utilizadores), através de uma interface que permite a consulta directa e uma navegação ágil e intuitiva.

A par das várias hipóteses de exploração por esta via, estes recursos constituem uma importante base para o desenvolvimento de outras tecnologias em vários âmbitos: aplicações de apoio ao ensino/aprendizagem do Português, sistemas de busca e extracção de informação, sistemas periciais, sistemas de tradução automática, entre outros.

O investimento do Instituto Camões em projectos desta natureza terá, previsivelmente, um importante impacto no reforço da presença da língua portuguesa no mundo, viabilizando, simultaneamente, o encontro das culturas e dos veículos de conhecimento que nela e com ela se cruzam.

 

4 Considerações finais

Julgo inquestionável o direito de todos os falantes a expressarem-se na sua língua materna. É nela que vivem. Mas só reconhecer o direito é muito pouco. Há que tomar medidas para o assegurar. E essas medidas passam por promover a diversidade linguística, reforçando a identidade de cada uma e de todas as línguas, sobretudo pela via dos sistemas de conhecimento. Sem o chamado "complexo de Babel". Cabe notar que a Torre bíblica não dispunha de tradução, nem de tecnologias de informação.

 

Referências

Alberts, D. S. e Daniel S. Papp (eds.) (1998), The Information Age: an Antology on its Impact and Consequences, Washington: NDU Press.

Austermühl, F., Between Babel and Bytes - The Discipline of Translation in the Information Age, http://gandalf.aksis.uib.no/AcoHum/abs/Austermuehl.htm

Castells, M. (1996), The Information Age: Economy, Society, and Culture, Oxford: Blackwell.

Fellbaum, C. (1998), A Semantic Network of English: The Mother of All WordNets. In P. Vossen (ed.) EuroWordNet: A Multilingual Database with Lexical Semantic Networks. Dordrecht: Kluwer Academic Publishers, pp. 209-220.

Iniciativa B@bel, http://portal.unesco.org/ci/en/ev.php-URL_
ID=18255&URL_DO=DO_PRINTPAGE&URL_SECTION=201.htm
lRL_ID=18255&URL_DO=DO_PRINTPAGE&URL_SECTION=201.html

Marrafa, P. (1993), Predicação Secundária e Predicados Complexos em Português: Análise e Modelização, Dissertação de Doutoramento, Universidade de Lisboa.

Marrafa, P. (2001) WordNet do Português: uma base de dados de conhecimento linguístico. Lisboa: Instituto Camões.

Marrafa, P. (2002) Portuguese WordNet: General Architecture and Internal Semantic Relations. D.E.L.T.A, 18, pp. 131-146.

Marrafa, P. (2004), Computação de Ambiguidades Sintácticas: evidências em favor dos modelos baseados em conhecimento linguístico, IN COGNITO, nº. 1, vol. 2.

Miller, G. et al. (1990), Introduction to WordNet: An On-line lexical Database. International Journal of Lexicography, 3(4), pp. 235-244.

Philipson, R. (1992), Linguistic Imperialism, Oxford: Oxford University Press (1997, 4ª edição).

Stevens, D. (1999), The Language of Change, Proc. of The Aslib conference Translating and the Computer 21.

Vossen, P. (1999) EuroWordNet: General Document. Universidade de Amesterdão.

 

[1] Uma WordNet geral de ampla cobertura está a ser desenvolvida desde 1999 para o Português pelo grupo de investigação que dirijo no Centro de Linguística da Universidade de Lisboa, o CLG-Grupo de Computação do Conhecimento Léxico-Gramatical, no âmbito do projecto WordNet.PT, financiado em períodos sucessivos pelo Instituto Camões, pela Fundação Calouste Gulbenkian e pela Fundação para a Ciência e a Tecnologia, instituições às quais deixo aqui um agradecimento pelo impulso dado à I&D nesta área.

[2] O ILI é uma lista de registos de conjuntos de sinónimos, correspondentes a conceitos, retirados maioritariamente da versão 1.5 da WordNet de Princeton, através dos quais se relacionam as lexicalizações dos conceitos nas diferentes línguas.

 

 

 

 

 

 

 

III SEMINÁRIO INTERAMERICANO SOBRE A GESTÃO DAS LÍNGUAS:
As políticas lingüísticas das Américas em um mundo multipolar - Anais

Edição organizada pela União Latina - ISBN: 85-7749-013-0
2006

Terminometro | Línguas e Culturas na Web ― Estudo 2007 | Portalingua | Agenda | Outros endereços web

União Latina
Direção Terminologia e Indústrias da Língua - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org