Systèmes de management de la terminologie et de la traduction assistée par ordinateur

STEFAN Veronica, Maitre de conférence,
Université Valahia du Targoviste
STEFAN Dumitru, Directeur general, ATS Targoviste

 

Introduction

Bien que de long temps nous avons vu d'énormes progrès dans la manière dont nous communiquons, depuis le télégraphe Morse et jusqu’en utilisant les dernières mobile 3G avec la vidéo conférence, il y a une très importante barrière qui n'était pas encore à surmonter: la langue. Cette application permet de dissoudre cet obstacle en offrant un service automatisé bidirectionnel anglais-roumain. Son but est de traduire automatiquement non seulement les mots, mais l'ensemble des documents.

En combinant l'innovation technologique et le perfectionnisme linguistique, ATS a développé des outils d’aide à la rédaction et à la traduction qui sont des systèmes des outils de traduction anglais/ roumain indispensable pour tous les types d'entreprises, pour des usages professionnels sur Internet et Intranet. Nos principaux domaines d’intervention s’agir de traductions informatique, commerciale, juridique, financière, technique, industrie et médicale.

La solution sera disponible en tant que logiciel packagé et en tant que service en-ligne (sur abonnement). Offert en version Windows, le logiciel s'intègre harmonieusement aux logiciels de Microsoft dont Word et Excel, mais les dictionnaires et logiciels de langue sont aussi disponibles pour Palm, Pocket PC et Web.

La réalisation de ce système est d’une très nouvelle et stratégique importance dans la société digitale, en permettant l’accès vers e-government, e-business, e-work, e-learning, des entreprises et des communautés virtuelles.

 

1. Besoin du « traducteur » aujourd’hui. Traduction automatique

Aujourd’hui, la notion du «traducteur» ne défini pas seulement « un traducteur experte », mais aussi « un utilisateur ordinaire » qui doit accéder et employer les informations multilingue d’une société globale.

Indépendamment des méthodes de travail, les besoins des traducteurs en général sont identiques:

terminologie pertinente (dictionnaires, glossaires, bases de données terminologiques);

documents de référence (archives électroniques, textes alignés, etc.);

recyclage de traductions antérieures (copier-coller à partir d'autres applications, archives électroniques, mémoires de traduction, etc.); 

assistance (prétraitement et finalisation des textes, outils de gestion de contenu).

La traduction automatique désigne au sens strict le fait de traduire entièrement un texte grâce à un ou plusieurs programmes informatiques, sans qu'un traducteur humain n'ait à intervenir. La traduction automatique est encore très imparfaite, et la génération de traductions d'une qualité comparable à celle de traducteurs humains relève encore de l'utopie.

On englobe parfois également sous ce terme la traduction assistée par ordinateur où la traduction peut se faire en partie manuellement ou de façon interactive avec la machine.

La traduction (entièrement) automatique, malgré ses faiblesses, peut rendre des services dans des domaines précis, comme par exemple celui de la veille technologique, où elle permet de prendre connaissance très rapidement et de façon superficielle de grandes quantités de textes. Depuis quelques années, elle connaît également un essor considérable sur le Web, puisque divers systèmes en ligne permettent de traduire automatiquement pages Web et textes brefs : à l'heure actuelle, cette technologie est appréciée du grand public car elle permet de déchiffrer de façon grossière le thème d'une page Web dans une langue totalement inconnue, et les principaux faits ou éléments d'information qu'elle contient. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! . La traduction automatique nécessite :

des règles grammaticales, pour l’analyse du texte en langue source qui facilite la génération du texte en langue cible ;

des règles stylistiques,

des dictionnaires et des mémoires de traduction (des corpus alignés déjà traduits par des êtres humains).

Les systèmes de  traduction automatique permettent de prendre connaissance très rapidement de grandes quantités de textes. La traduction automatique est encore très imparfaite, mais elle peut aider et faciliter la traduction manuelle de façon interactive avec la machine.

 

2. Le contenu du projet

Car les technologies de l'information jouent un rôle de plus en plus important dans le travail quotidien d’un traducteur, ATS a développé un système intègre de management de la terminologie et de la traduction assistée par ordinateur qui offre des solutions efficace a ces besoins. Par son projet, ATS fournit de solutions de traduction par ordinateur: systèmes et services de traduction automatique, dictionnaires et glossaires, mémoires de traduction, outils de forage de données, pour les traducteurs: le rédacteur professionnel, le scientifique, l'étudiant, l'internaute ou l'entrepreneur.

Le scope du projet est de faciliter l’accès aux ressources linguistiques, de réduire le travail (en essence, le travail répétitif) des traducteurs et d’établir la base de cohérence linguistique et méthodologique dans le domaine de la traduction. 

Au moment, le projet offre des outils de traduction pour les langues roumain et anglais indispensables pour tous les types des traducteurs, pour des usages professionnels sur Internet et Intranet. Le system est modulaire et il peut-être développé pour toutes les langues, utilisant la technologie de mémoire de traduction et de la recherche terminologique. Nos principaux domaines d’intervention s’agir de traductions informatique, commerciale, juridique, financière, technique, industrie et médicale.

 

3. L’architecture de l’application

L’architecture du system est à 3 niveaux, respectivement une architecture client-serveur dans laquelle l'interface utilisateur, le traitement des données et le stockage sont considérés comme trois éléments distincts. L'intérêt de la chose est évidemment la modularité, ainsi que le support de plates-formes multiples. L’architecture est partagée entre :

1. Un client, c'est-à-dire l'ordinateur demandeur de ressources, équipée d'une interface utilisateur (qui peut-être un navigateur web) chargée de la présentation ;

2. Le serveur d'application, chargé de fournir la ressource mais faisant appel à un autre serveur

3. Le serveur de données, fournissant au serveur d'application les données dont il a besoin.


Figure 1
L’architecture du projet

 

L'architecture à trois niveaux permet :

Une plus grande flexibilité/souplesse ;

Une sécurité accrue car la sécurité peut être définie indépendamment pour chaque service, et à chaque niveau ;

De meilleures performances, étant donné le partage des tâches entre les différents serveurs ;

La solution est disponible en tant que logiciel packagé et en tant que service en-ligne (sur abonnement).

Offert en version Windows, le logiciel s'intègre harmonieusement aux logiciels de Microsoft dont Word et Excel, mais les dictionnaires et logiciels de langue sont aussi disponibles pour Palm, Pocket PC et Web.

 

4. Les outils components du logiciel

En combinant l'innovation technologique et le perfectionnisme linguistique, le logiciel compris des outils d’aide à la rédaction et à la traduction  suivants:

 

4.1. Dictionnaires et glossaires

Cet outil linguistique intègre sur la même page, dans le tableau de travaille, des dictionnaires et glossaires des langues roumaine et anglais, un dictionnaire des synonymes et un dictionnaire complexe roumaine < > anglais. Le dictionnaire bilingue est multidirectionnel incluant des fonctions grammaticales avancées telles que la conjugaison (dans tous les temps), les accords en genre et en nombre, etc.

Les dictionnaires sont généraux, mais aussi thématiques: alimentation, aéronautique, musique, construction, électronique, informatique, etc. incluant de termes anglais et roumain du vocabulaire industriel, scientifique et commercial, dans 50 domaines d’activité. Les dictionnaires et les glossaires sont en grande partie créés par des traducteurs qui travaillent dans un secteur spécialisé.

 

4.2. Mémoire traduction

Tout texte déjà traduit ne devrait plus faire l'objet d'une nouvelle traduction. La mémoire de traduction du logiciel est une base de données contenant des segments de texte en roumain et en anglais ainsi que l'équivalent de ces segments dans l’autre langue. Elle permet de pouvoir stocker des segments de phrase et de les réutiliser, formant en ce cas des outils de traduction assistée par ordinateur.

 

4.3. Systèmes et services de traduction automatique

Les systèmes de  traduction automatique permettent de prendre connaissance très rapidement de grandes quantités de textes. La traduction automatique est encore très imparfaite, mais elle peut aider et faciliter la traduction manuelle de façon interactive avec la machine.

 

4.4. Correction

Pour une correction linguistique, nous contrôlons soigneusement votre texte pour ce qui est de l'orthographe, de la grammaire, de la ponctuation, de la logique, de l’interprétation, des omissions, des renvois et de la consistance de la terminologie.

Pour une correction typographique, le travail consiste à contrôler le formatage et la mise en page, la composition au carré ou en drapeau, la concordance des couleurs, la taille des caractères, la police, etc. La correction typographique est une condition requise pour le « bon à tirer ».

 

4.5. L'interface Web

Est utilisé par les clients pour la transmission électronique de leurs demandes de traduction.

 
Figure 2
Les clients du projet

L'interface Web crée un dossier électronique contenant la demande, l'original à traduire et les documents de référence éventuels. Ce dossier est ensuite envoyé en bloc à l’ATS.

 

5. Les ressources linguistiques du projet

Les ressources linguistiques du projet contiennent :

terminologie sous différentes formes (bibliothèques, accès généralisé à Internet etc.; les recherches terminologiques sont principalement effectuées par Internet;

des fragments de texte et des textes entiers provenant des archives internes de la ATS ou de toute autre source gérer par Internet;

des mémoires de traduction (des corpus alignés déjà traduits par des êtres humains) qui permettent un véritable partage des données;

la traduction automatique utilisée comme outil d'aide, mais aussi à la traduction (des règles grammaticales pour l’analyse du texte en langue source qui facilite la génération du texte en langue cible et des règles stylistiques).

Les difficultés du logiciel sont diverses :

les ambiguïtés lexicales, par exemple polysémie;  La polysémie est la propriété qu'ont certains signes de la langue d'offrir plusieurs sens : « violon » désigne un instrument de musique, celui qui en joue, une prison. Aux unités polysémiques s'opposent les unités monosémiques (la plupart des termes scientifiques). Par exemple, beaucoup de termes scientifiques sont des mots de la langue courante empruntés pour un usage particulier.

les ambiguïtés grammaticales: un même mot peut relever de deux catégories grammaticales différentes.

les ambiguïtés sémantiques: selon le contexte, la traduction peut être différente. De même, les jeux de mots sont très difficiles à traduire (la poésie, ...).

les erreurs d'écriture qui empêchent les logiciels de faire leur travail. Et il ne faut pas seulement penser aux fautes d'orthographe: les fautes de langue, même courantes, compliquent singulièrement la tâche.

sensibilité au contexte ; les logiciels seraient capables de trouver des solutions différentes selon le contexte, soit qu'on le leur indique, soit qu'ils le trouvent automatiquement.

 

6. Le cycle de la traduction

Quand il commence à travailler, le traducteur lance un programme, qui segmente le texte source. Lorsque, dans la base de données, se trouve un segment source identique ou proche (le seuil de proximité étant déterminé par des options), le programme propose la traduction. Le traducteur a alors la possibilité d'accepter celle-ci, de l'adapter, ou encore de la refuser (et traduire lui-même). Le system compare le document qui doit été traduit avec les documents contenus dans les bases de données et détermine si le document ou des fragments du document on été traduit déjà.

Si le document n’a été pas déjà traduit, le system registre le document et généra un tableau de travaille qui contient :

un éditeur de textes alignés avec le nouveau document et les documents de référence qui peut aider le traducteur ;

un outil automatise de recherche, de sélection et de remplacement de termes et de phrase ;l’accès a une bibliothèque électronique qui comprise des dictionnaires, glossaires et bases de données terminologiques ;

une interface qui permette de gérer les traductions.

un logiciel pour la transmission et la gestion électronique des demandes de traduction. 

 


Figure 3
L’interface de l’application

Lorsque l'utilisateur introduit le numéro d'identification correspondant à la demande de traduction qu'il doit effectuer, cette interface lui donne accès à l'original ainsi qu'à tous les fichiers nécessaires pendant la traduction et, en particulier, aux documents de référence, documents prétraités, comparaisons de documents, traductions en cours, documents déjà archivés. Elle permet aussi de créer un «squelette de traduction» et inclut une fonction d'alerte et de note destinée à faciliter la communication entre les divers traducteurs travaillant sur un même projet.

TransArch est un système d'archivage électronique qui contient tous les documents entrés (essentiellement des originaux) et sortis (essentiellement des traductions) ; L'interface propose divers critères de recherche (numéro du document, auteur, demandeur, titre ou contenu même du texte) et permet ainsi de retrouver n'importe quel document presque instantanément. Chaque document a sa propre notice, sorte de carte d'identité contenant toutes les informations pertinentes, dont les divers champs peuvent être affichés et servir de critères de recherche.

Les avantages de ces logiciels sont nombreux et évidents:

transmission plus rapide ;

intégration dans le système d'archivage ;

disponibilité de l'original et des documents de référence sous forme électronique ;

possibilité de traiter les documents avec les outils informatiques ;

amélioration du cycle électronique de la traduction, etc.

 

Conclusions

Advanced Technology Systems fournit une gamme complète de solutions de traduction par ordinateur: systèmes et services de traduction automatique, dictionnaires et glossaires, mémoires de traduction et outils de forage de données pour le rédacteur professionnel, le scientifique, l'étudiant, l'internaute ou l'entrepreneur.

Cette application offre un service automatisé bidirectionnel anglais-roumain. Son but est de traduire automatiquement non seulement les mots, mais l'ensemble des documents.

Il fournira également un double sens anglais-roumain dictionnaire et thésaurus avec des définitions détaillées pour chaque langue en se développement sur une architecture ouverte, de sorte que les utilisateurs peuvent développer leurs propres applications qui s'interfacent avec le service. Le traducteur peut être utilisé pour traduire automatiquement les documents de n'importe quelle longueur.

Le texte peut être saisi manuellement ou importé des différents formats de fichier (texte, RTF, HTML ou Microsoft Word).

Le centre de la demande est le service web qui fait la traduction. La saisie de texte peut provenir de différents domaines, comme la documentation technique, des lettres, des news, etc. Le domaine (champ d'application) de ce document est déterminé automatiquement, mais peut aussi être spécifié manuellement à partir d'une liste de domaines prédéfinis.

Un dictionnaire peut facilement être utilisé pour rechercher des mots ou des expressions.

Les résultats de recherche sont filtrés automatiquement que l'utilisateur entre le mot ou l'expression désirée. Il contient des définitions détaillées sur les mots, y compris les multiples significations, des mots et des expressions contenant le mot.

L'utilisateur a également la possibilité d'ajouter un mot dans le dictionnaire ou de modifier celles déjà présentes dans la base de données. Le client Microsoft Windows peut fonctionner en arrière-plan de l'application et de traduire automatiquement le nouveau texte ou le texte sélectionné qui est dans le clipboard, en utilisant une combinaison clavier / souris. Ainsi, l'utilisateur a un plus rapide et transparent accès à l'information.

 

Bibliographie

Théorie de la traduction et théorie de la terminologie, in L'Histoire et les théories de la traduction - Les actes, ASTTI - ETI, Berne - Genève, 1997, Bruno DE BESSÉ.

Grammar sharing techniques for rule-based multilingual NLP systems, M. Santaholma, in: Proceedings of NODALIDA 2007, the 16th Nordic Conference of Computational Linguistics, May 25-26 2007, Tartu, Estonia.

A model for context-based evaluation of language processing systems and its application to machine translation evaluation, Popescu-Belis A., Estrella P., King M. & Underwood N., in LREC 2006 (Fourth International Conference on Language Resources and Evaluation), Genoa, Italy, p.691-696.

A flexible Speech to Speech Phrasebook Translator, M. Rayner and P. Bouillon, in: "Proceedings of ACL-02 Workshop on Speech-to-Speech Translation: Algorithms and Systems'', Philadelphia, 2002, pp. 69-76.

Word sense disambiguation as a WordNets’ validation method in Balkanet, Dan Tufis, Radu Ion, Nancy Ide:: LREC-2004: Fourth International Conference on Language Resources and Evaluation, Proceedings, Lisbon, Portugal, 26-28 May 2004; pp.1071-1074. [PDF, 422KB]

http://www.sdl.com/fr/globalization-knowledge-
centre/whitepapers/Global_Communication_to_the_21st_Century.asp

http://www.eurolingua.de/cms/website.php?id=/fr/
index/service-de-traduction/management-de-projet.htm

http://www.tc-star.org/
http://www.ats.com.ro

 

Sponsor de aur / Partenaire Or


Sponsor de argint / Partenaire Argent

Ambassade de France
en Roumanie

Association Européenne
de Terminologie

Sponsor de bronz / Partenaire Bronze

Comitetul Electrotehnic
Român

Asociaţia Română
de Terminologie

 

 

Program / Programme
Comunicări / Communications

 

 

 

 

Seminar Internaţional „Instrumente pentru asistarea traducerii” - Acte / Séminaire international « Les outils d'aide à la traduction » - Actes
Editat de / Edité par : Uniunea latina/Union Latine
ISBN: 978-9-291220-37-3
2008

Terminometro | Limbile şi culturile pe Internet ― Studiu 2007 | Portalingua | Agenda | Pagini Internet

Uniunea Latină
Direcţia Terminologie şi Inginerie Lingvistică - DTIL
131, rue du Bac - F-75007 Paris
T: (33) 1 45 49 60 62   /   F: (33) 1 45 49 67 39
dtil@unilat.org