Entre 2010 et 2012 Syllabs a participé au projet européen TTC (Translation, Terminology and Comparable Corpora) autour de la création de terminologies bilingues à partir de corpus comparable.

Dans le cadre de ce projet, une plateforme web permettant de compiler des terminologies monolingues et bilingues à partir des corpus récupérés sur le web a été développée et mise en ligne par Syllabs : http://ttc.syllabs.com.

Ce démonstrateur permet de tester toute la chaîne du projet : compilation de corpus, extraction de terminologie monolingue et alignement bilingue. Sept langues sont traitées : allemand, anglais, chinois, espagnol, français, letton, et russe. Les technologies ont été développées par le LINA (Université de Nantes) et Syllabs. La plateforme est accessible sur demande.

En octobre dernier, un atelier avec 20 spécialistes de la traduction, traduction automatique et la terminologie, a été organisé à Stuttgart (Allemagne) afin de présenter la plateforme et obtenir un premier retour utilisateur.

À l’occasion du colloque Tralogy, Syllabs présentera cette plateforme ainsi que les retours des premiers utilisateurs. Tralogy 2013 vise à anticiper les technologies pour la traduction. Cette année le débat tourne autour du sens : quels sont les manques et besoins respectifs pour trouver le sens ? Le colloque réunit tous les deux ans différents acteurs autour de la traduction et du traitement automatique des langues: professionnels de la traduction, industriels de la langue, chercheurs, etc. Tralogy est co-organisé par le CNRS (IMMI et INIST), la SFT, la Commission européenne (DGT, Représentation en France de la CE), l’Université Paris Diderot (UFR EILA) et l’AFFUMT.

L’intitulé de l’article est : TTC Web Platform : from Corpus Compilation to Bilingual Terminologies for MT and CAT Tools.

Voici le résumé de l’article (en anglais) :

This paper describes the TTC Web platform, an online demonstrator to show the whole pipeline to compile bilingual terminologies out of comparable corpora gathered from the web using the tools developed in the TTC project Terminology Extraction, Translation Tools and Comparable Corpora. We present the whole chain which has been integrated into the platform, as well as their main components: a focused web crawler; a UIMA based tool for both monolingual term extraction and bilingual term alignment, tools for monolingual term extraction using both rule-based and probabilistic methods, and finally, an online terminology platform to edit the output of the TTC tools. The TTC tool chain is available for all the languages of the project: DE, EN, ES, FR, LV, RU and ZH. With respect to the potential users of the tools, in the first Tralogy conference we presented the different users and scenarios that were envisaged: from basic users to professionals of the MT industry. In this paper we will include the first feedback obtained from users during the second user workshop that was organized to demonstrate and test the tools with potential users and experts of the MT, CAT, and terminology management domain.

Auteurs : Helena Blancafort, Francis Bouvier, Béatrice Daille, Ulrich Heid, Anita Ramm

 

Comments are closed.