Corpus de traductions en lexicographie : nouvelles ressources
David Lindemann

Résumé

La linguistique de corpus a constitué une véritable révolution dans le monde de la lexicographie, en effet, les larges corpus de texte offrent de multiples ressources telles que les données de fréquence, les exemples d’utilisation et les traductions. La fréquence d’utilisation d’un terme et la fréquence de visites de dictionnaire du terme en question sont en étroite relation ; en outre, ces données peuvent être intégrées dans l’entrée même de dictionnaire. Il est, par conséquent, très intéressant de prendre les listes de fréquence comme point de départ pour définir une liste d’entrées de dictionnaire.

Dans la lexicographie bilingue on peut utiliser des données extraites de corpus parallèles. Ces dernières années plusieurs corpus parallèles comprenant l’euskara ont été créés, comme par exemple le corpus littéraire allemand-euskara. Nous pouvons extraire de ces corpus parallèles des exemples d’utilisation et leurs traductions respectives, qui peuvent être très utiles dans un travail lexicographique, tout en apportant une information précieuse à l’utilisateur. Actuellement, cette dernière possibilité est en train de se répandre grâce à certains sites de dictionnaire.