Observatoire du Lexique: une fenêtre ouverte sur lexique de l'euskara utilisé dans les média du XXIe siècle
Résumé
Parmi les tâches d''Euskaltzaindia, Académie de la Langue Basque, figurent la recherche sur la langue et la promulgation des normes régulant son usage. Par ailleurs, aujourd''hui l''on ne met plus en doute le fait que les corpus sont indispensables pour contrôler l''utilisation réelle d''une langue.
L''Observatoire du Lexique est un projet créé par Euskaltzaindia en 2007, en réponse à une proposition faite par son groupe de travail sur le dictionnaire unifié (Hiztegi Batua). Le résultat de ce projet est le corpus du même nom, qui peut être consulté sur Internet.
Ce travail est encore en vigueur, et pendant ces dix dernières années l''on a constitué un corpus textuel de près de 60 millions de mots. Le corpus est traité automatiquement et annoté linguistiquement, de plus, il offre à l''usager les fonctionnalités habituelles de ce genre d''outil.
Dans cet article sont exposés les raisons pour lesquelles ce projet a été conçu, les objectifs à atteindre et les principales caractéristiques du corpus. Nous sommes également informés sur la procédure suivie pour l''élaboration dudit corpus : l''acquisition des textes et leur classement, les détails de leur intégration dans le corpus et le traitement linguistique auquel ils ont été soumis. Pour finir, l''on explique l''utilisation qu''Euskaltazindia fait de ce corpus et dans quel but, puis l''on mentionne les plans prévus pour l''avenir.