Observatorio del Léxico: una ventana abierta al léxico del euskera de los medios de comunicación del siglo XXI - (Sección especial: Hacer propio lo ajeno)
Xabier Artola y Nerea Ezeiza (Grupo IXA, UPV/EHU), Antton Gurrutxaga (Elhuyar Fundazioa), Andoni Sagarna (Euskaltzaindia), Miriam Urkia (UZEI)

Resumen

La Academia de la Lengua Vasca, Euskaltzaindia, cuenta entre sus quehaceres investigar sobre la lengua y dictar normas sobre su uso. Por otra parte, es indudable que hoy en día los corpus son imprescindibles para monitorizar el uso real de una lengua.

El Observatorio del Léxico es un proyecto iniciado por Euskaltzaindia en 2007, en respuesta a una propuesta hecha por el grupo de trabajo de su diccionario unificado (Hiztegi Batua). El resultado del proyecto es el corpus del mismo nombre, que puede consultarse en su página web.

El proyecto continúa en vigor, y durante estos diez años se ha constituido ya un corpus textual de casi 60 millones de palabras. El corpus está procesado automáticamente y anotado lingüísticamente, y ofrece al usuario las funcionalidades de consulta habituales.

En el artículo se mencionan las razones que motivaron el proyecto, y se exponen sus objetivos y las características principales del corpus. Asimismo se detalla el procedimiento que se sigue en su formación: la adquisición de textos y su catalogación, los pormenores de su integración en el corpus, y el tratamiento lingüístico que se realiza sobre ellos. Finalmente se explica el uso que Euskaltzaindia hace del corpus y con qué objetivo, y se detallan los planes con vistas al futuro.