Eta itzulpen-memorien ondoren, zer?
Imanol Urbieta

Ordenagailuz Lagundutako Itzulpen-tresnak oro har, eta Itzulpen Memoriak bereziki, ezinbestekoak dira gaur egun itzulpengintzan diharduen edozein profesionalentzat, baliabideen ekonomiaren aldetik ez ezik, baita azken emaitzaren koherentzia eta kalitatea bermatzeko ere. Halere, kudeatu beharreko itzulpenen bolumena handitu ahala, gero eta agerikoagoak dira Itzulpen Memorien mugak. Artikulu honek muga horiek zehazten ditu, eta xeheki aztertzen du zein puntutaraino lagun dezaketen Itzulitako Dokumentuen Corpus Eleaniztunek itzultzaile profesionalak aurki ditzakeen arazoei aurre egiten. Adibide gisa, eLENA aurkezten du, UZEIk sortutako corpus eleaniztuna.

Sarrera

Hizkuntza naturala gizakion arteko komunikaziorako dugun baliabide nagusia eta eraginkorrena dela gauza jakina da, eta hori bezain begi-bistakoa da hizkuntza idatzia behar bezala kudeatzeak gero eta garrantzi handiagoa duela ezagutzaren gizartea deitzen dugun honetan, ezagutza hein handi batean idatziz transmititzen baitugu.

Baina hizkuntza asko dira mundu globalizatu honetan, ia 7.0001, eta aspaldi jabetu ginen zenbat eta hizkuntza gehiago ezagutu, orduan eta informazio gehiago kudea genezakeela.

Badakigu hizkuntzen arteko informazio-trukea hobetzeak onura ekonomikoak dakartzala, eta nazioarteko merkataritza-harremanetan dihardutenen hizkuntza-gaitasuna garatzea funtsezko erronka ekonomikoa dela etorkizunerako2.

Horrexegatik, herri-administrazioek gero eta argiago dute hizkuntza-aniztasuna, elkarren arteko ulermena oztopatzen duen faktorea izan ordez, abantaila nabarmena dela, gure ezagutza aberasteko ezinbesteko bidea denez.

Aberastasun-iturri hori eraginkortasunez ustiatzeko, gaur egungo prozesadore informatikoen ahalmen handiak, beste hainbat arlotan bezala, berebiziko aldaketa ekarri du: informazioa eta, ondorioz, hizkuntza prozesa dezakete eta, beraz, lagungarri dira komunikazioa hobetzeko. Bide horretan bada gaur egun faktore berri bat: Hizkuntza Ingeniaritza.

Gaur egungo behar linguistikoentzat erantzun berriak diseinatzea eta informazioaren erabilera komunikaziorako optimizatzea ditu helburu Hizkuntza Ingeniaritzak.

Hizkuntza Ingeniaritzak oinarrizko hizkuntza-baliabideak behar ditu, besteak beste, Hizkuntza Naturalaren Prozesamenduak lantzen dituenak: analizatzaileak (morfologikoak, sintaktikoak, semantikoak eta pragmatikoak), gramatikak, hiztegi elektronikoak, eta, beste maila batean, banku terminologikoak (egitura konplexuagoak dira thesaurusak eta sare semantikoak) eta corpusak.

Ezinbestean du Hizkuntza Naturalaren Prozesamenduak garrantzi handia hiztun-erkidego baten hizkuntza-politikan, eta gero eta pisu ekonomiko handiagoa du3, batetik, baliabideak eraginkortasunez kudeatzea bideratzen duelako, eta, bestetik, teknologia berri horien industriak azken urteetan izan duen gorakadagatik.

Hala ere, itzulpengintza da Hizkuntza Industriaren jarduera nagusia, beraz, horri lotutako hizkuntzaren kudeaketak (eta ingeniaritzak) du pisu gehien industria horretan.

Gurean, esaterako, hizkuntzaren esparru ekonomikoko enpresa eta erakundeek sortu berri duten LANGUNE elkartearen datuen arabera, EAEn Hizkuntzen Industriak 68.032.070 euro inguru fakturatzen ditu urtero, eta 1.969 lanpostu biltzen ditu. Kopuru horren % 57 itzulpengintzari dagokio.

Testuinguru horretan, ulergarria da itzulpenak errentagarriagoak bihurtzeko aukera eman dezakeen itzultzaile automatiko fidagarri bat lortzeko egin diren eta egiten ari diren ahaleginak egitea, gero eta lehiakorragoa den merkatuan itzulpengintzaren arloan diharduten enpresei horrelako tresna batek ekarriko lizkiekeen abantailak direla-eta.

Jakina, ingelesa da itzulpenen sorburu-hizkuntza edo xede-hizkuntza ohikoena, eta horregatik, merkatuan eskura ditugun itzultzaile automatiko nagusiek ingeleserako dituzten bertsioak dira fidagarrienak. Gurean, ordea, espainieratik euskarara egiten dira itzulpen gehienak, eta hizkuntza-pare horretarako ez dago oraindik gutxieneko berme batekin profesionalki ustiatzeko aukera ematen duen itzultzaile automatikorik4.

Bestalde, zenbat eta antzekoagoak izan itzulpenaren sorburu-hizkuntza eta xede-hizkuntza, eta zenbat eta gehiago mugatu eta kontrolatu itzuli beharreko testuaren lexikoa, orduan eta emaitza hobeak ematen dituzte tresna horiek. Horretan ere, euskarak ez du bere inguruko hizkuntzek adinako abantailarik.

Euskararen kasuan, Eusko Jaurlaritzak sustatu eta erosi du erregeletan oinarrituta dagoen gaztelania-euskara itzultzaile automatiko bat5. Oinarri horrek eredu estatistikoetan soilik oinarritutako itzultzaileek dutena baino fidagarritasun handiagoa ematen dio tresna horri, nahiz eta ustiatze-emaitzak oraindik ez diren ezagutzera eman.

Edonola ere, euskararentzako itzultzaile automatikoak ez du oraindik frogatu beste hizkuntzetarako garatu diren itzultzaile onenen eraginkortasuna.

Beste hizkuntza-pareekin lan egiten duten itzultzaileek egiten duten bezala, gaztelaniatik euskarara itzultzeko, are arrazoi gehiagorekin, ordenagailuz lagundutako beste tresna eta baliabide batzuk erabiltzen jarraitu beharrean gara. Eta horien artean, zalantzarik ez, itzulpen-memoriak (IM) dira nagusi.

IMek dagoeneko ondo sendotutako teknologia erabiltzen dute, aspaldi frogatu da eraginkorrak direla, eta itzulpengintza profesionalean ezinbestekoak dira gaur egun.

Ordenagailuz Lagundutako Itzulpenak (OLI) eta Itzulpen Memoriak (IM)

Itzulpen guztiek badute ezaugarri komun bat: hizkuntza-pare baten artean egiten direla, alegia, beti dagoela sorburu-hizkuntza bat eta xede-hizkuntza bat. Itzulpenak ez dira egiten bi hizkuntza edo gehiagotik abiatuz, eta gehienez ere, behar denean, beste hizkuntzaren bat erreferentzia gisa erabiliko dugu, jatorrizko testua hobeto ulertzeko, itzulpen-molde berriak aurkitzeko, etab.

Horrela, esaterako, SAP aplikazio informatiko bat ingelesetik euskarara itzultzean, ezin dugu ahantzi jatorrizko bertsioa alemanez dela, eta batzuetan jatorrizko bertsio hura kontsultatu beharko dugula ingelesezkoa ulertzeko.

IMak ideia erraz batean oinarritzen dira: itzulpenak egin eta gero, gorde egiten ditugu lehen itzuli duguna berriro ez itzultzeko eta itzulitakoa berrerabiltzeko. Eta noski, gordetakoa berreskuratu ahal izateko ongi identifikatuta gorde beharra dago. Horregatik, itzulpen bat egiterakoan itzulpen-unitateak etiketatu egiten dira: nork itzuli duen, noiz, norentzat, etab.

Itzulpen guztiek duten ezaugarri komun horretatik abiatuz, eta egindako lana berrerabiltzeko helburuarekin, merkatuan era askotako Ordenagailuz Lagundutako Itzulpen-tresnak daude eskuragarri. Produktu komertzial horien artean, ezagunenak Déjà Vu, SDLX, Transit, TRADOS, Translation Manager, MultiTrans, Catalyst eta Wordfast dira.

Abantailak eta mugak

Abantailak nabarmenak dira, itzultzeko prozesua bera errazten dutenez aplikazio horiek.

Besteak beste, testua eta testuaren formatua bereizten dituzte. Horrela, itzultzeaz bakarrik arduratu behar du itzultzaileak, aplikazio informatikoa arduratzen baita xede-hizkuntzako testuari sorburu-hizkuntzako testuaren formatu bera emateaz.

Gainera, itzulpena bukatutakoan, aurrerago erabili ahal izateko, testua segmentutan zatituta gordeko da, segmentu bakoitza bere itzulpenarekin parekatuta. Itzulpen guztiak automatikoki memoria-fitxategi batean biltzen dituzte aplikazio horiek, eta itzulpen berriak egiterakoan, antzeko segmentuak identifikatzen dituzte, eta itzulpen-proposamenak egiten.

Beraz, zenbat eta informazio gehiago gorde IM batean, orduan eta aukera handiagoa izango dugu IM hori lagungarria gerta dakigun hurrengo itzulpena egiteko.

Zorionez, teknologia berriekin eta, bereziki, gaur egun informatikan erabiltzen diren prozesadoreek duten ahalmenarekin, edozein itzultzailek ordenagailu batean biltegira ditzake egindako itzulpen guztiak, behar dituenean berriro erabiltzeko.

Baina arazoak laster sortzen dira. Izan ere, IM baten tamaina erabakigarria baita haren erabilgarritasunerako.

Itzulpenen bolumena benetan handia denean eta, oro har, itzultzaile batek baino gehiagok IM berarekin lan egiten dutenean, tresna horiek konpondu ezin dituzten arazoak sortzen dira maiz.

IM batek ezin du nahi adinako tamaina izan; zenbat eta handiagoa izan, orduan eta arazo gehiago eman ditzake aplikazioak, lan egiteko abiadura motelduz, esaterako.

Bestalde, IM baten tamaina gehiegizkoa ez den artean, bezero edo gai bakoitzarentzat memoria bana sortzea izaten da ohikoena, baina horrek ere baditu bere arriskuak. Izan ere, ez da beti erraza izaten testu/itzulpen bat zein memoriarekin landu behar den asmatzea, esleipen-irizpideen arteko muga ezin delako itzultzaileak nahiko lukeena bezain gardena izan.

Eta jakina, esleipena zenbat eta egokiagoa izan, orduan eta erabilera eraginkorragoa izango du IMak, horrek itzulpenaren kostua murriztea eta gure lanaren kalitatea hobetzea ekar baitezake.

Horregatik, gordetako itzulpen-memoriak konparatzen dituzte eta teknika estatistikoak erabiltzen dituzte aplikazio horiek, itzuli behar den dokumentua zein itzulpen-memoriari esleitu behar litzaiokeen erabakitzen laguntzeko. Teknika horiek emaitza fidagarria emateko, haatik, memoriek handiak izan behar dute.

Lehen esan dugunez, memoria handiek arazo teknikoak ematen dituzte, softwarearen abiadura moteltzen dutelako, besteak beste. Eta memoria bat zenbat eta txikiagoa izan, orduan eta aukera gutxiago izango dugu bertan behar dugun segmentua aurkitzeko.

Orduan, zein da IM batek izan behar duen tamaina, itzulpen-lanean lagungarria gerta dakigun, eta aldi berean erabilerraza izan dadin?

Itzulpen-memorien kudeaketa: erronka berriak

Ez dirudi erraza galdera horrentzat erantzun egokia aurkitzea. Baina itzultzaile profesionalak bere lanean egunero egin behar dio aurre dilema horri.

Itzulpen-memorien softwareak merkaturatzen hasi zirenean, UZEIn ohartu ginen itzulpen-memoriek dituzten arazoak, tamainatik eratorritakoak bereziki, gainditzeko beharraz. Ordurako eLENA itzulpenen datu-basea sortua genuen, eta itzulpen-memorien aplikazioekin bateragarria eginez, OLI tresna berri horiek dituzten hutsuneak betetzeko baliabide ahaltsua sortu genuen.

Informatikaren garapenarekin batera, gero eta garrantzi handiagoa hartzen joan da corpusgintza hizkuntzalaritzan, eta hiztegigintzan, esaterako, berebiziko garrantzia dute corpusek.

Itzulpen-memoria bat ez dago corpus batetik hain urrun: corpusa hizkuntzaren atal baten erakusgarri gisa erabiltzen den testu-multzo elektroniko egituratua da, erabilera errealak jasotzen dituena, betiere irizpide zehatz batzuen arabera6.

Eta, IM bat ere testu-multzo elektroniko egituratua denez, zergatik ez erabili corpusgintzarekin ikasi duguna, OLI tresnek dituzten mugak gainditzeko? Hori egiteak abantaila ugari emango lizkiguke.

Dudarik gabe, itzulpen-memoriak aurrerapen handia dira, baina azken batean, itzulpen-unitateen bilduma bat besterik ez dira. Unitate horiek, normalean esaldiak, ezin ditu itzultzaileak bere testuinguruan berreskuratu, eta beraz, paragrafoaren ikuspegia galtzen du, eta are gehiago, dokumentu osoarena.

Eta jakina, itzultzerakoan garrantzi handia du aplikazioak proposatzen duen itzulpenaren testuingurua ezagutzeak. Esate baterako, zuzenbideko dokumentuetan termino batek ordain desberdinak izan ditzake testuinguruaren arabera (zigor arlokoa, zibilekoa...).

Itzulpen-memoriekin corpus bat eratzeak, eta corpus hori kontsultagai jartzeak, eskuragarri jartzen die nahi adina erabiltzaileri itzulpen-memoriak erabiliz metatutako informazioa, nahiz eta erabiltzaile horiek ez izan OLI aplikazioa erabiltzeko lizentziarik. Informazioa era erraz batean parteka daiteke, esate baterako, eta unean-unean itzultzaile bakoitzak ez du aritu behar aplikazio batekin sortutako IM bakoitza beste aplikazio batekin kontsultatzeko bihurketak egiten.

Gainera, itzulpen-memoriekin ez bezala, nahi adina erabiltzailek balia dezakete sarean edo intranetean kontsultagai jarritako corpusa, abiadura- edo konexio-arazorik gabe.

Kasurik onenean ere, itzultzaileak fisikoki sakabanatuta daudenean itzulpen-memoriak aldi berean partekatzeko arazoak sor daitezke, esate baterako, ez delako beti erraza IM baten azken bertsioarekin lanean ari garela ziurtatzea.

Bestalde, itzultzerakoan ia ezinezkoa da akatsik ez egitea, eta beraz, informazio okerra ez sartzea itzulpen-memorietan. Informazio hori zuzentzeak garrantzi handia du, aplikazioak okerreko itzulpenak proposa ez diezazkion etengabe itzultzaileari eta, ondorioz, behin egindako akatsa behin eta berriro ez errepikatzeko. Eta komenigarria izaten da bermatzea ez bakarrik itzulpenaren trazabilitatea, baita zuzenketarena ere.

Horregatik guztiagatik, zabor edo "zarata" hori hainbat itzulpen-memoriatan editatzeak eta zuzentzeak zailtasun eta kostu nabarmenak izan ditzake.

Beraz, itzulpen-memorien mantenua arazotsua izan daiteke, eta itzultzerakoan aplikazio hauekin aurrezten dugun denboraren zati bat galdu behar izaten da, behin egindako akatsak behin eta berriro errepikatzerik nahi ez badugu.

Era berean, itzulpen-memoriak elebidunak izaten dira beti, eta norabide bakarrekoak. Adibidez, ezin dira gorde IM berean gaztelaniatik euskarara egindako itzulpenak eta euskaratik gaztelaniarakoak.

Inoiz itzulpen-memoria bat txukuntzen aritu denak ongi daki nolako lanak ematen dituen, esate baterako, memoria horren koherentzia terminologikoa egiaztatzeak eta egin beharreko zuzenketak detektatzeak. Are zailagoa gertatzen da, ordea, hizkuntza-pare bat baino gehiago erabiltzen baditugu. Adibidez, 4 hizkuntzen arteko konbinazio posibleak 24 dira.

Labur esateko, itzulpen-memoria baliabide ahaltsua da itzulpenak egiten laguntzeko, baina metatutako informazioa ustiatzeko aukera eskasak eskaintzen ditu.

Itzulpenen dokumentu eleaniztunen corpusak: eLENA

Itzulpen-memoriak kudeatzeak eragiten dituen arazoak konpontzeko baliabide ahaltsua da corpusgintzarako garatutako teknologia.

UZEIk urte asko daramatza corpusak sortzen eta kudeatzen. 1987an ekin genion, Euskaltzaindiaren enkarguz, EEBS corpusa sortzeari, gerora XX. mendeko euskararen corpus estatistikoa izatera pasatu dena. Hura izan zen euskaraz modu "modernoan" osatutako lehenengo corpusa, eta gaur egun corpus horretako 104.000 lema desberdinak etengabe eguneratzen dira Euskaltzaindiaren arau berriekin.

Corpusgintzaren teknologia hori garatzeak eta kudeatzeak ulertarazi zigun itzulpen-memorien teknologia ezagutu aurretik, itzulitako dokumentuak behar bezala identifikatuta eta datu-base batean gordetzeak zituen abantailak. Eta horrela garatu genuen itzulitako dokumentuen corpus eleaniztunak kudeatzeko teknologia.

Urteak igaro ahala, itzulpen-memoriak erabiltzen hasi ginenean, itzulpen-corpusak kudeatzeko softwarea, eLENA izenekoa, bateragarri egin genuen aplikazio haiekin.

Helburua ez da, ordea, itzulpen-memoriak erabiltzeari uztea, baizik eta memoria horiek kudeatzeko zailtasunak gainditzea; horregatik, itzultzaileak testua IM batekin lantzen du.

Itzulpen-memorietan jasotako informazioa berreskuratzeko modu gehiago eta zehatzagoak eskaintzen dizkio erabiltzaileari itzulpenen corpus batek.

1. Hizkuntza eta memoria guztiak batera, konexio-mugarik gabe:

Urtez urte egin diren itzulpen guztiak datu-base dokumental batean biltegiratzen dira, eta intranetean itzultzaile-taldearen eskura jartzen dira, betiere konfidentzialtasuna babesteko segurtasun-neurri egokiak hartuz.

Horrela, nahi adina erabiltzailek erabil dezakete corpusa, abiadura- edo konexio-arazorik gabe, eta itzultzaile bakoitzak unean-unean egokien irizten dion OLI tresna hauta dezake lanean aritzeko, formatu-bihurketarik egiten ibili gabe, itzulpenen datu-baseak (IDBak) ez baitu bateragarritasun-arazorik.

Itzulpen guztiak aplikazio berean integratuta egoteak baditu beste abantaila batzuk ere: erabiltzaileak ez du hautatu behar zein memoria arakatu nahi duen, denak baitaude integratuta, eta, beraz, bilaketa orokorrak egin ditzake, adibidez, ia edozein memoriatan egon daitekeen esamolde bat nola itzuli den jakiteko.

Bestalde, bilaketa-leiho bakar batekin lan egiten du erabiltzaileak, eta ez du besterik behar unean uneko bilaketaren sorburu-hizkuntza eta xede-hizkuntza hautatzeko, hizkuntza guztietatik eta guztietara egindako itzulpenak batera baitaude.

Itzulpenen corpusa kontsultagai jarri aurretik, itzulpenetako datu pertsonalak babes daitezke automatikoki, bezeroaren pribatutasuna babesteko.

Gaur egun, UZEIren itzulpen-corpusak euskara, gaztelania, frantsesa, ingelesa eta, maila apalagoan, alemana eta katalana biltzen ditu. Tamainari dagokionez, berriz, 48.286 dokumentu sailkatutatik eskuratutako 2.104.364 itzulpen-pare biltzen ditu. Begi-bistakoa da ezinezkoa izango litzatekeela informazio kopuru hori itzulpen-memorien bidez kudeatzea.

2. Metadatuak:

Erabiltzaileak itzulpenaren bezeroaren arabera egin ditzake bilaketak, IM klasiko bat balitz bezala, baita dataren arabera ere. Gainera, gaiaren edo sailaren araberako bilaketak egiteko aukera ematen du sistemak. Horrela bilaketak egin daitezke, adibidez, ekonomiari edo zuzenbideari buruzko itzulpen guztietan, nahiz eta jatorriz IM bat baino gehiagotan banatuta egon itzulpen horiek.

3. Dokumentu osoa klik batean:

Bilaketa bat egitean aplikazioak segmentu-pareak ateratzen ditu, lerrokatuta. Interesatzen zaion segmentua (sorburu- nahiz xede-hizkuntzakoa) bere testuinguruan ikus dezake erabiltzaileak, klik bat eginez jatorrizko dokumentu osoa segmentuaren gainean zabaltzen baita beste leiho batean (ikus irudiak hurrengo orrialdean).

4. Bilaketa aurreratuak:

a. Hitzen arteko erlazioak eta tarteak:

Bilatzen diren hitzen arteko tartea hauta daiteke. Itzulpen-memoriak kudeatzeko gainerako tresnekin, erabiltzaileak bila ditzake hitz oso bat, hitz zati bat edo elkarren jarraian dauden bi hitz, baina ezingo ditu bilatu elkarrengandik banatuta dauden bi hitz.

Horrela, zuzenbideko itzulpen-memorian gaztelaniazko dictar resolución nola dagoen itzulita jakin nahi duenak, dicta% eta resoluci% eskatzen badu, IDBak aurkituko luke "Por resolución judicial de fecha 06-05-2008, dictada por el Juzgado de lo Mercantil" bezalako segmentu bat. Eta hori ez da gaur egun posible ohiko OLI tresnekin.

Gainera, bi hitzen arteko tarte hori nahi duen hitz kopurura muga dezake erabiltzaileak, bilatzen dituen hitzen artean gehienez zenbat hitz egon daitezkeen adieraziz.

urbieta1.jpg
Sorburu-hizkuntzako testua osorik

 

urbieta2.jpg
Xede-hizkuntzako testua osorik

 

b. Bi hizkuntzetan bilaketak batera:

Sistemak aukera ematen du hizkuntza-pare bakoitzean hitz bana batera bilatzeko. Horrela kontsulta daitezke, adibidez, gaztelaniazko tribunal eta euskarazko auzitegi itzulpena duten testuak, eta jakina, gaztelaniazko tribunal terminoa eta euskarazko epaitegi itzulpena dutenak.

c. Hizkuntza guztiak batera bistaratzea:

Itzulpen-memorietan ez bezala, sorburu-hizkuntzako testuarentzat xede-hizkuntza bat baino gehiagotan egin diren itzulpenak aldi berean kontsulta daitezke. Hizkuntza bakoitzean jatorrizko testuari eman zaion itzulpena elkarren ondoan lerrokatuta kontsultatzeko aukera ematen du itzulpen-corpus honek.

urbieta3.jpg
Sorburu-hizkuntzako testua eta xede-hizkuntza guztietako testuak batera

 

5. Zuzenketak: trazabilitatea eta kontsulta

Itzulpen-corpus honekin memorien zuzenketak dituen zailtasun nagusiak gainditzen dira, eta zuzenketak hobeto kudeatzen dira:

  • Zuzenketa masiboak modu errazean egin daitezke. Informazioa corpusean editatzen da (datu-basean bertan), eta ez kudeatzen diren IM bakoitzean.
  • Itzulpen-corpusean zuzenketak egin ahala, jatorrizko itzulpena (arrazoiren batengatik zuzendu dena) gordetzen da, baita haren ondoren egin diren gainerakoak ere, eta kontsultagileak aukera du klik bakar batekin horiek denak kontsultatzeko.

6. Beharren araberako IM berriak

Bilaketak egiteko erabil daitezkeen irizpide berak erabiliz, unean uneko beharretara egokituko diren IM berriak sor daitezke, itzulpen-corpusetik informazioa esportatuz.

Etorkizunari begira

Gaur egun, UZEIk garatutako itzulpen-corpus honek ez ezik, eLENA aplikazioa erabiltzen dute IDABAk (IVAPek landu eta eskuratutako itzulpen-pare guztiak biltzen dituen corpusak), EHUko Itzulpenen Kontsultak (EHUko Euskara Zerbitzuak unibertsitatean itzulitako zientzia-liburuak parekatuta biltzen dituenak) eta Gipuzkoako Foru Aldundiaren itzulpenen datu-baseak.

Ez da harritzekoa, beraz, itzulpen kopuru handia kudeatu behar duten erakundeak itzulpen-corpus aurreratuak erabiltzen hasi izana, gorago esan dugunez, OLI tresnek, gaur egun itzulpengintza profesionalerako ezinbestekoak izan arren, baliabide mugatuak baitituzte haiek kudeatzeko.

Itzulpenen kudeaketa eraginkorrak aldaketa nabarmenak ekar ditzake gero eta lehiakorragoa den itzulpengintzaren merkatura, eta itzulpen automatikoak aurrerapauso sendorik ematen ez duen artean, hortik etorriko dira, gure ustez, itzulpenen kalitateari eta errentagarritasunari eragin diezaieketen aurrerapenik garrantzitsuenak.

Eta, edonola ere, eLENA bezalako aplikazio bat ez da bakarrik OLI tresnen osagarri soila, beste testu-corpus batek hizkuntzalaritzan izan ditzakeen erabilerak ere izan baititzake, bereziki, hizkuntza naturalaren prozesamendurako tresnekin konbinatuz gero (analizatzaileak, lematizatzaileak, etab.).

Horrela, besteak beste, terminologiarako tresna berritzaileen oinarria eta abiapuntua izan daiteke eLENA. Esate baterako, oso baliagarria izan daiteke terminologia-arauen ezarpena neurtzen duen tresna bat garatzeko7, edo proba-banku gisa: datu-base lexikalak aberasteko, itzultzaile automatikoen emaitzak eredu estatistikoekin hobetzeko, termino-erauzketa automatikorako, etab.

Eta, jakina, ikerketa- eta garapen-ildo horiek guztiak lantzen dihardugu UZEIn.


Oharrak

1. Munduan zehar 6.912 hizkuntza hitz egiten direla dio The Ethnologue: Languages of the World lan ezagunaren 16. edizioak.

2. Hala azpimarratzen du Eleaniztasunaren aldeko Enpresa Foroak 2007an aurkeztutako txostenak.

3. Europako Batzordearen ikerketa baten arabera, hizkuntza-industria da Europan azkenaldian gehien hazi den industria, eta oraindik urtero gutxienez % 10 haziko dela kalkulatzen da (The size of the language industry in the EU).

4. "Itzultzaile automatikoa ekoizpen-sistema batean ustiatzeko, errore-tasak ezin du % 10 baino handiagoa izan". IXA taldea, OpenTrad: itzulpen automatiko librea.

5. Eusko Jaurlaritzak lehiaketa publikoa egin zuen 2008an gaztelania-euskara itzultzaile automatiko bat prestatzeko, eta lehiaketa hori Alemaniako Lucy software etxeak irabazi zuen Euskadiko Emergiatech, Gizerbitek eta UZEIk batera aurkeztutako proiektuarekin. Itzultzaile hori erregeletan dago oinarritua.

6. Horrela definitu zuen Miriam Urkiak Euskaltzaindiak aurten antolatuko Corpusgintza gaur egun mintegian.

7. UZEIk garatutako IDITE proiektuaren helburua gaztelania-euskara testu elebidun batean, alde bietako terminoak identifikatu eta haien egokitasunari buruzko azalpen bat ematea da. Proiektu horren azken urratsa gaztelania-euskara itzulpen bateko terminoak egiaztatzeko funtzionalitatea eLENA aplikazioan integratzea da.