Itzulpen automatikoa, oximorona ote?
Artikulua PDFn.
Duela hilabete batzuk, itzulpen automatikoaz geniharduelarik Senezeko arduradunetako batek eta biok, hark esan zidan, Groucho Marx parafraseatuz, itzulpen automatikoa oximoron bat zela 'inteligentzia militar' bikoaren moduan. Bistan da, gure enpresaren negozioetako bat horixe izanik, ez natorrela bat adierazpen horrekin eta ez horrexegatik soilik hain zuzen ere. Itzulpen automatikoa oso baliagarria da bizitzaren kasu askotan eleaniztasuna kudeatzeko.
Asko dira itzultzaile jendearen artean itzulpen automatikoaz iritzi negatiboa dutenak. Egia esan arrazoiak izan ditzakete hori pentsatzeko. Itzulpen automatikoak esperantza asko piztu eta zaputz gehiago sortu ditu. Doako sistemetan emaitzak, oro har, ez dira oso kalitate handikoak izaten. Halaber, aurrerakuntza teknologikoekiko izuak eta kezkak egon daitezke jarrera horren atzean: lana kenduko digu! Itzulpen-memoriak agertu zirenean ere, itzultzaile batzuk uzkur agertu ziren hasiera batean. Gero, ostera, jarrera aldatu eta ezinbesteko tresnatzat jotzen dituzte. Itzulpengintzaren alor batzuetan, itzulpen administratiboan etsenplurako, itzultzailerik ba al da egun itzulpen-memoriak usatu gabe lanean jardun nahi duenik? Alabaina, itzultzaile horietako inork ez lituzke memoriak baliatuko Primo Leviren Sistema periodikoa itzultzeko. Erokeriatzat joko luke, hain segur.
Artikulu honetan itzulpen automatikoaren laudorioa egiteko asmoa dut, garbi utzita itzulpen automatikoaren erabilgarritasuna lortu nahi den helburuaren araberakoa dela. Kasu batzuetan oso erabilgarria izango da; are gehiago ezinbestekoa. Beste batzuetan, aitzitik zentzurik ez luke izango. Zenbaitzuk dituzten aurreiritziak uxatu nahi ditut; itzulpen automatikoaren oximorontasuna erabileran legoke ez izaeran.
Itzulpen automatikoa egiteko sistemak
Egokia izan daiteke itzulpen automatikoaren erabilgarritasunaz aritu aurretik artearen egoera zein den azaltzea, labur bada ere. Hurrengo paragrafoetan jardungo dut horri buruz, baina gehiago sakondu nahi duenak jo beza Deustuko Unibertsitateko Joseba Abaitua irakaslearen weborrira non aurkituko duen informazio gehiago eta, halaber, ikuspegi historikoaz jabetu ahal izango da. Halaber, BAT aldizkarian Ixa taldekoek oraindik orain idatzitako artikuluan ere informazio interesgarria aurkituko dute.
Itzulpen automatikoa egiteko sistemak bi multzo handitan banatzen dira:
- Arauetan oinarritutako sistemak (RBMT). Hauek arau gramatikalak eta hiztegiak usatuz burutzen dituzte itzulpenak. Horrelakoa da, esaterako, Matxin gaztelania-euskara itzultzailea. Horrelako sistemek zuzen-zuzenean egiten dute itzulpena iturburu hizkuntzatik helburu hizkuntzara. Dena dela, badira tartean hizkuntza guztien artean komuna den tarteko adierazpen bakar bat usatzen duten metodoak. Adierazpen horri interlingua esaten zaio.
- Corpusetan oinarritutako sistemak. Sistema hauek jada egindako itzulpenak dituzte oinarrian. Nagusiki bi dira: adibideetan oinarritutako itzulpenak (EBMT) eta estatistiketan oinarritutakoak (SMT). Lehenari buruz artikulu argigarri bat argitaratu zuten IXA taldekoek Senezen 25. alean (Ikus, Diaz de Ilarraza et als.).
Atzen urteetan corpusetan oinarritutako sistemetan egin izan da ikerketaren zatirik handiena, nahiz eta paradoxikoa bada ere, sistema komertzial guztiak arauetan oinarritzen diren. Horrelakoak dira Systran eta Metal sistema ezagunak. Bestetik, bi sistema-multzo hauek konbinatuz sortzen diren sistema hibridoetan ere ikerketa asko egiten ari da. Horixe ikusi ahal izan da 2008ko maiatzaren 19an eta 20an Berlinen itzulpen automatikoari buruz eginiko Translingual Europe Conference delakoan.
Elekan, Ixarekin eta Elhuyar Fundazioarekin batera sistema hibridoak garatzen dihardugu gure I+G proiektuen baitan (ikus Alegria, et als.). Era berean, Eusko Jaurlaritzak gaztelania-euskara itzultzaile automatikoa erosteko egin duen lehiaketan, entregatu beharreko sistemak hibridoa izan behar du.
Itzulpengintza automatikoaren helburuari erreparatuz gero bi multzo handi egin daitezke:
- Hedapena. Kalitate handiko itzulpena da helburua, enpresa eta erakundeetan baliatua izateko. Honelakoa da, adibidez, Opentrad sistema katalan-gaztelania edo galego-gaztelania bikoteen kasuan. Edonola ere emaitza publikatzekoa bada, pertsonek zuzendu behar dute aldez aurretik. Postedizio esaten zaio prozesu horri. Horrelako sistemek itzulpena egiteko behar den denbora asko laburtzen dute, % 70era irits daiteke gaztelaniatik katalanera eginiko itzulpenetan etsenplurako, eta ondorioz kostuak asko murrizten dira.
- Asimilazioa. Kalitate txikiagoko itzulpenak dira eta itzulitako testuak gutxi gora-behera zer dioen jakiteko balio du. Hartara, informazioa iragazteko usa daiteke, dokumentu-multzo batetik itzultzeko zein izan daitekeen interesekoa erabakitzeko edo ezagutzen ez duzun hizkuntza bateko komunikabide digital batean nabigatzeko. Horrelakoak dira sarean doan dauden sistema gehienak.
Noiz eta nola?
Baieztapen batekin hasiko naiz: itzulpen automatikoa erreminta eraginkorra eta erabilgarria izateaz gain, komunikazio prozesuetan dirua aurrezteko edota bestela iritsiko ez zatekeen bezeroengana iristeko balio du. Horrek ekarri du itzulpen automatikoarekiko interesa emendatu izana atzen urteotan, nahiz eta jauzi teknologiko nabarmenik ez den gertatu.
Bi fenomenok eragin dute ondorio hori: digitalizazioak eta globalizazioak. Erakundeen barneko dokumentazioa, lehen ez bezala euskarri digitalean gordetzen da. Egun ez da ezer paperean sortzen. Halaber, Internetek eta komunikazio-sistema elektronikoek ez dira inoiz paper izango eta lehenak, halaber, erdaraz idatzitako makina bat informazio jarri du internautaren eskura. Informazio hori guztia baliabide teknologikoen bidez tratatua izateko bazka da. Bestalde, mundu globalizatuan salerosketak non nahi egiten dira, usu produktuak jatorria duen tokitik oso urrun eta hizkuntza arrotz batean. Bezeroak bere hizkuntzan jaso nahi du erosi behar duen produktuari buruzko informazioa.
2006an Common Sense Advisory aholkularitzak eginiko azterketak argi eta garbi erakutsi zuen hori. Can't Read, Won't buy: Why Language Matters izeneko txostenak nazioartean web bidez produktuak eta zerbitzuak saltzeko hizkuntza zein inportantea den erakusten du. Hiru kontinenteetako eta 8 estatuetako 2.400etik gora erosle galdekatu zituzten. Estatuak hauek izan ziren: Alemania, Brasil, Errusia, Espainia, Frantzia, Japonia, Turkia eta Txina. Txostenak informazioa ingelesez soilik eskaintzen duten webguneekiko erosleen jarrerak hartzen ditu kontuan. Txostenak hainbat ondorio argigarri ditu:
- Jende gehienak nahiago du bere hizkuntzan erosi. Hau ez da harritzekoa. Jarrera hori Frantzian eta Txinan areagotu egiten da. Jakina, ingeles maila txikia dutenen artean norberaren hizkuntzarekiko atxikimenduan areagotu egiten da.
- Erosketa inportanteak edo baliotsuak egiteko unean gehien-gehienek, %85,3k, bere hizkuntzan jaso nahi dute produktu edo zerbitzuari buruzko informazioa.
- Bertako hizkuntza erabiltzea baina haratago joan behar da, eskaintza itzuli eta lokalizatu behar da: kreditu-txartelak, moneta, ...
- Erosleak ontzat jotzen ditu itzulpen erdipurdikoak[1]; bere hizkuntzan informaziorik ez izatea baino nahiago ditu. Alegia, itzulpen automatikoak eman dezakeena nahikoa zaie. Elkarrizketatutakoen erdiak baino gehiagok jo izan du itzulpen automatikoa egiten duten sareko baliabideetara saltzailearen weborria bere hizkuntzan jartzeko.
Bestetik, itzulpen automatikozko sistemak ezartzeko kostuak asko murriztu dira. Erakunde batean horrelako sistema bat ezartzeak ehunka mila eurotako kostua izaten zuen. Egun milaka euroko kostuan egin daiteke. Garai batean ordenadore ahaltsuak behar ziren itzulpen automatikozko programak egikaritzeko. Egun mahai-gaineko ordenadoreak nahikoak dira. Era berean, ez dago jada zertan sistema bezeroaren produkzio-fluxuan integratu beharra eta web bidezko itzulpen-zerbitzuek asko merkatzen dute itzulpen automatikozko zerbitzua ezartzea.
Gorago aipatu den legez, merkatuaren ikuspegitik ere aldaketa nabarmenak jazo dira, itzulpen automatikoaren erabilera sustatu dutenak:
- Produktuen bizitza-ziklo laburra. Kontsumo-produktu askoren bizitza-zikloa laburtu egin da oso; adibidez, kontsumoko elektronikazko produktuena. Horrek ekartzen du produktu horrekin lotuta dagoen informazioaren bizitza ere laburtu egiten dela. Hots, mp3 irakurgailu baten argibide-liburuxkaren balio komertziala laburragoa da. Eredu berria ekoizten eta merkaturatzen denean erabilera-argibideak ere aldatu egin behar dira eta, gainera, produktua salduko den merkatuetako hizkuntzetan jarri beharko da. Zenbait herritan, gainera, hori salbatzerik ez dago bertako legeriak hala eskatzen duelako. Pertsona bidezko itzulpenaren bidez jarduteak atzerapen handiak ekar ditzake produktua merkaturatzeko momentuan. Adibide bat. Hardware batzuen bizitza urtebetera laburtu da. Horrekin batera doan softwarea, laguntzak eta argibideak lokalizatzeak merkatu batean produktu hori merkaturatzeak 8 aste atzeratzen badu, saltzaileak produktuaren bizitza-zikloaren % 15 galdu du. Itzulpen automatikoak lagun lezake lokalizazio-epea murrizten[2].
- Informazio-bolumen handia. Edozein salgaik gero eta informazio gehiago darama berarekin batera, direla argibide teknikoak, erabilera-argibideak edo bestelako informazioa. Gorago aipatutako bizitza-zikloaren laburtzearekin lotuta eta kostuak gehiegi ez hazteko, fabrikatzaile batzuk hasi dira jada produktuarekin batera doan informazioaren zati bat bakarrik itzultzen. Itzulpen automatikoak hori gerta ez dadin lagun dezake.
Oraindik orain aipatutako arrazoiak medio, itzulpen automatikoa usatzeko zioak agertu dira zeharbidez bada ere.
- Kostuak murriztea. Pertsonek eginiko itzulpenen kalitatea ematen duen itzulpen automatikozko sistemarik ez da egundo sortu. Kalitaterik gorena nahi bada, makinak itzulitako testua pertsonek posteditatu (zuzendu) behar dute. Horrela ere, itzulpenaren kostua % 20 eta % 70 bitartean murriztu daiteke hainbat faktoreren arabera: testu-mota[3], jatorrizko originalaren kalitatea[4], hizkuntzen gertutasun linguistikoa, etab. 2007ko urrian Eusko Jaurlaritzaren Justizia Sailak antolatuko Euskara Justizia Administrazioan izeneko jardunaldian Translendium enpresako (www.translendium.com) arduradun Juan Alberto Alonsok emaniko datuen arabera, ingelesetik gaztelaniara edo frantsesera eginiko itzulpenetan % 33 murriztu daiteke prozesua (automatikoki itzuli eta zuzendu) burutzeko denbora; frantsesetik gaztelaniara % 60 eta gaztelaniatik katalanera % 75).
Emaitzaren kalitatearekin ere joka daiteke kostuak murrizteko momentuan. Bistakoa da zenbait erabileretarako makinak egiten duen itzulpena nahiko izan daitekeela eta postedizioa soberan dagoela. Horrelakoak dira bizitza laburra duten informazioak, agerkari digitaletako berriak adibidez.
- Denbora aurreztea. Hau neurri batean kostuak aurreztearen beste ikuspegi bat da. Dena dela, azpimarratu nahi ditut hemen bi alderdi. Batetik, informazio efimeroa, ordu batzuk edo egun bat iraungo duena, kudeatzea posible egiten du itzulpen automatikoak. Ordu batzuetako bizitza duten datu finantzarioak (burtsaren gorabeherak adibidez) itzultzea alferrikako ahalegina izango litzateke itzulpen automatikorik gabe, pertsonak itzulpena bukatu baino lehen informazioak pertinente izateari utziko bailioke. Bestetik, informazio inportantea ahalik eta azkarren erabiltzailearen esku jartzea ere inportantea da. Beherago ikusiko dugu Ford-ek nola aplikatzen duen itzulpen automatikoa fabrikazio-prozesuetako eskuliburuak ingelesetik beste hizkuntza batzuetara aldatzeko eta atzerriko produkzio-plantek autoak egiteko argibideak ahalik eta azkarren jaso ditzaten.
- Bezeroa gogobetetzea. Kasu honetan bezeroa barnekoa zein kanpokoa izan daiteke eta, bestela, itzuliko ez litzatekeen edo partez soilik itzuliko litzatekeen dokumentazioa itzultzeko modua ematen du. Horrela, esaterako, bezeroen dudak bideratzeko enpresek dituzten on-line zerbitzuetan eskaera handia duten dokumentuak soilik itzultzen dira pertsonen bidez. Enparauak, automatikoki egiten dira. Microsoft-ek eta SAP-ek egiten dute hori. Multzo honetan sar daiteke turismo-bulegoen kasua. Gauza jakina da turista katalan asko etortzen dela Euskal Herrira eta beren hizkuntzarekiko atxikimendu berezia dutela. Zenbat euskal turismo-bulegok eskaintzen du informazioa katalanez beren webguneetan? Urri batzuk. Zenbatek ordain dezake webgunea katalanez mantentzeak dituen antolaketa- eta ekonomia-kostuak? Itzulpen automatikoak posible egingo luke.
- Merkatu berrietarako sarrera. Gorago aipatu dugun Can't read, Won't buy txostenak beste arrazoi bat ematen du. Internet bidezko salmentan diharduten asko enpresa txikiak dira eta webgunea hainbat hizkuntzatan izatea arazo ekonomikoa da haientzat. Itzulpen automatikoak bide ematen die, bestela iritsiko ez liratekeen merkatuetara beren hizkuntzan iristeko kostuak murritzagoak direlako. Arazoa are konplikatzen zaie enpresa horiei saltzen duten katalogoa sarri aldatzen bada.
- Informazioa ulertzea. Interneten dabilenak askotan sentitu izan du etsipena webgune itxuraz interesgarri batera iritsi eta ezin jabetu bertan esandakoaz, hizkuntza ulertzeko gai ez delako. Itzulpen automatikoak etsipena gainditzen lagun dezake. Datu bat ematearren, www.opentrad.com weborriko erabiltzaileen % 40ak nabigatu eta itzuli aukera baliatzen du.
Kalitatea arazo?
Munduko itzulpen automatikozko sistemarik onenak ere ezin du itzultzaile on baten lanaren kalitatea eman. Nahita azpimarratu dut on hitza. Izan ere, hizkuntzak elkarrengandik oso gertu daudenean itzulpen automatikoaren emaitzaren kalitatea oso-oso ona izan daiteke testuinguru batzuetan.
Itzulpen automatikoa juzkatzen denean, maiz, lupa handia erabiltzen da. Profesionalaren begi zorrotza usatzen da eta, horrek, noski, beti aurkituko ditu akatsak. Kasu horietan ez zaio bezeroaren edo erabiltzailearen pertzepzioari jaramon egiten. Gorago aipatu dudan Berlingo konferentzia horretan EBko Itzulpenerako Zuzendaritza Orokorreko zerbitzu informatikoetako buru den Josep Bonet-ek azpimarratu zuen itzulpen automatikoaren kalitatea juzkatzeko erabiltzailearen begiak baliatu behar direla. Etsenplu argigarri bat eman zuen. Txernobilgo erreaktore nuklearrari buruzko informazioa zela eta, automatikoki itzuli zuten hainbat informazio errusieratik ingelesera. EBko itzultzaileen arabera itzulpena ez zen onartzekoa. Informazioa baliatu behar zuten teknikariak pozik saltoka zebiltzan dokumentuek zuten informazioa entenditzeko gai zirelako. Lezioa agerikoa da.
Gorago aipatu dudan turismo-bulegoen kasuan, informazioa katalanez eskaintzeak ematen duen satisfazioak gainditu egiten du testuan aurki daitezkeen akatsek eragin lezaketen etsipena.
Bonetek beste datu interesgarri batzuk ere eman zituen. Esaterako EBren itzulpen automatikoaren erabiltzaileak gehiago dira, % 55, gainerako Zuzendaritzetako pertsonak Itzulpen Zuzendaritzako itzultzaileak baino. Halaber, gainerako zuzendaritzetako erabilpenen erdia ez zen itzulpenak egiteko, baizik eta beste hizkuntza batean dagoen dokumentu bat ulertzeko. Askotan, gero, dokumentu horren itzulpen ofiziala jasoko bada ere[5].
Arrakasta kasuak
Atal honetan itzulpen automatikoaren erabilpenaren hainbat kasu aurkeztuko ditugu. Kasu horietako bakoitzak erabilera posibleen esparru bat ordezkatzen du. Alabaina, kasuok ez dute ordezkatzen erabilera posibleen sorta osoa.
1. Esparru komunikatiboa. La Voz de Galicia
La Voz de Galicia Galiziako egunkaririk handiena da. Bere produkzioa, paperezkoa zein digitala, gaztelaniaz idatzi eta publikatzen da. 2006an edizio digitala galegoz ere publikatzea deliberatu zuten. Egunkariaren zuzendaritzak argi eta garbi zeukan galegoz publikatzeko ez zegoela prest inbertsio handiak egiteko, alegia, edizio digitalaren erredakzioa handitzeko galegoz erredaktatuko zuten pertsonak kontratatuta. Itzulpen automatikoaren bidez egingo zutela erabaki zuten. Opentrad sistema aukeratu zuten. Bidenabar, hau izan zen Opentraden lehen ezarpena.
La Voz de Galiciaren galegozko edizio digitala 2006ko maiatzean hasi zen publikatzen. Horretarako, Opentrad moldatu egin behar izan zen La Vozen ezaugarrietara. Batetik, Opentrad egunkariaren produkzio-fluxuan integratu zen, horretarako beharrezkoak izan ziren moldapen informatikoak eginez. Bestetik, Opentraden hiztegiak handitu eta moldatu egin behar izan ziren. Opentraden jatorrizko hiztegiak 8.000 sarrera inguru zituen, La Vozerako prestatu zena 28.000 hitzetara iritsi zen. Hiztegi arrunta osatzen egin behar izan zen lanaren gain, izen bereziak eman zuten lan handia. 'Pilar del Castillo', 'El Loco de la Colina', eta antzeko izen bereziak identifikatu egin behar ziren eta, ondoren, sisteman arauak egin horiek itzul ez zitzan, hots, ez zezala 'Alicerce do Castelo' egin.
Hortaz, La Vozen edizio digitala osorik gaztelaniaz idazten eta publikatzen da. Galegozko edizioa automatikoki sortzen da unean-unean internautak eskatzen duen aldioro. Sistema oso azkarra delako egin daiteke hori. Dena dela, orrialderik eskatuenak, sarrera-orria adibidez, cachean gordetzen dira sistemaren lastertasuna bermatzeko. Ondorioz, irakurleak Opentraden emaitza gordin-gordina ikusten du inongo zuzenketarik gabe. Akatsak a posteriori zuzentzen dira, irakurleek edota erredaktoreek detektatu ostean.
La Voz digitalaren galegozko bertsioan argi eta garbi adierazten da automatikoki egina dagoela eta aurkitutako akatsen berri emateko eskatzen da (ikus irudia). Egia esan itzulpenaren errore-tasa oso txikia da, % 2koa baino txikiagoa. Egunkariak akatsak posteditatzeko sistema bat ezarrita dauka. Hasiera batean, zalaparta nahikoa handia egon zen Galizian itzulpen automatikoa usatu izanagatik. Jende bat akats bila ibili zen eta horiek barregarri uzten aritu zen blogetan eta antzeko foroetan. Hasierako olde horren ostean auzia baretu egin da eta egunkarietako galegozko edizio digitalak automatikoki egitea ohizko bihurtu da Galizian. La Vozen ondoren, beste egunkari batzuk ere, El Progreso de Lugo edo El Diario de Pontevedra adibidez, hasi dira beren edizio digitala Opentraden bidez galegoz publikatzen.
Hedabideen itzulpen automatikoaren bestelako erabilera baten adibidea bada Galiziako egunkarien artean. El Correo Gallegoren galegozko 'bertsioa'[6] den Galicia Hoxe egiteko Opentrad baliatzen da agentzietako berriak gaztelaniatik galegora itzultzeko eta informazioa erredaktatzeko lehengai moduan.
2. Esparru produktiboa. Ford
Enpresa multinazional askok usatzen dute itzulpen automatikoa beren prozesuetan hizkuntza desberdina duten herrialdeetan egoteak ekartzen duen eleaniztasuna kudeatzeko beharrari konponbidea emateko. Kasu horretan daude Xerox, Caterpillar, Ford, SAP, Bosch edo Symantec.
1998az gero ari da Ford itzulpen automatikoa baliatzen autoak muntatzeko argibideak ingelesetik alemanera, gaztelaniara, nederlanderara eta portugesera itzultzeko. Itzulpen automatikozko sistemak Systranen sistema du oinarrian eta hizkuntza kontrolatua usatzen du. Hizkuntza kontrolatuak dira hiztegi eta sintaxi mugatua usatzen dutenak hizkuntza arruntaren anbiguotasunak gainditzeko eta semantikoki ahalik eta hizkuntza zehatzena izateko. Forden kasuan Standard Language du izena eta 5.000 hitz ditu, akronimoak, laburtzapenak, izen propioak eta Forden terminologia espezifikoa barnean duelarik. Standard Language hau ez da fosil bat, etengabe aldatzen ari den hizkuntza bizia baizik. Emaitzen ikuspegitik, ingelesetik alemanerako itzulpenetan % 95eko zehaztasuna lortu da. Beste hizkuntzetan ez dira horren zehatzak, baina hobetzea espero dute sistemaren hiztegiak eta glosategiak hobetzen dituzten heinean. Etorkizunean itzulpen automatikoa produkzio-prozesuaren beste alor batzuetara hedatzeko asmoa du Fordek.
Atal honetan aipatzekoak dira Translingual Europe Conference delakoan SAPeko Stephen Johnson-ek emaniko erabilera datuak. SAPek alemanetik ingeleserako itzulpen automatikoa baliatzen du bezeroen arreta-zerbitzuan besteak beste. Zerbitzu horrek 125.000 itzulpen-eskaera izan zituen 2007an eta 7,7 milioi hitz itzuli ziren automatikoki. SAPek Lucy teknologia erabiltzen du.
3. Administrazio publikoa. Generalitat de Catalunya
Kataluniako Generalitatea itzulpen automatikoaren bultzatzaile sutsua da. Helburu argia du: katalanaren eta munduko hizkuntza nagusien artean zubiak egin behar dira eta horretarako itzulpen automatikoa baliagarria da. Generalitateak on-line zerbitzu bat du hiritarrek testuen eta web-orrien itzulpen automatikoa egin dezaten[7]. Orri horretan katalana-gaztelania, katalana-frantsesa, katalana-ingelesa eta katalana-alemana bikoak eskaintzen dira. Translendium teknologia baliatzen dute. 2008aren bukaerarako katalana-okzitaniera eta okzitaniera-gaztelania bikoteak ere eskainiko dituzte Opentrad teknologiaren bidez[8].
Zerbitzu horrek izugarrizko arrakasta du. 2007an 8 x 106 itzulpen eskaera egon ziren eta 1.300 x 106 hitz itzuli ziren.
4. Barne-bezeroen gogobetetzea. Gipuzkoa-Donostia Kutxa
Kutxak bulegoak Euskal Herrian izateaz landara, Katalunian, Galizian, Valentzian eta estatuko beste hainbat tokietan ere baditu. Bulego horien arteko komunikazio-hizkuntza, hots, lingua franca, gaztelania da. Alabaina, kutxako zuzendaritzak komunikazio eleanitza bermatu eta bere langileei aukeratzen duten hizkuntzan jarduteko aukera eskaini nahi die, hori posible den heinean, helburu horrekin bere intranetean itzulpen automatikoaren bidez katalanez eta galegoz jarduteko aukera izan dezaten.
Opentrad aukeratu du Kutxak eta ezartze-prozesuan dago une honetan (2008ko maiatza). Ezarpenak bi alderdi ditu: Opentrad kutxaren sistema informatikoan ezartzea eta hiztegian terminologia finantzariora egokitzea. Bigarren ataza hau burututa dago eta termino finantzarioak osatzeko Kutxak berak duela urte batzuk argitaratutako Kutxan Euskaraz liburuan biltzen zirenak hartu dira oinarri moduan.
Ezarpena 2008ko udazkenean burutuko da. Zerbitzu berriak erabiltzaileen aldetik harrera ona badu, gerora kutxaren zerbitzu publikoetan ere ezarriko da itzultzailea. Kontuan izan, kutxa.net weborria euskaraz eta gaztelaniaz soilik dagoela.
5. Itzulpen-zerbitzuak. Europako Batasuna
Europako Batasunaren Itzulpen Zuzendaritzak 1976tik erabiltzen du itzulpen automatikoa eta egun itzulpen-prozesua kontrolatzeko baliatzen duten Euramis plataforman dago integratuta. Alegia, EBko itzultzaileek itzulpen automatikoa lan-erreminta dute. EBren sistemak Systran du oinarrian eta 18 hizkuntza-bikote maneiatzen ditu. Emaitzaren kalitatea bi faktoreren mende dago: hizkuntzen arteko urruntasun/hurbiltasuna eta hizkuntza bikotearen garapen-epea. EBko itzulpen automatikoz itzulitako hizkuntza-bikoteak.
EBren itzultzaile automatikoaren baliatzaileak hiru multzotan banatzen dira: zerbitzuko itzultzaileak, EBren administrazioa eta hainbat administrazio estatal. 2005ean itzuli ziren 860.000 orrialdeetatik 287.000 itzulpen-zerbitzuak eskatu zituen.
Ondorio gisa
Irakurleak honaino iristeko pazientzia izan badu, espero dut, honez gero garbi izango duela itzulpen automatikoa hizkuntzen arteko langa gainditzeko erreminta egokia izan daitekeela eta helburua ondo aukeratzen bada konponbide egokiena izan daitekeela (eta batzuetan bakarra). Irakurlea ondorio horretara iritsi ez bada, ez da itzulpen automatikoaren oximorontasunaren ondorio, idazle honen argibide eta prosa kamutsaren kausaz baizik.
BIBLIOGRAFIA
Abaitua, Joseba, Itzulpengintza Automatikoa. Hamar orduko sarrera.
Aizpurua Ugarte, Ibon; Ramirez Sanchez, Gema; Pichel, Jose Ramon eta Waliño, Josu: Opentrad: bringing to the market open-source based Machine Translators. Lang-tech 2008. Rome. Poster Session.
Alegría Loinaz, Iñaki; Arantzabal; Forcada, Mikel L.; Gómez Guinovart, Xavier; Padró, Lluis; Pichel Campos, Jose Ramon eta Waliño, Josu: OpenTrad: Traducción automática de código abierto para las lenguas del Estado español. Procesamiento del Lenguaje Natural, 37, 2006.
Alegria, Iñaki; Casillas, A.; Diaz de Ilarraza, A.; Igartua, J.; Labaka, G.; Lersundi, M.; Mayor, A.; Sarasola, K.; Saralegi, X. eta Laskurain, B.: Mixing Approaches to MT for Basque: Selecting the best output from RBMT, EBMT and SMT. ISBN 978-612-2224-7.
Alegria, Iñaki; Diaz de Ilarraza, Arantza; Labaka, Gorka; Lersundi, Mikel eta Sarasola, Kepa, Itzulpen automatikoa: aukerak, arazoak eta erronkak, BAT, 66, 2008.
DePalma, D, Sargent, B.B. eta Beniatto, R.S., Can't Read, Won't buy: Why Language Matters on Global Websites, Common Sense Advisory, 2006.
Diaz de Ilarraza, Arantza; Mayor, Aingeru eta Sarasola, Kepa: Adibideetan oinarritutako itzulpen automatikoa, Senez, 25, 2002.
Lonnroth, Karl-Johan, Translation tools and workflow, European Commission. Translingual Europe Conference, www.euromatrix.net.
Oharrak
1. Quick and dirty translation txostenean.
2. Bizitza-zikloak horrenbeste laburraraztearen inguruan bestelako kontsiderazio batzuk egin daitezke jasangarritasunaren ikuspegitik, baina hau ez da horretarako tokia.
3. Itzuli nahi diren testuak eremu konkretu batekoak badira eta itzultzaile automatikoa horretarako prestatu bada, emaitzak hobeak izango dira eta zuzenketa beharra txikiagoa. Adibidez, banketxe batean erabiltzeko sistema batek finantza munduko terminologia, esapideak eta enparauak izango ditu inplementatuta eta gaztelaniara itzuli nahi den euskarazko testu batean 'korritu' hitza topatzen badu, ordaina 'correr' aditza ez dela 'rédito' izena baizik jakin beharko du. Halaber, alferrikakoa da literatura, esapideak edota hizkuntza anbiguoa itzulpen automatikoak ganoraz itzuli nahi izatea.
4. Sarri ahaztu egiten da itzulpen automatikoan makina batek egiten duela lana eta ez duela pertsonok ditugun ahalbide berak informazioa osorik izan gabe edo okerra izanik emaitza zuzena emateko. Horrela, automatikoki itzuli nahi den testuak akasgabea izan behar du azentu, akats ortotipografiko zein puntuazioaren erabilera egokiaren ikuspegitik. Etsenplurako, itzulpen-motor batek gaztelaniazko 'esta' edo 'está' azentuaren arabera desberdinduko ditu beti. Pertsonak, aitzitik, beti izango du gaitasuna azenturik gabeko 'estar' aditzaren forma identifikatzeko.
5. Itzultzaile automatikoaren erabileraz datu esanguratsua eman zuen Berlingo konferentzian Generalitateko Baliabide Linguistikoen ataleko buru den Mónica Pereñak geroago komentatuko ditugunak.
6. Bi-biak ez dira El Periódico de Catalunyaren gaztelaniazko eta katalanezko bertsioen kasuan bezala, bata bestearen itzulpen zuzena. El Correo gaztelaniaz sortutako egunkaria da eta Galicia Hoxe galegoz sortzen da hasieratik.
7. Eusko Jaurlaritzak gaztelania-euskara itzultzaile automatikoa garatzeko egin duen lehiaketan zerbitzu-eredu horixe proposatzen da.
8. Kontuan hartu okzitanieraren aldaera den aranera hizkuntza ofiziala dela Vall d'Aranen.