Itzultzaile automatikoak literatur testuetan: alderaketa bat giza itzultzaileekin
Itsaso Arregi Aizpun

Lan honen xedea euskarazko itzultzaile automatikoek literatura itzultzean nola jokatzen duten ikertzea da. Horretarako, zenbait literatura testu hartu, Itzuli itzultzaile automatiko neuronalarekin itzuli, eta literatur itzulpengintzaren munduan aritutako 7 itzultzailek euskaratutako testuekin alderatu dugu jasotako emaitza. Lehenik, itzultzaile automatikoak egindako akats objektiboak analizatu ditugu. Jarraian, itzultzaile automatikoaren eta giza itzultzaileen itzulpenak alderatu ditugu, testuz testu, adibide nabarmenenak aipatuz. Azkenik, azterketako ondorioetatik abiatuta, gogoeta egin dugu gaiaren inguruan, batez ere itzultzaile automatikoaren arriskuei eta literaturan izan ditzakeen funtzioei buruz.

Sarrera

Azken garaiotan, denon ahotan dabil globalizazioa. Argi dago inoiz baino konektatuago gaudela Internet bidez, eta informazioa oso azkar zabaltzen da. Nazioarteko harremanak gero eta ohikoagoak eta ugariagoak dira, eta, horretarako, funtsezkoa da harreman horretan parte hartzen duten guztien arteko komunikazio zubiak sendotzea. Behar horren ondorioz, itzulpengintzaren mundua errotik aldatu da denbora laburrean.

Informazioa hainbat hizkuntzatan izateko beharrak eraginkortasuna handitzea eskatu du, eta horrexegatik sortu da, besteak beste, itzultzaile automatikoa (IA), hau da, testu bat hizkuntza batetik bestera automatikoki itzultzen duen teknologia.

Duela gutxira arte, euskarazko itzultzaile automatikoek ospe txarra zuten, oso oinarrizko akatsak egiten baitzituzten. Azken urteotan, ordea, euskarazko lehen itzultzaile neuronalak sortu dira, eta haien itzulpenen kalitatea askoz hobea da. Sistema konplexuak erabiltzen dituzte, eta datu base handietan oinarritzen dira itzulpenak sortzeko. Aurreiritzi asko hautsi dituzte, eta emaitza batzuk benetan harrigarriak dira. Hala ere, itzultzaile automatikoaren emaitzak gero eta hobeak diren arren, zenbait arlotan zalantzak sortzen dituzte oraindik.

Hori dela eta, literatura itzultzean zer-nolako emaitzak ematen dituen jakiteko grina piztu zitzaigun, eta ideia horretatik abiatuta osatu genuen iaz Gradu Amaierako Lana, artikulu honen oinarria, Isabel Etxeberriaren zuzendaritzapean. Literatura itzultzea erronka bat da, baita giza itzultzailearentzat ere, testuaz haratago joan beharra baitago egileak transmititu nahi duen mezua ulertzeko. Beraz, itzultzaile automatikoak gero eta hobeak izanda, lortuko dute inoiz literatur testuak itzultzea?

Jakitun gara itzultzaile automatikoa ez dela literatur testuak itzultzeko garatua izan eta gaur egun beharrezkotzat jotzen dela itzultzaile automatiko bidez itzulitako testuak posteditatzea (itzultzaile automatikoak sortutako testua orraztea), itzulpenek akatsak izan ohi baitituzte oraindik. Ikerketa honekin, zera ikusi nahi dugu, ea alderik badagoen IAk eta giza itzultzaileek itzulitako literatur testuen artean, literatur itzulpenetan faktore askok baitute garrantzia (egilearen estiloa, hitzen konnotazioa, jatorri eta xede hizkuntzetako kulturen arteko desberdintasunak…), eta itzultzaileak egin beharreko sormen lana handiagoa baita beste testu mota batzuekin alderatuta.

Lehendabizi, itzultzaile automatikoak zenbait testu itzultzean egin dituen akats objektiboak laburbilduko ditugu. Jarraian, itzultzaile profesionalekin alderatzean topatutako puntu interesgarrienak aurkeztuko ditugu. Azkenik, ondorioei eskainitako atalean, ikerketatik ateratako ondorioak azaldu, eta gogoeta labur bat egingo dugu.

Metodologia

Gure azterketa gaztelania-euskara norabidean finkatu dugu, konbinazio horretan egin baitira garapenik nabarmenenak. Lau testu mota hautatu ditugu, ikusteko ea literatur testu motak eraginik ba ote duen IAk ematen dituen emaitzetan.

Lehen laginerako, Eva García Saenz de Urturi idazle gasteiztarraren El silencio de la ciudad blanca hautatu dugu, 2016an Planeta argitaletxeak kaleratua. Helduentzako thriller motako eleberrien sailean koka genezake, eta aukeratu dugun pasarteak bigarren adiera eta esamolde ugari ditu. Bigarren testurako, No me cuentes cuentos ipuin bildumako lagin labur bat hautatu dugu. Liburua Montenak argitaratu zuen, 2019an, eta haur literaturaren barnean sailkatzen da. Narrazio bat da, hizkera nahiko lau eta sinplekoa. Hirugarrenik, Carlos Ruiz Zafónen La sombra del viento eleberriko pasarte bat aukeratu dugu, deskribapen askokoa. Planeta argitaletxeak plazaratu zuen, 2001ean. Ia ez du narraziorik, eta adjektibazioak pisu handia du. Azkenik, Federico García Lorcaren La casa de Bernarda Alba antzezlana hartu dugu. 1945ean argitaratu zen lehen aldiz. XX. mendeko lehen erdiko lagunarteko hizkera darabil, eta, elkarrizketa bat denez, informazio pragmatiko asko elipsian dago.

Behin testuak erabakita, itzultzaile automatikoetatik pasatu genituen, emaitzarik onenak zein itzultzailek ematen dituen ikusteko, eta, beraz, baita giza itzultzaileekin alderatzerakoan aukera gehien dituena zein den ikusteko. Elia, Batua eta Itzuli itzultzaile automatiko neuronalekin egin genuen proba, horiek baitira gaur egun euskarazko itzultzaile automatikoen artean emaitza onenak ematen dituztenak eta horrexegatik eskuragarri dauden bakarrak. Ondorioztatu genuen emaitza onena ematen duen itzultzailea, behintzat guk aukeratutako laginei dagokienez, Eusko Jaurlaritzaren Itzuli dela. Dena den, baliteke beste testu batzuk aukeratuz gero emaitza desberdina izatea. Gainera, kontuan hartzekoa da itzultzaile neuronalen arloa garatzen ari dela, eta espero izatekoa da urteen poderioz emaitza hobeak ematea, baina hori etorkizuneko kontua da.

Jarraian, itzultzaile profesionalengana jo genuen. Guztira, zazpi itzultzailek hartu dute parte ikerketa honetan: Amaia Apalauza, Maialen Berasategi, Koldo Biguri, Itziar Diez de Ultzurrun, Aiora Jaka, Fernando Rey eta Iñigo Roque. Une hau baliatu nahi dut haiei nire esker ona adierazteko, haien lanik gabe ez bailitzateke posible izango ikerketa-lan hau aurrera ateratzea. Itzultzaileak bi taldetan banatu genituen, eta talde bakoitzari bi testu itzultzeko eskatu genion, ikergaia zein zen esan gabe, emaitza ez baldintzatzearren. Lehen eta bigarren testua lau itzultzailek itzuli zituzten; hirugarrena eta laugarrena, aldiz, hiruk. Hemendik aurrera, itzultzaileen laginak aurkeztean, IP1, IP2… izendapenak erabiliko ditut, itzulpen bakoitzaren egiletza ezkutatzeko.

Itzultzaile automatikoaren akatsak

Itzultzaile automatikoak eta itzultzaile profesionalek egindako itzulpenak alderatu aurretik, itzultzaile automatikoak egindako akats objektiboak identifikatu ditugu. Emaitza oso desberdinak eman ditu laginaren arabera. Azter ditzagun akats mota esanguratsuenak testuz testu.

1. testua: Eva García Sáenz de Urturi, El silencio de la ciudad blanca

Testu honetan, hitzez hitzeko itzulpenak, birformulazio bitxiak eta adiera okerrak dira nagusi. IAk bi joera hartu ditu ezagutzen ez dituen esamolde eta metaforak itzultzeko: batzuetan, hitzez hitzeko itzulpena baliatu du, eta, besteetan, berriz, esanahia aldatu, eta kontrako zentzua duten esaldiak sortu ditu.

Beheko adibidean ikus dezakegu esamoldeak ez dituela zuzen itzultzen. «Hacer la vista gorda» esamoldea itzultzeko, «ez ikusiarena egin» edo antzeko egituraren bat erabili beharko litzateke, baina IAk, gorda adjektiboa alde batera utzi, eta modu bitxian birformulatu du esaldia, kontrako esanahia emanez. «Coleaban» itzultzeko, berriz, hitzez hitzeko itzulpena baliatu du. Baina, esanahia aldatu ez eta testua ulergarria den arren, euskaraz badaude esamolde jatorragoak, geroago itzultzaile profesionalen testuekin egindako alderaketan ikusiko dugun bezala.

arregi_1_taula.png

Bigarren adibide honetan ere, esamolde ezezagun baten aurrean, hitzez hitzeko itzulpena baliatu du «de melena pelirroja hasta la barbilla» segmentua itzultzeko, eta, ondorioz, jatorrizko esaldiaren zentzua erabat aldatu, eta ulermena oztopatzen du. Bigarren adierak direla eta, hau da egin dituen akatsetako bat: «cuerpo» hitzaren esanahietako bat ‘gorputz’ den arren, testuan polizia-kidegoari egiten dio erreferentzia. Gaztelaniaz, bigarren adiera hori orokortua eta finkatua dago. Euskaraz, ordea, ez da ongi ulertzen. Komunztadura akats bat ere egin du, eta, «cabezota» itzultzeko, «burukomin» erabili du. Akats hori bereziki harrigarria da, ez baitago ulertzerik arrazoia zein den. Gauza bera «metro sesenta» segmentuarekin; zenbaki kardinala ordinal bihurtu du, horretarako arrazoirik gabe. 

arregi_2_taula.png

Testuan zehar errepikatu egiten dira akats horiek, eta, orokorrean, testuaren ulermena oztopatzen dute. Itzultzaile profesionalen testuekin alderatu beharrik ez dago IAk kalitate baxuko itzulpena eman duela ondorioztatzeko.

2. testua: No me cuentes cuentos

Lagin honetan, akats objektibo bakarra identifikatu dut. Sintaxi akats bat ez den arren, «hori» erakusleak anbiguotasuna sortzen du testuinguru horretan. Euskarazko itzulpenean, badirudi aurreko esaldiari egiten diola erreferentzia, eta jatorrizko testuaren zentzua aldatzen du. 

arregi_3_taula.png
Gainontzean, ikuspuntu objektibo batetik, ez dago akatsik. IAk ez du ulermen arazorik sortu, eta informazioa bere horretan mantendu du.

3. testua: Carlos Ruiz Zafón, La sombra del viento

Lagin honetan, oso akats gutxi daude. Lehen adibidean, «acuchillar» itzultzeko, testuinguruari ez zegokion adiera bat erabili du; izan ere, testu horretan ez du ‘leundu’ adiera, baizik eta ‘sastakatu’. Omisio bat ere egin du: ez du «auténtica» itzuli. Elementu batzuk ez itzultzea ohikoa da itzultzaile neuronaletan, eta datu basean gordeta ez dagoen hitz edo esamolde bat itzuli behar dutenean gertatzen da (Poibeau, 2017).

arregi_4_taula.png
Bigarren adibidean, IAk analisi sintaktiko okerra egin du; «galería de frescos» itzultzeko, «freskoen galeria» eman ordez, jatorrizko testutik aldentzen den adiera bat eman du. Baliteke IAren datu basean fresco substantiboa gordeta ez egotea eta adjektibotzat jo izana. Beraz, IAk «izena + izenlaguna» egiturari lotu dio «galería de frescos», eta, jatorrizko testuarekin alderatuta, zentzu okerra eman dio. 

arregi_5_taula.png

Horietaz gain, ez dago beste akats aipagarririk testuan. Ez da informaziorik galdu, eta testua ulergarria da.

4. testua: Federico García Lorca, La casa de Bernarda Alba

Laugarren testuan, adiera okerrak eta hitzez hitzeko itzulpen desegokiak gailentzen dira. Aipatzekoa da, testua antzezlan bat izanik, informazio pragmatiko ugari inplizituki ematen duela, hau da, testuingurutik ondorioztatu behar da informazio hori. Giza irakurleak, testuaren osotasuna kontuan hartzen duenez, ez du arazorik, baina IAk, esaldiz esaldi itzultzen duenez, ezin du informazio hori ondorioztatu, eta ageri diren hitz eta esamolde batzuk ez dira gaur egun erabiltzen. Beraz, faktore hori dela eta, espero izatekoa zen IAk akats gehiago egitea.

Informazio inpliziturik gabe, esaldi batzuk anbiguoak dira. Lehen esaldian, IAk, subjektua hirugarren pertsona dela identifikatu ordez («si ella te viera»), lehen pertsona jo du subjektutzat («si yo te viera»). Bestalde, bigarren esaldian, gaztelaniazko su posesiboak Bernardaren senarrari egiten dio erreferentzia, baina, testuingurua zein den jakin gabe, gizakiontzat ere ezinezkoa litzateke jakitea bigarren pertsona singularra («el marido de usted») ala hirugarren singularra («el marido de ella») den. Kasu horretan, «haren» litzateke itzulpen zuzena.

arregi_6_taula.png

Hirugarren adibide honetan, kausazko menpeko perpaus bat dugu jatorrizkoan. IAk, aditzaren ezohiko kokapena dela eta, esaldiaren analisi okerra egin du: «sangre en las manos» segmentua ez du gainerako esaldiarekin identifikatu, eta «tengo de fregarlo todo» perpaus arrunt bihurtu du, «tengo que fregarlo todo» balitz bezala.

arregi_8_taula.png

Lagin honetan, bestalde, aurreko testuetan jazo ez den fenomeno bat ageri da. Adibide honetan ikus daitekeenez, itzultzaile automatikoak itzuli gabe utzi ditu zenbait pasarte. Nire hipotesia zera da, «VOZ» letra larriz dagoenez izen berezitzat jo eta bere horretan utzi duela, pertsonaien izenekin egin duen moduan. «La vieja»ren kasuan, ordea, zaila da esatea zergatik ez duen itzuli, eta zergatik idatzi duen letra xehez.

arregi_9_taula.png

Honako adibide hau ere harrigarria da, eta ez dago ulertzerik zergatik eman duen «txorizo txiza» itzulpena:

arregi_10_taula.png

Lehen testuan bezala, IAk emandako itzulpenak akats larri ugari ditu. Postedizio arina ez litzateke nahikoa izango testua zuzentzeko, testuko pasarte ugari osorik aldatu beharko lirateke eta.

Lau testuetako akatsak aztertu ondoren, ondoriozta daiteke testu motak asko baldintzatzen duela itzulpenaren kalitatea. Testua zenbat eta konplexuagoa izan sintaktikoki, zenbat eta metafora eta bigarren adiera gehiago izan, eta zenbat eta informazio pragmatiko gehiago gorde inplizituki, IAk orduan eta akats gehiago egiten ditu. Beraz, lehen eta laugarren testuak itzultzeko, IA asko hobetu beharra dago oraindik. Postedizio lan sakona egin beharko litzateke jatorrizkoaren itzulpen baliokide bat lortzeko, eta litekeena da hutsetik itzultzeko baino denbora gehiago behar izatea posteditatzeko. Bigarren eta hirugarren testuak itzultzeko, ordea, sintaktikoki nahiko sinpleak direnez eta lexikoari dagokionez ia ez dagoenez bigarren adierarik, uste baino emaitza hobea eman du IAk. Postedizio arin batez, testuaren akats objektiboak azkar zuzendu daitezke. Dena den, jarraian datorren atalean azalduko dudan bezala, akats objektiborik ez egoteak ez du esan nahi IAren itzulpena erabat egokia denik.

Giza itzultzaileen itzulpenekiko alderaketa

1. testua: Eva García Sáenz de Urturi, El silencio de la ciudad blanca

Lehen testu honetan, hainbat desberdintasun nabarmen topatu ditut.

Aurreko atalean aipatu bezala, IAk testu honi ez zegokion adiera erabili du «cuerpo» itzultzeko. Giza itzultzaile guztiek, «gorputz» baztertu, eta bestelako baliokide batzuk baliatu dituzte euskaraz.

arregi_11_taula.png

Adibide honetan, erabaki estilistiko bat topatu dugu. IAren itzulpenak jatorrizko testuaren egiturari jarraitzen dio. Giza itzultzaileek, ordea, aurreratu egin dute segmentua. Horrela, euskarazko irakurketa errazagoa da.

arregi_12_taula.png

Giza itzultzaileek gehikuntzak egin dituzte pasarte anbiguoetan, informazioa esplizitatu eta ulermena bermatzeko:

arregi_13_taula.png

Kolokazioei buruz ere badago zer aipatua. IAk hitzez hitzeko itzulpena egin du adibide honetan, eta emaitza egokia da, «arauei jarraitu» esamoldea zuzena baita euskaraz. Hala ere, itzultzaileek hautatutako kolokazioak, «arauak bete» eta «arauak errespetatu», ohikoagoak dira. Ezin esan «arauei jarraitu» okerra denik, baina kontuan hartzekoa da beste aukerak ohikoagoak direla.

arregi_14_taula.png

IAren itzulpen honetan, erregistroa galdu egin da. Gaztelaniazko esaldian ikus dezakegunez, «jodidamente» aditzondoak enfasia ematen dio esaldiari, eta baita kutsu informala ere. IAren itzulpenak erregistro ezegokia darabil. Itzultzaile profesional denek, bakoitzak lexiko desberdina erabili arren, kutsu informala mantendu dute. Informazioari dagokionez, ez da galera handia, baina, literatura testuetan bereziki, hitzek efektu jakin bat sortu nahi dute irakurlearengan, eta, beraz, erregistroa berdin mantendu beharra dago xede hizkuntzako irakurleak efektu bera jaso dezan. 

arregi_15_taula.png

Adibide guztiak gehituta, ikus dezakegu IAk elementu ugari galtzen dituela; akatsak egiten ditu bigarren adierak itzultzean; darabiltzan kolokazioak ez dira hain naturalak, eta erregistroarekin ez du asmatu, lagunarteko hizkera falta baita. Itzultzaile profesionalek sortutako itzulpenen parekoa izateko, postedizio lan sakona beharko luke, eta, beraz, postedizioaren helburuak (denbora eta dirua aurreztea) ez lirateke beteko.

2. testua: No me cuentes cuentos

Bigarren testu honetan topatutako alde esanguratsuenak honako hauek dira:

Lehen adibide honetan, zenbait itzultzailek esaldien ordena aldatu dute, euskarazko esaldiaren ulermena errazteko. Itzultzaile automatikoak jatorrizko testuaren egiturari jarraitu dio, eta atzerakarga nabaria da euskarazkoan. Giza itzultzaileek, ordea, aditza aurreratu egin dute. Gainera, erlatibozko esaldi luze baten ordez, bi itzultzailek kausazko menpeko perpausak baliatu dituzte, eta beste biek, erlatiboa mantendu duten arren, aldaketak ere egin dituzte, esaldia ulergarriagoa egin nahian. 

arregi_16_taula.png

Hona hemen beste adibide bat: bi kasutan, eta juntagailua erabili dute; beste itzultzaile batek, -(e)n menderagailua erabili ordez, non elementuaren bidez sortu du erlatiboa, eta azken itzultzaileak, objektu zuzena mantendu ordez, adizlagun bihurtu du.

arregi_17_taula.png

Orokorrean, IAren eta itzultzaile profesionalen arteko aldeek sintaxiarekin dute zerikusia. Adibide hauetan, itzultzaile guztiek egin dituzte aldaketak, gaztelaniazko egituratik aldenduz baina mezua argiago helaraziz. Gainerakoan, badago desberdintasunik, baina itzultzaile bakoitzaren estiloarekin du zerikusia. Giza itzultzaile bakoitzak lexiko eta esamolde desberdinak erabili ditu, baina IAk emandakoen sinonimoak dira guztiak.

arregi_18_taula.png

Kasu honetan, zaila litzateke esatea IAren itzulpena egokia ez denik. Testua laua denez, ez dago estilo edo erregistro aldetik zaindu beharreko elementu askorik. Hala ere, IA erabiltzeak ekar lezake egitura batzuk finkatzea, eta itzultzaile profesionalek gehitzen dioten aberastasuna eta dibertsitatea galtzea. 

arregi_19_taula.png

3. testua: Carlos Ruiz Zafón, La sombra del viento

Hirugarren testu honetan, aurrekoarekin bezala, alde nabarienak sintaxian hauteman ditut. Hori bai, bigarren testuan ez bezala, IAk zenbait ñabardura galdu ditu, erabili duen lexikoaren ondorioz. Hona hemen adibide batzuk.

Lehen adibidean, hasiera batean «ilunpe» eta «ilunantz» sinonimoak direla iruditu arren, sakonago aztertuta, IAk ñabardura bat galdu du «ilunpe» erabilita. Izan ere, hau da Real Academia Españolaren (RAE) hiztegiak penumbrari ematen dion definizioa: «Sombra débil entre la luz y la oscuridad, que no deja percibir dónde empieza la una o acaba la otra». Euskaltzaindiaren arabera, ilunpe «argirik edo argitasunik eza» da; ilunantz, ordea, «argitasun ahula». Bi hitzen arteko aldea ez da hain handia, baina kontuan hartu beharrekoa da IAk ñabardura txikiak galtzen dituela, batez ere literatur testuei buruz ari garelako. Hain zuzen, IAk behin baino gehiagotan galtzen ditu ñabardura txiki horiek testuan.

Bestalde, IAk kalkoak sortu ditu testu honetan, horretarako beharrik gabe. «Fabuloso» itzultzeko, adibidez, fabulatsu hitza sortu du. Itzultzaileek frogatu bezala, euskaraz badaude aukera egokiak hori itzultzeko.

Azkenik, «poblado» itzultzeko, adiera okerra baliatu du: «jendeztatu». 

arregi_20_taula.png

Adibide honetan, berriz, «osatutako» elementua errepikatzen du IAk esaldi berean. Estilistikoki, ez da erabakirik txukunena, bai baitaude beste baliabide batzuk errepikapen hori ekidin nahi izanez gero, itzultzaileen adibideetan ikus daitekeen moduan. Bestalde, aipatzekoa da gaztelaniazko «tramar» aditza itzultzeko «osatu» erabili izana, itzultzaile profesional guztiek erabili baitute «bilbatu». Literatur testuez ari garela kontuan izanda, ez dago arrazoirik metafora hori alde batera uzteko.

«Cúspide» itzultzeko, berriz, IAk «gailur» erabili du. Euskaltzaindiak hitz horri ematen dizkion definizioen artean, hirugarrenak balio lezake testuinguru honetan gaztelaniazkoaren baliokide gisa: «Teilatuaren goiko ertza, teilatu gailurra». Itzultzaile profesional guztiek, ordea, «erpin» erabili dute itzultzeko, eta hobeto transmititu dute irudia. Izan ere, RAEren hiztegiak honela definitzen du cúspide: «Remate superior de algo, que tiende a formar punta».

Pasarte berean, hiru itzultzaileetatik bik, esaldia aldatu, eta, erlatiboaren ordez, juntagailu konjuntiboa erabili dute. Gaztelaniaz ez bezala, euskaraz ez dugu erlatiboak pilatzeko ohiturarik, ulermena oztopatzen baita hori eginez gero. IAk berak ere ez du -(e)n menderagailurik erabili erlatiboa osatzeko, baina, hala ere, esaldia astun samar geratu da. Bestalde, uste dut aipagarria dela hirugarren itzultzaileak esaldia beste modu batean ulertu izana. Izan ere, gaztelaniazkoan, anbiguoa gerta liteke identifikatzea erlatiboak zeri egiten dion erreferentzia; zubiei soilik, edo baita tunel, harmailadi eta plataformei ere.

arregi_21_taula.png

4. testua: Federico García Lorca, La casa de Bernarda Alba

Aurreko atalean ikusi dugun bezala, laugarren testu honetan egin ditu IAk akats gehien, eta, beraz, hemen daude desberdintasun nabarmenenak giza itzultzaileekin alderatuta.

Erregistro aldetik, itzultzaile guztiek erabili dute noka neskamearen eta Ponciaren arteko elkarrizketetan. Testuinguruari primeran datorkion erabakia da: bi pertsonaiak elkarren ezagunak dira, eta komunikazio egoera informala da. Informazio hori irakurleak inplizituki jasotzen du testua irakurri ahala. IA, ordea, gaur egun ez da gai testuaren erregistroa identifikatzeko.

arregi_22_taula.png
arregi_23_taula.png

Pasarte batzuetan, estiloa eta efektua galdu egin dira itzultzaile automatikoarekin. Testu honen ezaugarrietako bi ahozkotasuna eta lagunarteko hizkera dira. IAk galdu egiten ditu elementu horiek, eta itzulpenak transmititzen duen sentsazioa desberdina da. Itzultzaile profesionalek, denotazioaz gain, konnotazioa ere kontuan izan dute, eta testuinguruaren arabera zentzu negatiboa duten hitzak erabili dituzte: «gangartsua», «marimaistra»…

arregi_24_taula.png

RAEren arabera, gori-goriren esanahia hauxe da: «Canto lúgubre de los entierros». Adibide honetan, itzultzaile automatikoak hitzez hitz itzuli du, seguruenik datu basean gorde gabe duen esamoldea baita. Giza itzultzaileek, ordea, arazorik gabe identifikatu dute esanahia, eta euskarazko esamoldeak erabili dituzte itzultzeko. IP6 itzultzaileak, gainera, kutsu informala ere mantendu du.

arregi_25_taula.png

Testu honetan ere, bigarren adierek arazoak sortu dizkiote IAri. Kanpaien hotsa itzultzeko, «bikoitz» erabili du, hau da, «doble»ren adieretako bat, baina okerra testuinguru honetan. Bestalde, «metido entre las sienes» esamoldea hitzez hitz itzuli du. Euskaraz, ulertzen da kontzeptua, baina, beste adibideetan ikus dezakegunez, itzultzaileek euskarazko berezko esamoldeak baliatu dituzte, hitzez hitzeko itzulpenera jo beharrik gabe.

arregi_26_taula.png

Argi ikus daiteke giza itzultzaileek sortutako testuek hobeto transmititzen dutela jatorrizko testuen zentzua eta tonua. IAren eta giza itzultzaileen arteko aldea nabaria da, baita ia akats objektiborik ez duten testuetan ere.

Lehen eta laugarren testuetan, IAren akatsak nabariak dira. Laginak zuzentzea ez litzateke nahikoa izango giza itzultzaileek sortutako testuen emaitza parekide bat lortzeko. Jatorrizko testuaren erregistroa galdu egin da IArekin, eta adierak ez dira ongi itzuli. Giza itzultzaileek, berriz, testuaren zentzua eta tonua mantendu dituzte, eta itzultzaile automatikoak egin ezin ditzakeen ñabardurak gehitu dizkiote testuari. Itzultzaile profesionalek askoz estrategia gehiago dituzte eskura, eta, dudarik gabe, haien emaitza askoz hobea da.

Bigarren eta hirugarren testuei dagokienez, azterketak erakutsi digu testu horietan ere jatorrizko testuaren ñabardura batzuk galdu dituela IAk eta, beraz, jatorrizko idazlearen efektua ez dela behar bezala helarazten. Gainera, itzultzaileek, esaldien egiturak aldatuz, euskaraz ulergarriagoa den sintaxi bat baliatu dute, mezua aldatu gabe testua irakurtzea errazagoa izan dadin euskal irakurlearentzat. Beraz, bi testu horien kasuan ere, IAk ez du giza itzultzaileen kalitatea lortu.

Ondorioak

IAren arloan, garapen handia izan da azken urteotan, batez ere euskarari dagokionez; 2018az geroztik, hiru itzultzaile neuronal ditugu eskura, eta gero eta emaitza hobeak ematen dituzte. Hala ere, ikusi dugu IA kontuz erabili behar den baliabidea dela. Literatur testuei dagokienez, batzuetan, emaitzak ez dira kalitatezkoak, eta, beste batzuetan, akats objektiborik egin ez arren, alde handia dago giza itzultzaileek egindako itzulpenekin.

Kontuan izan behar dugu lan honen ondorioak testuinguru batean kokatu behar direla, azterketa mugatua egin baitugu. Itzultzaile automatiko bakarrak itzulitako lau testu soilik ikertu ditugu, eta 7 itzultzailek osatutako talde txiki batek egindako itzulpenekin alderatu. Testuinguru horretatik kanpo ezin jakin daiteke zer-nolako emaitzak ematen dituen itzultzaile automatikoak, eta zer-nolako aldea egongo litzatekeen itzultzaile gehiagorekin alderatuz gero. Beraz, lan honetatik atera ditugun ondorioak ezaugarri horiei soilik aplika diezazkiekegu. Gainera, itzultzaile automatikoa etengabe garatzen ari denez, garrantzitsua iruditzen zait lan hau 2021eko maiatzean osatu dugula aipatzea, oso litekeena baita etorkizunean horrelako azterketa bat eginez gero itzultzaile automatikoek sortutako testuen kalitatea hobea izatea. Dena dela, hizkuntzak ere aldatu egiten dira denboraren poderioz, eta itzultzaile automatikoa beti joango da haien atzetik, ezin baita aurreikusi zer aldaketa gertatuko diren hizkuntza batean.

Azpimarragarria da IA ez dela sortu literatur testuak itzultzeko, eta hori ez dela, gaur egun behintzat, funtzioetako bat. Administrazio arloan erabiltzen da, adibidez, hango hizkera finkatuta baitago, eta dokumentuen arteko aldeak mugatuak baitira. Gainera, itzulpen-memoriekin batera egin dezakete lan, dokumentuak ez baitira hain desberdinak elkarren artean. Literaturan, baina, testu bakoitza mundu bat da, idazleen subjektibotasunak paper garrantzitsua baitu. Bigarren adiera eta metafora ugari daude, eta, orokorrean, hizkera poetikoagoa eta konnotatiboagoa erabiltzen da. Idazle bakoitzak bere estiloa du, eta hizkuntz baliabide batzuk edo beste batzuk erabiliko ditu horren arabera. Administrazio testu batek, itzultzaile automatikoaren datu basean sartu, eta hurrengo baterako balio lezake. Literatur testu bat datu basean gordetzeak, ordea, ez du bermatzen IA beste literatur testu bat itzultzeko gai izango denik. Are gehiago, testuingurua hain denez garrantzitsua literaturan, agian kalte handiagoa sortuko luke, testu batean baliokideak izan daitezkeen bi hitzek beste testu batean agian ez dutelako zerikusirik.

Ikerketa honekin, zenbait arrisku ikusi dizkiogu IAri. Postedizioaren helburua ahalik eta gutxien ahalik eta azkarren zuzentzea den heinean, nire ustea da IAk behar baino gehiago baldintzatuko lukeela amaierako emaitza. Lan honen azterketan ikusi dugu giza itzultzaileek estrategia ugari erabili dituztela pasarte konplexuenak itzultzeko; IAk, berriz, kalkoetara eta hitzez hitzeko itzulpenetara jo du. IAn soilik oinarrituz gero, inolako filtrorik gabe, euskaraz berezkoak ez diren egiturak finka litezke, eta erabiltzaile orokorrak arazoak izan litzake akatsak identifikatzeko.

IA aukera egokia izan liteke testu jakin batzuen ulermenerako erabili nahi izanez gero, hori baita itzultzaile automatikoaren funtzioetako bat: itzulpen perfektua lortu nahirik gabe, ulergarria izan daitekeen itzulpen bat jasotzea xede hizkuntzan. Noski, dudan jartzekoa da zer puntutaraino ulertu nahi den literatur testu bat idazlearen estiloa jaso gabe, baina testua ulertzeko baliagarria izan liteke itzultzaileentzat, batez ere atzerriko hizkuntzetatik itzuli nahi bada. Hala ere, testua kontuz hautatu behar da, IAk ez baitu beti bermatzen informazioa berdin transmitituko duenik.

Itzultzaile automatikoa baliabide aparta izan daiteke, hiztegiak edo corpusak bezala, baina ezin da izan testuen itzulpenak egiteko tresna bakarra.

BIBLIOGRAFIA

Euskaltzaindia. (D.g.). Euskaltzaindiaren Hiztegia. [Kontsulta: 2021-04-15]

Eusko Jaurlaritza. (D.g.) Itzuli. [Kontsulta: 2021-03-26]

García Lorca, F. (2017). La casa de Bernarda Alba. Alacant: Biblioteca Virtual Miguel de Cervantes (Jatorrizkoaren argitalpen-data: 1954).

García Sáenz de Urturi, E. (2016). El silencio de la ciudad blanca. Bartzelona: Planeta.

Poibeau, T. (2017). Machine Translation. Londres - Cambridge: The MIT Press.

Real Academia Española. (2014). Diccionario de la lengua española (23. ed.).

Ruiz Zafón, C. (2001). La sombra del viento. Bartzelona: Planeta.

Zenbaiten artean. (2019). No me cuentes cuentos. Bartzelona: Montena.