Postedizio Lantegia: ikastaroaren gakoak
Uxoa Iñaurrieta (UEU eta UPV/EHU) eta Nora Aranberri

Artikulu hau EIZIEk 2020an antolaturiko Postedizio Lantegiaren kronika moduko bat da. Lehenik, ikastaroan landutakoen berri jaso dugu irakasleok: zer eduki teoriko-praktiko landu genituen, zer-nolako harrera izan zuten gure ustez, eta zer ondorio atera genituen. Bigarren zatian, berriz, bost lan-esparrutako parte-hartzaileen ekarpenak jaso ditugu.

EIZIEk antolaturik, joan den urteko martxoan ginen Postedizio Lantegia eskaintzekoak, aurrez aurre, baina, pandemia-egoerak beharturik, bertan behera utzi behar izan genuen gure plana. Azkenean, online modalitatera egokitu, eta udazkenera atzeratu genuen ikastaroa: bi asteko hiru txanda egin genituen, hogei lagun inguruko talde banatan, irailean eta urrian.

Lantegiaren nondik norakoez arituko gara artikulu honetan, bai irakasleon ikuspuntutik eta bai ikasleenetik ere. Lehenik, ikastaroa nola antolatu genuen azalduko dugu: zer eduki teoriko landu genituen, zer jarduera praktiko egin, eta zer atera genuen talde-eztabaidetatik. Irakasleon balorazioaren berri emango dugu ondoren, eta, gero, ikastaroan parte hartu zuten bost ikasleri emango diegu hitza, nork bere esparrutik ekarpena egin dezan:

  • Idoia Gillenea, Hitzurun enpresako interpretea: «Itzultzaile automatikoa, interpretazioaren mesedegarri».
  • Alaitz Zabaleta, Euskarabideko itzultzailea: «Postedizioaz Administraziotik».
  • Lierni Garmendia, itzultzaile eta lokalizatzaile autonomoa: «Lokalizazioaren industria: ur handitan».
  • Isabel Etxeberria Ramírez, UPV/EHUko irakaslea eta itzultzailea: «Itzultzaile automatikoak, postedizioa eta irakaskuntza».
  • Ixiar Iza, Elhuyarreko itzultzailea: «NMTa itzulpen profesionalean».

Online ikastaroaren antolamendua

Ikastaroa Moodle plataforman oinarritu genuen, EIZIEren ikasgela birtualean, eta hantxe jarri genituen material eta jarduera guztiak. Bi atal nagusitan banatu genuen ikastaroa, eta atal bakoitzak bere bideo sorta, jarduera praktiko bat edo bi, eta Jitsi plataformaren bidezko saio sinkrono bana izan zuen. Goazen banan-banan, azalpen gehixeago emateko.

1. Azalpen-bideoak: itzultzaile automatikoak eta postedizioa

Esan bezala, bideoen bitartez azaldu genituen atal bakoitzeko eduki teorikoak. Lehen astean, sarrera gisa, begiratua egin genion euskarazko itzultzaile automatikoen bilakaerari: datu historiko gutxi batzuen ostean, erregeletan oinarritutako sistemen, estatistikan oinarritutakoen eta sistema neuronalen ezaugarri nagusiak azaldu genituen, mota bakoitzak zer-nolako emaitzak ematen dituen erakusteko. Izan ere, adibideen bitartez erakutsi genuenez, itzultzaile automatiko batzuek eta besteek egiten dituzten akatsak oso desberdinak izaten dira, eta, tresnaren emaitzei etekinik aterako badiegu, garrantzitsua da nolako tresnarekin ari garen jakitea.

Aldeak labur-labur azaltzeko, esan genezake erregeletan oinarritutako sistemen akatsak askoz ere errazago aurreikusten (eta identifikatzen) direla eta beste bi sistemenak, berriz, nekezago (Aranberri eta Labaka, 2017; Cortés, 2017). Arrazoi nagusia zera da: erregeletan oinarritutako sistemek arauak eta hiztegiak dituzte oinarrian, eta, egitura edo hitz jakin batek arazorik sortzen badie, ez die behin bakarrik sortzen, baizik eta egitura edo hitz jakin hori itzulgaian agertzen den aldiro, sistematikoki. Gaur egun gehien erabiltzen diren sistemekin, aldiz, neuronalekin, ez da halakorik gertatzen: testu-corpusak dituzte oinarrian, eta, horri esker, itzulpen natural-naturalak sortzen dituzte maiz, baina ez beti zuzenak, eta oso adi egon beharra dago zenbait akats identifikatzeko, edukiari dagokionez bereziki (geroxeago emango ditugu adibide batzuk, 2.1. atalean, lehen ariketa praktikoaren berri ematearekin batera).

1.1. Postedizioa zer den (eta zer ez den)

Sarreraren ondoren, gertuagotik begiratu genion ikastaroaren aztergai zehatzari, hots, postedizioari. Euskal itzultzaileen artean gero eta gehiago zabaltzen ari bada ere, praktika berri samarra da gurean (Cortés eta Jauregi, 2019), eta, askotan, jendeak ez du oso argi izaten zertaz ari garen postedizioaz ari garenean: itzulpena da? Zuzenketa da? Bada, badu pixka bat bietatik, baina ez da ez bata eta ez bestea zehazki (Sánchez eta Rico, 2020). Horixe argitzen saiatu ginen bigarren asteko bideoetan:

  • Ez da itzulpena, testu bat itzultzerakoan itzulgaitik bakarrik abiatzen garelako; posteditatzerakoan, aldiz, itzulgaia ez ezik, haren itzulpen automatikoa ere izaten dugu, eta haren gainean egiten dugu lan. Hortaz, labur esateko, itzulpen-prozesuan bi testu nagusi sartzen dira (itzulgaia eta itzulpena), baina, postedizio-prozesuan, hiru (itzulgaia, itzulpen automatikoa eta testu posteditatua).
  • Bestalde, zuzenketa ere ez da, ez delako gauza bera pertsona batek eginiko testu bat zuzentzea eta makina batek eginikoa zuzentzea, batean eta bestean zuzendu beharreko akatsak oso desberdinak baitira.

Ideia horiek, begi-bistako samarrak badirudite ere, ez dira hain argiak oraindik jende askorentzat, gure arteko profesional askotxok jasotzen baitituzte lan-enkarguak okerreko terminoa erabiliz eta, sarritan, behar beste azalpenik gabe. Ikastaroan, adibidez, parte-hartzaile batek baino gehiagok kontatu zuen inoiz «zuzenketa-lanak» eskatu izan dizkietela baina lanean hasitakoan ohartu direla automatikoki itzulitako testu baten gainean ari zirela. Halakoek eragin zuzena dute profesionalon jardunean, eta, kalitatezko lanak egin ahal izateko, eta baldintza onetan, garrantzitsua da ondo bereiztea jarduera bakoitza zertan datzan. Guk geuk jakin beharra dugu lehenik, komeni denean bezeroei ere azalpenak emateko edo eskatzeko.

Esan beharra dago, dena den, postedizioari askotariko definizioak eman izan zaizkiola literaturan, eta, zer ez den esaterakoan egile gehienak bat badatoz ere, zer den esaterakoan ez dagoela halako adostasunik. Guk, lantegirako, O’Brienen (2011) definizioa aukeratu genuen, nazioartean onarpen gero eta zabalagoa duen heinean: giza itzultzaile batek itzultzaile automatiko baten emaitza gordinaren gainean egiten duen zuzenketa-lana da, gidalerro jakin batzuen eta aldez aurretik ezarritako kalitate-irizpide batzuen araberakoa.

Hiru gako funtsezko aipatzen dira definizio horretan: nork egiten duen postedizio-lana, zeren gainean egiten den eta zer kalitate-irizpideren arabera. Izan ere, azken puntu horrek ere berebiziko garrantzia du: postedizio-lanak enkargatzen direnean, ez da beti espero izaten emaitzak eskuzko itzulpenek adinako kalitatea izango duenik, eta bi postedizio maila bereizi ohi dira.

1.2. Postedizio arina eta sakona

Askori, hasieran, harrigarria egiten zaie esan berri dugun hori, baina bai, halaxe da, bi postedizio maila bereizi ohi dira, emaitzan espero den kalitatearen arabera: postedizio arina eta sakona. Testuari emango zaion erabileraren arabera eskatzen dute bezeroek bata ala bestea:

  • Postedizio sakonaren emaitzei dagokienez, espero da pertsonek eginiko itzulpenen kalitatearen parekoa izango duela. Hortaz, testu itzulia argitaratzekoa edo zabaltzekoa bada, hauxe da postedizio maila egokia.
  • Postedizio arina eskatzen denean, berriz, espero da ulertzeko moduko testuak lortuko direla, baina ez kalitate bikainekoak. Postedizio maila honen bidez sortzen diren testuak ez dira zabaltzeko izaten, eta irakurle gutxirentzat eta oso erabilera jakinetarako bakarrik izaten dira (esate baterako, enpresa handiren batean hainbat hizkuntzatako langileak badituzte eta langile horiei euren hizkuntzetan eman nahi bazaizkie argibideak).

Jakina, hori hala izanik, zuzendu beharrekoak ere desberdinak izaten dira maila batean eta bestean. Bien arteko mugak lauso samarrak dira, baina, nazioartean erabiltzen diren zenbait gidalerrotan, jasotzen dira gomendio orokor batzuk. Beheko taulan jaso ditugu baterako eta besterako zuzenketa-irizpide nagusiak (Hu eta Cadwell, 2016; Sánchez eta Rico, 2020):

1_taula_iñaurrieta_aranbarri.png
1. taula: Postedizio arinean eta sakonean egin beharreko zuzenketa moten laburpena, nazioarteko gidalerro orokorren arabera

Nolanahi ere, kontuan hartu behar da halako gidalerroak oso orokorrak direla eta ez dutela jasotzen hizkuntzaz hizkuntzako kasu eta adibiderik. Hortaz, askotan, hankamotz samar geratzen dira profesionalei sortzen zaizkien zalantzak argitzeko, eta badira gidalerro propioak sortzen dituzten enpresa eta lantaldeak ere, barne-erabilerarako.

Horraino ikastaroan landutako eduki teorikoen laburpena. Lantegiaren helburua, ordea, postedizio-saiakera batzuk egiten hastea zen batez ere, eta, hortaz, jarduera praktikoek hartu zuten ikastaroaren pisurik handiena.

2. Jarduera praktikoak, haien emaitzak eta talde-eztabaidak

Bideo-aurkezpen gutxi batzuk ikusi ondoren, parte-hartzaileek hiru ariketa egin behar izan zituzten ikastaroan: lehen astean bat, eta bigarrenean beste biak. Hiru testu oso desberdin hautatu genituen itzulgai gisa, parte-hartzaile bakoitzak haietako bat hautatu eta haren gainean egin zitzan ariketak:

  • Euskal Herriko Agintaritzaren Aldizkariko pasarte bat (alegia, testu administratibo bat)
  • Juan José Millás-ek El Paísen argitaratutako beste bat (kutsu literario handiko erreportaje bat)
  • Fisikaren inguruko ikasmaterial bat (hau da, testu zientifiko-didaktiko bat)

Tresnari dagokionez, berriz, PET erabili genuen (Aziz, Castilho eta Specia, 2017), itzultzaile automatikoen emaitzak ebaluatzeko eta postedizio-lanen inguruko datuak ateratzeko erabili ohi den software libre bat. PETen posteditatzea ez da itzulpen-memorietan aritzea bezain erosoa, baina eginiko lanari buruzko datu estatistiko pila bat atera daitezke haren bidez, eta egokia iruditu zitzaigun lehen postedizio-saiakerak egin nahi zituztenentzat, eginikoa xehe-xehe aztertzeko aukera ematen duelako.

Esan bezala, hiru ariketa egin genituen. Nork bere kasa egin zuen jarduera bakoitza, eta talde-eztabaidetan hitz egin genuen haien inguruan. Bigarren saioan, gainera, PETetik ateratako estatistikak ere aurrean izan genituen; bigarren eta hirugarren ariketenak, alegia. Baina konta dezagun zertan zetzan ariketa, banan-banan.

2.1. Lehen ariketa: testu zati bat itzultzea eta beste bat posteditatzea

Lehen jarduera berotze-ariketa gisa planteatu genuen: testu bateko zati bat itzultzea eta testu bereko beste bat posteditatzea. Helburua honako hau zen: parte-hartzaileek lehen postedizio- saiotxo bat egitea, eta zer iruditu zitzaien kontatzea taldekideei.

Oro har, itzultzaile automatikoekin lehen hartu-emana zuten parte-hartzaile gehienek esan zuten, ariketaren txikian, uste zutela posteditatzeak aukera eman zezakeela azkarrago lan egiteko. Euskarazko azken itzultzaile automatiko neuronalak ezagutzen ez zituztenek, gainera, aitortu zuten harritu egin zirela hain emaitza onak lor zitezkeela ikusita.

Hala ere, kontuan hartu behar da jarduera hau postedizioari buruzko inongo argibiderik jaso gabe egin zutela, itzulpen automatikoen bilakaerari buruzko azalpen gutxi batzuk bakarrik entzun ostean, eta jendea zalantzati aritu zen: zenbateraino zuzentzea komeni zen?, estilo- kontuak bere horretan utzi behar ziren, ala testua norberaren egin? Horren haritik, itzulpenen kalitateagatiko kezka ere adierazi zuten zenbaitek: makinak proposatutakoari gehiegi lotzeko joera hartuz gero, ez ote dira alde batera utziko zenbait hizkuntza-egitura, nahiz eta beharbada makinak proposatutakoak baino egokiagoak izan? Itzultzaile automatikoek sormena mugatu zezaketela sentitu zuten parte-hartzaile batzuek.

Lehen ariketa honek itzultzaile automatikoen emaitzak aztertzeko aukera ere eman zigun, eta testu mota batean eta bestean zer-nolako akatsak egiten zituen ikustekoa. Millásen testuan, adibidez, itxuraz ulerterrazena bazirudien ere, zuzendu beharreko askoz akats gehiago zeuden; horietako askok testu barruko erreferentzialtasunarekin zuten lotura, perpausetako subjektua edo objektua jatorrizkoan esplizituki zehaztu gabe ageri zelako. Hona hemen adibide bat (testu osoko traketsenetakoa, ziur asko):

(1) ES:   Le comenté el suceso, como de pasada, al psiquiatra Diego Figuera, pues daba la coincidencia de que había quedado a comer con él para hablar de la ansiedad, sobre la que me había propuesto escribir algo al objeto de entenderla.

      IA:   Gertaeraz hitz egin nion Diego Figuera psikiatrari, antsietateaz hitz egiteko berarekin bazkaltzera geratu zela esan baitzion, eta antsietateari buruz zerbait idaztea proposatu zidan ulertzeko.

Testu administratiboan eta espezializatuan, aldiz, jatorrizkoak askoz ere hizkera esplizituagoan idatzita zeudenez, ez zen halako akatsik topatu. Bai, ordea, zehaztasun eta informazio falta nabarmenak itzulpen automatikoetan. Adibidez:

(2) ES:   ...el departamento competente en materia educativa impulsará y asegurará el uso del euskera como vehículo de expresión habitual en todas las actividades de la comunidad educativa.

      IA:   Horretarako, irakasgaian eskumena duen sailak bultzatuko ditu hezkuntza-jarduera guztiak.

2.2. Bigarren ariketa: bi postedizio motak alderatzea

Behin berotze-ariketa eta lehen talde-eztabaida egindakoan, postedizioaren inguruko argibideak eman genizkien parte-hartzaileei (1.1. eta 1.2. ataletan azaldutakoak), eta, bigarren ariketan, postedizio arin eta sakon bana egin behar izan zituzten.

Talde-eztabaidan, galdetu genien ea bietako zein iruditu zitzaien errazena eta zeinetan aritu ziren erosoago, eta ia denek esan zuten nahiago izan zutela postedizio sakona egin. Izan ere, hasiera batean badirudi postedizio arina errazagoa izango dela, gutxiago zuzendu behar delako, baina askoz ere zalantza gehiago sortu ohi dira: noraino zuzendu, nondik aurrera ez... Askok aipatu zuten, gainera, deserosoa dela zenbait gauza zuzendu gabe uztea, akats batzuk aise ikusten baitira bila ibili gabe ere. Postedizio sakonean, aldiz, beste edozein OLI tresna bezalaxe erabiltzen dira itzultzaile automatikoak, hau da, norberaren lanerako laguntza gisa. Gainera, nahi adina zuzentzeko aukera dagoenez, itzultzaileak bere egiten du testua, eta gusturago geratu ohi da emaitzarekin.

Dena dela, PETetik ateratako datuen arabera, badago alde pixka bat denborari dagokionez: oro har, postedizio arina azkarxeago egin zuten. Batere zuzendu gabe ontzat emandako segmentuak ere askoz ere gehiago izan ziren atal horretan, itzulpen automatikoak erabat zuzenak ez izanagatik ere segmentu asko ulergarriak eta edukiz egokiak iruditu zitzaizkien seinale.

Esan dugunez, parte-hartzaile batzuek ez zuten batere gustuko izan postedizio arina, baina beste zenbaitek ikusi zioten erabilgarritasunik. Batek, adibidez, foru-aldundietako lanaz hitz egin zuen: aztertu beharreko idatziak heltzen zaizkienean bulegora, eskaerak eta gisa horretako dokumentuak, zenbaitetan, gertatzen zaie dokumentu hori aztertu behar duen langilea ez izatea gai hura ulertzeko, hizkuntza ez dakielako; halakoetan, itzulpen horiek pertsona bakarrak (edo oso talde txikiek) irakurtzekoak izango direnez, aukera ona izan omen liteke. Beste parte- hartzaile batek kontatu zuen egin izan dituela halakoak (gaztelaniaz bakarrik, gaur arte behintzat), eta betetzen dutela euren funtzioa. Informatikarekin loturiko enpresa handi batentzako itzulpenak egiten ditu, eta teknikarientzako testu jakin batzuk posteditarazten omen dizkiote era horretan, oso talde txiki eta espezializatuek baino irakurriko ez dituztenak.

2.3. Hirugarren ariketa: produktibitate-proba

Azken jarduera produktibitate-proba bat izan zen, hau da: parte-hartzaileek testu zati bat itzuli eta beste bat posteditatu behar izan zuten (lehen ariketan bezala, baina ikastaroan ikasitakoak kontuan harturik), eta parte-hartzaile bakoitzaren produktibitatearen inguruko datuak atera genituen, PET tresnaren bidez. Datu horien arabera, parte-hartzaile gehien-gehienek egin zuten postedizio-lana hutsetiko itzulpena baino denbora gutxiagoan; batzuek alde handi samarrez, eta beste zenbaitek txikiagoz.

Dena dela, talde-eztabaidetan, PETen mugez ere jardun genuen. Izan ere, badira enpresak gisa horretako probak erabiltzen dituztenak langileei itzultzaile automatikoa erabiltzeko eskatu ala ez erabakitzeko, baina arriskutsu samarra da erabakia horretan bakarrik oinarritzea. Kontuan hartu behar da, gorago esan dugun bezala, software hori ez dela OLI tresna bat, eta ez duela aukerarik ematen normalean erabiltzen ditugun itzulpen-memoriak, glosarioak eta halakoak ere itzulpen automatikoekin batera erabiltzeko. Postedizioan aritzen diren enpresetan, ordea, lan-ingurunea bestelakoa izan ohi da: itzulpen automatikoa gainerako OLI tresnekin batera erabiltzeko aukera izaten da, eta, besteak beste, lehentasuna ematen zaio norberaren itzulpen- memoriak proposatutako aukerari, eta ez itzultzaile automatikoarenari. Hortaz, azken finean, proba lan-ingurune erreal batean egiten ez denez, emaitzak ere ez dira itsu-itsuan aintzat hartzekoak.

3. Oinarrizko gomendioak

Ikastaroa amaitu aurretik, landutako edukiak eta jardueretatik ateratako ondorioak kontuan hartuta, postedizio-lanei ekin aurretik kontuan hartzea komeni den hiru gomendio eman genituen, eta hona ere ekarriko ditugu, Senezen irakurleentzat ere erabilgarriak izan daitezkeelakoan.

  1. Argi izan bezeroak zer eskatzen duen. Zuzenketa-lana eskatzen badizuete baina zuzendu beharreko testua ez badu pertsona batek idatzi, egin beharreko lana ez da egiaz zuzenketa, postedizioa baizik. Horrek asko baldintzatzen du itzultzaile-zuzentzaileon lana, eta komeni da bezeroari hala adieraztea.
  2. Ezagutu erabiliko duzuen itzultzaile automatikoa. Zenbaitetan, itzultzaileak berak aukeratu dezake zein tresnarekin lan egin, baina ez beti: enpresa batzuek euren tresna propioak erabiltzen dituzte, eta tresna horien bidez itzulitako testuak ematen dizkiete itzultzaileei posteditatzeko. Lanik onartu aurretik, komeni da testu zatiren bat behintzat aztertzea eta ziurtatzea erabili den itzultzaile automatikoak baduela nahikoa kalitate, askotan errazagoa baita jatorrizko testua hutsetik itzultzea itzulpen automatiko trakets bat posteditatzea baino.
  3. Itzultzaile automatikoak erabiltzeak azkarrago edo erosoago lan egiteko balio ez badizue, utzi alde batera. Tresna horiek, beste edozein OLI tresnak bezala, onuraren bat ekarri behar diote itzultzaileari: denbora gutxiagoan testu gehiago itzultzeko aukera, edo errazago itzultzekoa, buru-nekea gutxitzekoa... Oro har ez ezik, komeni da kasuan-kasuan ere hala ote den aztertzea, gerta bailiteke itzulpen mota batzuetarako erabilgarria izatea eta beste batzuetarako ez.

Irakasleon balorazioa eta ondorioak

Hiru ikastaroak amaituta, irakasleon balorazioa on samarra izan da oro har: nabari da jendeak baduela interesa gaian, eta lantegi honek aurrerapausotxo bat ekarri du, behintzat, euskal itzultzaileen artean postedizioaren inguruko zenbait kontzeptu argitzeko bidean. Nolanahi ere, beti dago zer hobetua, eta gazi-gozo utzi gaituzten hiru alderdi azpimarratuko genituzke.

Lehenik, lantegia online izateak erabat baldintzatu gaitu. Aurrez aurreko saioetan, askoz ere errazago laguntzen zaio jendeari tresna informatikoek sortzen dituzten buru-hausteekin eta abarrekin; dena online eginda, berriz, nekezagoa da, eta ohartu gara erabili ditugun tresnekin hain ondo moldatu ez diren parte-hartzaileentzat etsigarri samarra izango zela, ziur asko, ezin asmatu ibiltzea. Gainera, talde-eztabaidak bideo-dei formatuan egiteak ere ez du laguntzen parte-hartzea sustatzen; aurrez aurreko eztabaidak biziagoak eta aberasgarriagoak izan ohi dira, pantailaz bestalde segundo gutxi batzuetako isiluneak ere luze samarrak egiten baitzaizkigu askori.

Bigarrenik, aipatu nahi genuke gure ustez alde handia egon dela lehen ikastarotik hirugarrenera. Antolamendua eta edukia berdin-berdinak izan badira ere, lehenengotik bigarrenera ikasi egin dugu, eta bigarrenetik hirugarrenera ere bai. Talde-eztabaidak dinamizatzerakoan bereziki eragin digu horrek, eta azken taldearekin gauzak arinago joan direlakoan gaude.

Eta, azkenik, ikastaroa prestatzerakoan zail samarra egin zaigun beste gauza bat: parte- hartzaileen artean denetarik zegoen, bai itzultzaile automatikoak ia inoiz erabili ez zituztenak, bai eta egunero-egunero erabiltzen dituztenak ere. Batzuentzat zailagoa izango zen besteentzat baino, eta ikastaroari ateratako etekina ere, jakina, ez zen berdina izango kasu guztietan.

Baina, hori guztia kontuan hartuta ere, uste dugu bazegoela (eta badagoela) beharra euskal itzultzaileen artean postedizioa lantzekoa, eta pozik gaude bide horretan gure aletxoa jarri izanagatik. Pozteko modukoa da, halaber, EIZIE elkartea eta bazkideak horretan aurrera egiteko gogotsu daudela ikustea ere. Lantegi honetan eginikoa postediziorako lehen hurbilpen txiki bat baino ez da izan, baina, aurrera begira, ikastaro aurreratuagoak eskaintzea komeniko da ziur asko, gaian gehiago sakontzeko eta, adibidez, itzulpen automatikoa eta bestelako OLI tresna batzuk (itzulpen-memoriak batez ere) nola uztartu ikasteko.

ERREFERENTZIA BIBLIOGRAFIKOAK

ARANBERRI, N. eta LABAKA, G. (2017). Euskarazko Itzulpen Automatikoa. Senez, 48: 219-228.

AZIZ, W., CASTILHO, S. eta SPECIA, L. (2012). PET: a Tool for Post-editing and Assessing Machine Translation. Language Resources and Evaluation Conference 2017: 3982-3987.

CORTÉS, I. (2017). Begirada bat itzulpen automatikoko sistemen bilakaerari. Elhuyar: zientzia eta teknika 327: 40-41.

CORTÉS, I. eta JAUREGI, S. (2019). Itzultzaile automatikoa: mehatxua ala aukera? Senez, 50: 225-230.

HU, K. eta CADwELL, P. (2016). A comparative study of post-editing guidelines. Baltic Journal of Modern Computing, 4(2): 346-353.

O’BRIEN, S. (2011). Towards predicting post-editing productivity. Machine translation, 25(3): 197-215.

SáNCHEZ, M.D.M., eta RICO, C. (2020). Traducción automática: conceptos clave, procesos de evaluación y técnicas de posedición. Comares argitaletxea.


Ikastaroko parte-hartzaileen ekarpenak

Itzultzaile automatikoa, interpretazioaren mesedegarri
(Idoia Gillenea, interpretea)

Zalantzarik gabe, itzultzaile automatikoa indar betean iritsi da interpretazioaren arlora, gelditzeko asmoz. Pandemiaren ondorioz interpretazio arloak intendentzia arloan izan dituen aldaketa handiez gainera (aurrez aurrekotik urruneko moldera pasatzea), egundoko bultzada izan du itzulpen neuronalari esker, kalitatearen mesedetan, noski.

Batetik, denok genekien urruneko interpretazioa bazegoela, hau da, posible zela urrunetik interpretazio bat eskaintzea, eta horixe izango zela etorkizun zertxobait «urruna», batzuek, behintzat, ezagutuko ez genuena. Eta bagenekien, gainera, martxan zela aukera, baina Euskal Herrian ez genuen halakorik egiten, kasuren bat kenduta. 2020ko martxoko egoera zen hura. Handik aurrera, denok dakigu zer etorri zen, eta, etorri zenarekin batera, urruneko interpretazioan murgildu ginen, lanean jarraitu nahi bagenuen behintzat. Beharra, gizakion akuilu nagusia.

Baina ez dagokit urrunekoan sartzea artikuluxka honetan, itzulpen neuronalak ekarri digun horretan baizik.

Itzulpen neuronala etorri aurretik, interpreteok gogotik izerditu izan gara lana aurrera ateratzeko. Batetik, gure lanaren zati bat da bezeroengandik dokumentazioa eta informazioa lortzea, ekitaldi baten aurretik lana behar bezala prestatu ahal izateko. Zer gertatzen zen eta zer gertatzen da, gehienetan? Dokumentazioa aurreko arratsaldean iristen dela, edo egunean bertan. Gizakion beste ezaugarri bat, azken unera arte gauzak behin betiko ez bukatzea.

Dokumentazioa horren berandu iritsita, astirik ez, jakina, itzultzeko edo prestatzeko. Beraz, inprimatu, edo ordenagailuan bertan egiten genituen gure markak, jartzen genituen koloreak, esaldi korapilatsuen itzulpena egin, hau da, irakurtzeko edo interpretatzeko prestatu. Agonia. Eta, interpretatzeko orduan, gure sinbologia edo markatze lan guztia aprobetxatzen jakin behar izaten genuen, eta hori ez da batere erraza. Master bat egiteko moduko ekintza. Batzuetan asmatu, bestetan huts egin.

Gaur egun, berriz, egoera % 100 aldatu da. Aurretik aipatu dudan gizakion ezaugarri hori ez da aldatu, pentsatuko duzuen bezala. Oraindik ere, dokumentazioa berandu samar iristen da, une desegokiren batean (goizeko ordu txikietan, uste baino sarriago) edo beste zerbaitekin lanpetuta gabiltzanean. Orain, ordea, itzultzaile neuronala dugu. Nork bere gustukoa, edo, hizkuntza konbinazioaren arabera, normalean emaitza onenak ematen dituena. Eta, horrela, dokumentazioari aurre-edizio txiki bat egiten diogu; neuronaletik pasatu, eta, ondoren, edizio-ondokoa egiten diogu. Edizio- ondokoak laguntzen digu gaian sakontzen eta ekitaldian benetan landuko dena barneratzen. Neuronalaren emaitza nork egokien ikusten duen moduan ekoizten du, kabinan edo lantokian erabiltzeko. Interprete batzuek papera nahiago dute; beste batzuek, berriz, zuzenean pantailatik interpretatzen dute. Edo bi moduak erabiltzen ditugu, denak laguntzen baitu interpretazioa bezalako jardun zailean, halakoa da eta.

Aurrekoa egin daiteke aurretik ordu batzuk dituzunean, egun bat behinik behin. Batzuetan, ordea, bezeroak kabinako atean agertzen dira azken orduko paperezko dokumentazioarekin. Garai batean, paperak hartu, eta nola hala prestatzen genituen, gure markekin, presaka, urduritasunak jota, saioa hastear, bakarrik geundela askotan. Gaur egun, ordea, dokumentazioari argazki bat atera, eta, aplikazio bati esker, digital bihurtzen dugu, eta, ondoren, aurreko prozesu osoari ekiten diogu; itzulpen neuronala erabiltzeari, alegia. Adibide batzuk jartzearren, udal bateko alderdi baten azken orduko mozio bat izan daiteke, edo goitik behera irakurriko duten akademia arloko hitzaldi luze bat ere bai.

Gure bizitza aldatu egin da. Orain, behintzat, eskuratutako dokumentazioa erabat edo ia erabat prestatua izaten dugu. Lasaiago jarduten dugu, oro har, segurtasun askoz handiagoarekin, eta hori guztia interpretazioaren kalitatearen mesedetan da. Lasaitasuna eta segurtasuna, besteak beste, interpreteak behar dituen giltzak dira. Euskarri bat, behintzat, lana aurrera ateratzeko, patxadaz.

Eta, amaitzeko, ahots errekonozimendua ere badator... eta izan ditzakeen hamaika aukera. Hemendik aurrera, itzulpen neuronala gehi itzulpen memoriak, urruneko interpretazioa, testuen digitalizazioa, ahots errekonozimendua... hasiera besterik ez da.

Garaiak aldatu dira.

Postedizioaz Administraziotik
(Alaitz Zabaleta, Euskarabideko itzultzailea)

Itzulpen automatikoa XX. mendeko 40ko eta 50eko hamarkadetan hasi zen garatzen, baina benetako iraultza teknologia neuronalak ekarri du, eta, gurean, euskarari dagokionez, aldea nabarmena izan da. 2018tik, baditugu euskarazko itzultzaile neuronal onak, eta pixkanaka hasi da teknologia hori gure egunerokoan sartzen; orain, itzultzaileok hausnartzen hasi behar dugu nola erabili gure lanean. Hasteko, beharrezkoa dugu prestakuntza jasotzea, eta, horregatik, eskertzekoa iruditzen zaigu EIZIEk postedizioaren gaineko ikastaro bat antolatu izana. Ikastaroa beharrezkoa zen, eta beharrezkoak izanen dira gehiago ere. Dena dela, aipatzekoa da nazioartean oraindik urriak direla gai honen gaineko ikerketa eta irizpide-protokoloak.

Ikastaroan ikusi ahal izan genuenez, Euskal Herriko itzultzaileen artean, itzultzaile neuronalen erabilera desberdina da: batzuek erabiltzen dute egunerokoan, besteek tarteka, eta beste batzuek oraingoz batere. Administrazioaren arloari dagokionez ere, egoera desberdinak ditugu; batzuek OLI tresnetan integratua dute; guk, berriz, Nafarroako Gobernuaren Itzulpen Atalean, aipatu bada ere, oraingoz ez digute Tradosen txertatu. Beharbada, lagungarria izan liteke nazioarteko administrazioetan nola jokatu duten begiratzea, hiztun gehien dituzten hizkuntzetan lehenago hasi baitziren kontu honekin.

Oro har, teknologia honekiko denetariko jarrerak sumatzen dira itzultzaileen artean: batetik, erabilgarritasuna ikusten zaio, hainbatetan buru-nekea arintzen baitu, eta azkarrago itzultzen lagundu, baina kezkak ere badaude: bezeroek zer jarrera hartuko duten, gure estiloa baldintzatuko ote duen, hori ez dela «benetan itzultzea», posteditatzea itzultzea baino aspergarriagoa dela, ez hain sortzailea, eta abar.

Ikastaroan egindako ariketetan ikusi genuenez, aldeak alde, azkarragoa da posteditatzea hutsetik itzultzea baino, baita postedizio lan sakona egin zutenen kasuan ere. Dena den, euskarazko itzultzaile neuronalak erabiltzean, bai ikastaroan bai lantokian egindako probetan ikusten da, oro har, hobeki moldatzen direla oraingoz testu administratiboekin, literarioagoak direnekin baino. Izan ere, testuak bigarren esanahia, ironia, ñabardurak eta halakoak dituenean, ez dabiltza hain fin neuronalak (beharbada hor eragina izanen du sistema elikatzeko erabili den corpusak). Hori dela eta, bigarren motako testuekin, zenbaitetan, posteditatzea ez da norberak itzultzea baino produktiboagoa.

Hemen, aipatzekoa da ea «produktibitatea» diogunean azkartasuna bakarrik dugun buruan ala kalitatea ere aintzat hartzen dugun. Izan ere, irudi erretorikoak, zentzu figuratuak, konnotazioak eta abar dituenean jatorrizkoak, edo kulturari lotutako elementuak, nola ekarri horiek xede hizkuntzara? Testua ez bada informatibo edo funtzional hutsa, erreferentzia kultural eta sozialak baditu, itzultzaileak adi ibili behar du. Kasu horietan, asko zaindu behar da kalitatea, eta horrek esan nahi du abiadura ez dela hain handia izanen.

Horrekin batera, estiloa, euskarari dagokionez, auzi garrantzitsua da, oraindik hobetzen eta fintzen ari baikara euskal testugintza, eta horretan itzulpengintzak badu bere pisua. Are gehiago Administrazioan, tamalez oraindik gehiena erdaretan sortzen baita. Lan handia dugu oraindik euskarazko testu administratiboen komunikagarritasuna hobetzeko bidean, eta, itzulpena bada testu horiek sortzeko iturri nagusia, itzultzaile neuronalen esku utzi behar dugu estiloa markatzea?

Izan ere, itzultzaile automatikoak aukera batzuk hartzen ditu, eta bere bidetik eramaten zaitu. Ikastaroan, ariketa bat egin genuen: testu baten lehenbiziko zatia hutsetik itzuli, eta gero testu horren bigarren zatia posteditatu, itzultzaile neuronalak emandako emaitzaren gainean. Ariketaren helburu nagusia bi zatietan izandako abiadura konparatzea bazen ere, aipatzekoa da estiloan ere badela aldea: hutsetik hasitako testuan, bide asko har ditzake itzultzaileak, baina, testu hori bera hasieratik neuronalarekin eginez gero, makinak bide bat markatzen du, eta egon zitezkeen beste aukerak itzaliak gelditzen dira itzultzailearen buruan.

Bide beretik, Tradumàtica aldizkarian argitaratu denez (Sánchez-Gijón eta Piqué, 2020),* ikusi da neuronalen corpusa mugatua bada emaitza pobreagoa dela: baliabide gutxiago erabiltzen dira, hiztegi eta egitura sintaktiko berak errepikatzen dira aldaera gutxiago erabiliz, eta egitura linguistiko gutxiago aukeratzen dira. Halako testuak behin eta berriz errepikatuta, estandar berri bat sortzeko arriskua legoke, pobreagoa, eta erdararen (hizkuntza nagusi eta menderatzailearen) egituretarik hurbilagoa, naturaltasuna galduta. Zer esanik ez, erabiltzaileak herritar arruntak badira, alegia, itzultzaile profesionalak ez direnak.

Euskararen kasuan, gainera, euskalkien auzia ere sartzen da estiloaren kontu honetan, nahiz eta hori, beharbada, konpon litekeen itzultzaile neuronalak elikatzeko erabilitako corpusa osatu eta hobetuta.

Testuaren koherentziari dagokionez ere, lehendik, OLI tresnekin, segmentuka egiten dugu lan, eta, horri gehitzen badiogu itzultzaile neuronalek oraingoz esaldika itzultzen dutela, adi ibili behar dugu testuaren osotasuna bistatik galdu gabe.

Hala eta guztiz ere, hasieran aipatu bezala, teknologia berri honek gure eguneroko lana errazteko aukerak ematen dizkigu, eta jakin behar dugu nola erabili. Badugu oraindik zer hausnartua eta zer ikasia, eta espero dugu izanen dugula aurrerantzean ere toki desberdinetako itzultzaileak bildu eta elkarrekin ikasteko aukera.

Lokalizazioaren industria: ur handitan
(Lierni Garmendia, itzultzaile eta lokalizatzaile autonomoa)

Esku artean daukazun Senezen ale hau argitaratzen denean, lau urte izango dira itzultzaile eta lokalizatzaile autonomo hasi nintzela. Ez dira urte asko, baina bai nahikoa euskal itzulpengintzaren eta lokalizazioaren industrian haizearen norabidea aldatzen ari dela jabetzeko.

Onerako edo txarrerako, nik hasiera-hasieratik izan nuen harremana itzulpen automatikoarekin (IA) eta postedizioarekin (PE). Teknologia berrien sektorean aitzindari diren nazioarteko hainbat enpresaren produktuak euskaratzen hasi nintzen, industrian «Language Service Provider» (LSP, hizkuntza-zerbitzuen hornitzaile) gisa ezagutzen diren enpresetako baterako.

Euskarazko proiektuez gain, gaztelaniazkoak ere eskatzen zizkidaten noizbehinka (eta eskatzen dizkidate oraindik ere, azken bezeroak egun horretan euskararako eskatutako bolumena txikia bada). Hain zuzen, gaztelaniazko proiektuetan ikusi nuen lehenengoz benetako PE eskaera bat… Eta ei, IAren emaitzaren kalitatea ez zegoen batere gaizki!

Ordurako, ohituta nengoen itzulpen-memoriekin lan egiten, eta, berez, ez dago alde handirik itzulpen-memoriez gain IA ere integratuta daukan OLI tresna bateko lan-fluxuarekin:

1_irudia_iñaurrieta_aranbarri.png
1. irudia: itzulpen-memoria integratua daukan OLI tresna bateko lan-fluxua

2_irudia_iñaurrieta_aranbarri.png
2. irudia: itzulpen-memoriaz gain IA integratuta daukan OLI tresna bateko lan-fluxua

Azken kalitate-kontuak eta tarifen auzia alde batera utziz eta soilik produktibitateari erreparatuz gero, IA ez da beste baliabide bat baino itzultzailearentzat, produktibitatea hobetzen lagundu diezaiokeena. Benetan lagungarria izateko, ordea, ezinbestekoa da IAren emaitzaren kalitatea ona izatea.

Baldintza hori bete ezean, hots, IAren emaitzaren kalitatea kaskarra edo nahikoa ona ez bada, edizio-tartea handiegia izango da IA proposamena erabili ahal izateko, eta itzultzaileak hutsetik itzuli beharko du kate hori, produktibitatearen kaltetan. Ondorioz, bi ahoko arma gisa ikusten dut nik IA itzulpengintzaren eta lokalizazioaren industrian.

Eta ez gaizki ulertu: IAren erabilerak badu bere tokia lanbidean. Ikastaroan, adibidez, bolumen handiak, presazko eskaerak eta barne-erabilerarako testuak (argitaratuko ez direnak eta, beraz, ezinbestean estilo- edo terminologia-gidalerro zorrotzei jarraitu behar ez dietenak) aipatu genituen, besteak beste. Baina, erabiltzekotan, baldintza batzuk bete behar ditu, eta, ingelesa- euskara hizkuntza-konbinazioaren kasuan, azken bezeroarengandik jasotzen dudana hankamotz geratzen da ingelesa-gaztelania hizkuntza-konbinaziorako jaso izan dudanaren aldean.

Hizkuntza-zerbitzuen hornitzaileekin elkarlanean dihardugun hizkuntza-profesionalok nazioarteko merkatuaren esanetara gaude, eta hori da, dudarik gabe, profil hori dugunok espero dezakegun erronka handiena. Teknologia-enpresa handientzat, euskara ez da zenbaki bat besterik; ez beste hizkuntza bat gehiago besterik, milaka hizkuntzaren artean. Hizkuntza txiki bat, ehunka hizkuntza erraldoiren aurrean. Oraindik PE tarifa aplika ezin diezaioketen eta, beraz, etekin ekonomikorik atera ezin diezaioketen locale bat, PE tarifa aplikatuta milioika dolar aurrezten laguntzen dieten hainbat hizkuntzarekin lehian.

Estatistikek eta zenbakiek horrenbesteko pisua duten sistema batean, ez da harritzekoa aurten Mr. Smith euskarazko PE eskaerak bidaltzen hastera animatu izana, hizkuntza-konbinazio sendoagoekin izan duen esperientzian oinarrituta, hala nola ingelesa-gaztelaniarekin. Guk, euskarako taldean, ez dugu amua irentsi oraindik, baina temati dago, eta ez dakigu noiz arte eutsi ahal izango diogun. Mr. Smith anbizio handiko gizona da, eta ez du hain erraz etsiko. Guk kalitateaz hitz egiten diogu, eta euskararen berezitasunez, eta edizio-tarteaz. Baina hark ez du ulertzen (edo ez du ulertu nahi); zenbakiak bakarrik ikusten ditu. Ez dakigu noiz arte eutsiko diogun.

Horixe da, hain zuzen, itzulpengintzaren eta lokalizazioaren industriako euskal itzultzaileon erronka nagusia une honetan IAri dagokionez: bezeroa heztea, uler dezan IA lagungarria izan daitekeela zenbaitetan, baina inola ere ez dela denerako balio duen soluzio unibertsala; hizkuntza-konbinazioaren edota testu motaren arabera, bere mugak dauzka. Eta horretan gabiltza, bezeroari itzulpen-kalitate gorenaren berme bakarra hizkuntz profesionala (pertsona) dela eta profesionalok itzulpen-prozesuan protagonista izan behar dugula ulertarazten. Eskerrak eguneroko borroka ere ez den.

Itzultzaile automatikoak, postedizioa eta irakaskuntza
(Isabel Etxeberria Ramírez, UPV/EHUko irakaslea eta itzultzailea)

Duela hilabete batzuk, Euskal Herriko Unibertsitateko Itzulpengintza eta Interpretazioko graduan, 2. mailako ikasleekin denon artean hiruzpalau testu itzuli eta zuzendu eta gero, ikasle guztiei banan-banan zuzendu eta ebaluatuko nien itzulpen bat eskatu nien Itzulpen Praktikak: Gaztelera- Euskara ikasgaian. 19 edo 20 urteko ikasle haientzat, irakasle baten esku uzten zuten lehen itzulpena zen hura. Senak hartaratuta edo, itzulgaia euskarazko hiru itzultzaile neuronaletatik pasatu, eta emaitzak begien aurrean izan nituen ikasleen proposamenak zuzendu bitartean. Eta bai: ebaluatu behar nien lehen ariketa hartan, ikusi nuen ikasle batzuek itzultzaile automatiko batek iradokitako itzulpen bat entregatu zidatela. Ikasle horiekin hitz egin nuen, eta esplikatu nien posteditatzen ez baizik eta itzultzen ikasteko ikasgai bat zela hura eta zaila izango nuela haiei gero eta hobeto itzultzen irakastea baldin eta berak egiteko gai zirena niri erakutsi beharrean makina batek egindakoa entregatzen bazidaten. Kontua argituta, zerotik hasi, eta beste testu bat eman nien itzultzeko, lehen haren ordez. Harrezkero, beste hamaika testu itzuli dituzte ikasle horiek, eta jatorrizkoek ezartzen dizkieten arazoei irtenbidea beren kabuz ematen ahalegindu dira.

Adibide bat baino ez da, baina behin baino gehiagotan egokitu zaizkigu halako egoerak itzulpengintzako irakasleoi azken urtebetean edo bi urtean. Euskarazko itzultzaile neuronalak kaleratzearekin batera kasik hasi dira itzulpengintzako ikasleak tresna horiek beren trebatze-praktiketan erabiltzen; irakasleok ere berrikuntza teknologikook ezagutzearekin bat, alegia. Oraingo honetan, elkarren eskutik ari gara irakasle eta ikasleok ikaskuntza berri honetan barneratzen. Eta bistan da inoiz ez bezalako abiadan hausnartu eta egokitu beharra sortu zaigula itzultzailegaiak trebatzen dihardugunoi.

Jarraian bilduko ditudanak Nora Aranberrirekin eta Uxoa Iñurrietarekin ikasitakotik eta nire irakasle esperientziako azken bi urte hauetan behatutakotik egin ditudan zenbait hausnarketa dira. Ohar xume batzuk baino ez dira, hemen eta orain eginak. Distantzia hartu gabe, badakit ikuspuntu hurbilekoegitik ari garela, eta hemendik urte batzuetara atzera begiratu eta oraingo nire gogoeta hauek irakurrita beharbada lotsagorritu egingo naizela. Baina hausnarketa egin beharrean gaude, eta hemen, bada, nire ahalegintxoa.

Uste dut tranparen edo iruzurraren ideia burutik kendu behar dugula irakasleok. Ikasgelak ez dira azkar ustekoen gudu-zelai bat, nork nori ziria sartu, nork lehenago igarri. Itzultzaile automatikoak hemen dira, gure artean. Tresna zoragarriak dira, eta emaitza oso baliagarriak ematen dituzte. Irakasleok ezin diegu ezikusia egin, eta ez dugu zertan haien existentzia ezkutatu. Ikasleek, bestalde, ez dute zertan haiekin isil-gordeka aritu. Itzultzaile automatikoak eskoletan erabili behar ditugu, ikasleei aurkeztu, probak egin, denon artean emaitzak aztertu eta ebaluatu, erabilgarritasunaz hausnarketa egin... Itzultzailegaiek itzultzaile automatikoak erabiliko dituzte lan mundura iristen direnean, eta graduan hasi behar dute haiek ezagutzen, irakasleen laguntzarekin.

Itzulpengintzako ikasleek ulertu behar dute itzultzaile automatikoak tresna lagungarriak direla, ez besterik. Denbora irabazten laguntzen digute, buru-nekea arintzen eta, ondorioz, produktibitatea handitzen. Teorian, behintzat. Bitxia iruditu zait ikustea ikasleek itzultzaile automatikoak erabili dituzten kasuetako askotan arrazoia ez dela izan alferkeria edo denbora irabazi nahi izatea, ezpada beren ziurtasun falta eta, ondorioz, autoritate baten bermea lortu nahia. Hau da, beren buruak eman zezakeenaz fio ez, eta makinak proposatzen duena hobesten dutelako jotzen dute ikasle batzuek itzulpen automatikora. Eta, egia bada ere itzultzen ikasten hasten den pertsona baten lehen ahaleginak zalantzatiak eta dorpeak izaten direla, eta –uste dut objektiboa naizela hau esatean– hasiberri baten lehen emaitzak zenbait kasutan itzultzaile automatiko batenak baino kaxkarragoak, edo ez hain naturalak, edo jatorrizkoari lerratuagoak izaten direla, ikasleei argi utzi behar diegu ahalmen handia dutela eta jardutearen poderioz laster izango direla makinak ematen dituen itzulpenak zuzentzeko eta hobetzeko gai.

Eta horri lotuta dator nire ustez (eta, Norarekin eta Uxoarekin egindako ikastaroan ikusi nuenez, gehienen ustez) itzultzaile automatikoen erabileraren gakoa. Beti egon beharko da adimen artifiziala zuzendu, gidatu, hobetuko duen giza adimen bat. Itzultzaile automatikoen kasuan, haien emaitzak epaitzeko, zuzentzeko eta hobetzeko gai den giza itzultzaile bat beharko da beti. Litekeena da, beraz, orain arte ezagutu dugun itzultzailearen figura zenbait arlotan desagertzea, edo aldatzea behintzat, eta zuzentzaile bihurtzea neurri handi batean. Baina nekez zuzendu edo hobetuko du itzulpenik gutxi itzuli duenak. Norberak hamaika aldiz behar du hanka sartu besteren emaitzan akatsa ikusteko. Eta, beraz, irakasleon erronka nagusia, gaur egun, ikasleak asko itzultzearen garrantziaz ohartaraztea da. Itzultzaile automatikoak ikasgeletan aurkeztu eta erabili egin behar ditugu, baina batez ere itzultzen, itzultzen eta itzultzen jarri behar ditugu ikasleak. Horrek trebatuko ditu egunen batean lan munduan itzultzaile automatikoen erabiltzaile gaituak izateko.

Adibide bat emango dut. Itzultzaile automatikoen emaitzetan ikusi ohi dugun huts tipikoenetako bat ohikoa izaten da ikasle hasiberrien artean: testua bere osotasunean aintzat ez hartzea. Itzultzaile automatikoen kasuan, esaldika lan egiten dutelako gertatzen dira horrelako akatsak: «venía», hortaz, «etortzen nintzen» zein «etortzen zen» emango digu itzultzaile automatiko batek, baita aurreko esaldi guzti-guztietan 1. pertsonako narratzaile bat hizketan aritu bada ere. Itzulpengintzako ikasleek, noski, ez dute horrelako akatsik egiten, eta, itzultzaile automatiko batek egitekotan, erraz ikusten dute hutsa. Baina nahikotxo kostatzen zaie konturatzea testu batek elkarri lotutako esanahien sare bat gordetzen duela. Eta ez naiz ari (edo ez soilik) literatur testu baten irudizko hariez, lotura fonetikoez eta antzekoez. Dibulgazio-testuak lantzean, adibidez, ideien antolamendua eta ondorioz galdegai- mintzagai jokoa garrantzi handikoak direla azpimarratu behar izaten dugu askotan eskolan, eta ikusarazi egin behar izaten dugu, adibidez, testu bateko ideien segidak adieraziko digula noiz den egokiagoa, adibidez, «Jruschov-en eskariak asetzeko, txakurren hegaldi orbitala azarora aurreratu zuten» esaldia, eta noiz «Jruschov-en eskariak asetzeko, txakurren hegaldi orbitala aurreratu zuten azarora» edo «Txakurren hegaldi orbitala Jruschov-en eskariak asetzeko aurreratu zuten azarora». Norberak itzulitako testuetan halako ñabardurak adierazteko behar bezainbeste trebatu ez denak ez du, bistan denez, itzulpen automatiko batean halakorik hautemango, ezta zuzenduko ere.

Eta azken gogoeta bat. Kezkatzen nau itzultzaile automatikoei euskal gizartean emango zaien erabilerak. Tresna zoragarriak iruditzen zaizkit euskaraz ekoizten dena erdaretan ezagutzera emateko: kanpoko ikertzaile batek, adibidez, euskal ikertzaile batek euskaraz idatzitako artikulu baten mamia ulertzeko erabiltzea. Epe luzean euskarazko testugintza sustatzea ekar dezakeela uste dut. Baina euskarak ez du beste hizkuntza handien garapen maila. Euskarazko testugintza eta euskararen baliabide linguistiko- estilistikoak ez daude mendeetako tradizio idatzia duten erdara handien pare. Ez oraingoz. Euskaratik erdarara (gaztelaniara, adibidez) hainbat eta hainbat testu itzultzaile automatikoen bitartez itzuliagatik ere, gaztelaniazko barne testugintzak oso indartsua izaten jarraituko du. Gaztelaniadun giza adimenek jarraituko dute giza adimenak bakarrik asma ditzakeen irudi, asmakizun eta baliabide berriez janzten beren testuak. Baina, hizkuntza gutxitu batean, non barne testugintza urriagoa den eta administrazioen zein ekimen pribatuen eskutik gizarteari eskaintzen zaizkion testuen ehuneko handi bat aurrez gaztelaniaz edo frantsesez sortua den, arriskutsua iruditzen zait testu horien parte handi bat itzultzaile automatikoen bitartez itzultzea, jakinik testuok aurreko testuen corpus batean oinarrituta itzultzen dituztela. Gurpil zoro arriskutsua sor litekeela iruditzen zait. Epe luzera euskara lau, beti bateko, urri bat gailentzea ekar lezakeelakoan nago. Pentsatu nahi dut giza adimenak testu eta itzulpen bati eman diezaiokeen inperfekzio irudimentsua ezin aberatsagoa dela, eta baita ezinbestekoa ere hizkuntza gutxituen kasuan. Alde horretatik, itzultzaileok eta oro har testugintzan aritzen garenok egiteko garrantzitsua dugu gizartea itzultzaile automatikoen abantailez eta mugez kontzientziatzeko. Eta itzulpengintzako ikasleekin unean uneko erabileratik haragoko hausnarketez ere aritu beharko genukeelakoan nago.

NMTa itzulpen profesionalean
(Ixiar Iza, Elhuyarreko itzultzailea)

Badira ia 15 urte Elhuyarren lanean hasi nintzela, eta, denbora horretan, itzultzaile automatiko (IA) batzuk probatzeko zortea izan dut. Hori du garatzaileak hurbil izateak: lehenago edo geroago, beti jarri behar izaten dira makina eta gizakia aurrez aurre, ondoz ondo. Hala, erregeletan oinarritutakoa eta estatistikoa probatu genituen bere garaian, eta ondo dakit zer nekeza zen zuzentzat jo genezakeen emaitza bat lortzea itzultzaile automatiko horiek erabiliz. Baina gauzak asko aldatu dira denbora gutxian.

Hemen itzultzaile eta itzulpen automatikoez hitz egitean, ezinbestekoa da kontuan izatea euskaratik edo euskarara itzultzeaz ari garela beti. Zergatik? Itzulpen automatikoaren ontasunean eragin zuzena dutelako hura trebatzeko erabili den corpusaren tamainak, bi hizkuntzen antzekotasunak eta esaldi barruko elementuen mugikortasunak. Eta, euskara hizkuntza txikia izanik, corpus elebidunak txikiak dira, euskarak ez du inguruko hizkuntzen antzik, eta, euskaraz, esaldi bat era askotara ordenatu daiteke gramatikaltasuna galdu gabe (ingelesez, adibidez, baiezko esaldietan, lehendabizi subjektua jartzen da, eta, segidan, aditza). Horregatik, askoz ere zailagoa da euskararako itzultzaile automatiko egoki bat lortzea corpus handiak dituzten hizkuntza-bikoteetarako edo antzekoak diren hizkuntzetarako baino.

Itzultzaile neuronala

Zailtasunak zailtasun, ikertzaileen lanari esker, itzultzaile profesionaloi laguntzen diguten itzulpen automatikoak egitea lortu da NMT edo itzultzaile automatiko neuronalekin.

Itzultzaile automatikoak ematen diguna ondo erabiltzeko, ordea, tresna pixka bat ezagutu beharra dago, beste edozein tresnarekin gertatzen den bezala. Adibidez, itzultzaile automatikoak, oraingoz, ez du testua osotasunean itzultzen, baizik eta esaldika, eta, esaldi bat itzultzen duenean, ez ditu kontuan hartzen haren aurretik eta ondotik daudenak; beraz, itzultzaileok dugu itzulpen automatiko horren testuingurua, eta guri dagokigu itzulpenaren koherentzia zaintzea. Askotan, gainera, testuingurua ez da dokumentuan dagoen informaziora mugatzen. Horren bi adibide nabarmen jartzeko, itzulpenak egiteko kontuan hartu behar izaten dira bai informazio-mota (publizitate-esaldi bat, eskola-liburu bat, gutun komertzial bat, azpitituluak, SMS bat, mugikorreko aplikazio bat, albiste bat...) eta bai generoarekin lotutako gorabeherak (NMTa orain arte sortu diren testuetan oinarritzen denez, baliteke erizainak emakumezkotzat hartzea eta medikuak gizonezkotzat).

Horrenbestez, itzulpen automatikoa erabil daiteke gordin-gordin eta egoki gauza batzuetarako (den-denak euskaldunak ez diren whatsapp-talde batean, adibidez, euskaraz (ondo) ez dakitenek IA erabiltzen badute, gainerakoek euskaraz idatz dezakete). Itzulpengintza profesionalaren ikuspegitik, ordea, argi dago itzulpen automatikoa posteditatu egin behar dela.

Postedizioa, baina, maila askotakoa izan daiteke. Horregatik, erreferentzia gisa, EIZIEk 2020an egindako postedizio-lantegian Nora Aranberri eta Uxoa Iñurrieta irakasleek aipatu zituzten bi postedizio-motak erabiliko ditut: arina eta sakona.

  • Postedizio arinean, testua zuzen ulertzeko ezinbestean behar diren aldaketak egiten dira, eta ulertzea eragozten ez duen guztia utzi. Hau da, testuaren edukia ulertzea eragozten ez badute, ez dira zuzendu behar akats ortografikoak eta gramatikalak, terminologia-koherentziarik eza, etab.

   Horren arabera, gaia zuzendu behar da, eta ez hizkuntza; ondorioz, badirudi garrantzitsuagoa dela gaia ezagutzea hizkuntza ezagutzea baino. Horregatik, nik neuk zalantzan jartzen dut itzultzaile profesionaloi ote dagokigun postedizio arinak egitea.

  • Postedizio sakonean, berriz, itzultzaileok dugu testuaren erantzukizun osoa, eta behar beste aldatu behar dugu IAk ematen duena; baita erabat baztertu eta itzulpena hutsetik egin ere, hala iruditzen bazaigu.

   Testuinguru honetan IA erabiltzen dugunean, eskura ditugun tresna guztiak erabili behar genituzke «gure» itzulpenak egiteko.

NMTa eta postedizio sakona

Itzultzaile automatikoak ez dira itzulpenak egiteko beste modu bat, baizik eta itzulpenak egiten laguntzeko beste tresna bat, eta, ordenagailuz lagunduta itzultzeko (OLI) tresna batean txertatzen baditugu, OLI tresnaren baliabide guztiekin batera erabiltzeko aukera dugu. Memoriak eta glosarioak dira oraindik OLI tresnen oinarri nagusia, baina tresnok ere aldatuz joan dira, eta beste aukera batzuk ere badituzte orain: azpisegmentuak, autosuggest delakoa, itzultzaile automatikoa txertatzeko aukera, etab.

Itzultzaile automatikoa OLI tresnan txertatua erabiltzean, memoriaren ordaina hobesten da, eta memoriak ordainik ez duenean jasotzen da itzulpen automatikoa. Hor bai, itzulpen automatiko hori posteditatu egin behar da, beste guztia kontuan hartuta: testuinguru osoa, glosarioak, dokumentu horrekin zerikusia duten lehenagoko itzulpenak, koherentzia, zuzentasuna, bezeroaren eskakizunak, etab.

Baldintza horietan lan egiten dugunean, dagokion tokian jartzen dugu itzulpen automatikoa. Izan ere, itzultzaileok erabakitzen dugu non jarri muga memoriaren ordaina jasotzetik itzulpen automatikoa jasotzera pasatzeko. Hala, oso itzulpen automatiko ona duten hizkuntza-bikoteetan –oso hurbilekoak direlako edo corpus erraldoiak dituztelako–, nahiago izaten da itzultzaile automatikoaren ordaina jaso, memoriako % 90eko berdintasuna duen ordain bat baino.

Euskarazko NMTari dagokionez, berriz, eguneroko itzulpenetan itzultzaile automatikoa OLI tresnan txertatua erabiltzeko aukera dugunok itzulpen automatikoa erabili egiten dugu, oro har, nahiz OLI tresnan erraza izan aukera hori desaktibatzea. Horrek erakusten du gorago esandakoa: NMTarekin lortzen diren itzulpen automatikoek lagundu egiten digute itzultzaile profesionaloi.

Memoriaren ordainak jasotzeko atalasea, ordea, ez dugu aldatu: IArik gabe lan egitean, % 70-75ekoa izaten da normalean, eta IArekin ere hortxe mantentzen dugu, salbuespenak salbuespen. Beraz, oraingoz, lehengo neurri berean erabiltzen dugu memoria. Itzultzaile automatikoak ez dio tokirik jan, osagarri bat da.

Dena den, ez da hori IA OLI tresnan txertatua erabiltzeko modu bakarra. Nik neuk, askotan, ez dut segmentu osoaren itzulpena jaso nahi izaten; nahiago izaten dut IAk azpisegmentuen ordainak ematea eta ordain horiek autosuggesten bidez jaso. Horrela, nik bideratzen dut itzulpena, eta ez diot uzten itzulpenari ni eramaten. Hori izaten baita IA erabiltzearen arriskuetako bat. Nork agintzen du? Itzulpen automatikoak ala itzultzaile profesionalak? Postedizio sakona egitean, guk agindu behar genuke.

Laburbilduz, hutsetik hasita baino nahiago dugu itzulpen automatikoarekin lan egin, baina memoriak IAren aurretik zuten pisu berean mantenduta. Hau da, lehenengo urratsa egin dugu, hasi gara itzultzaile automatikoekin lanean, baina oraindik ez zaizkie gailendu lehendik erabiltzen genituen tresnei.

Hemendik aurrera, zer?

Bide luzea egin da, baina asko dago egiteko. OLI tresnen eta itzultzaile automatikoen arteko erlazioa, gaur egun, itzulgaia bidaltzera eta itzulpena jasotzera mugatua dago, eta, gainera, esaldiz esaldi egiten da itzulpena. Sakonagoa izan behar luke harreman horrek. Nik nahi nuke itzultzaile automatikoak itzulpen automatikoaren ontasuna adieraztea, memoriako ordainetan egiten denaren antzera (jatorrizkora zenbat hurbiltzen den gutxienez, zein zati diren seguruenak eta zein zalantzazkoenak...). Nik nahi nuke OLI tresnak unean uneko glosarioa bidaltzea NMTari, eta NMTak glosario hori kontuan hartzea itzulpena egiteko. Nik nahi nuke memoriak % 100 ez den ordain bat ematen didanean NMTak ordain hori zuzentzea, eta ez itzulpena zerotik hasita egitea. Nik nahi nuke NMTak dokumentu osoa edo, gutxienez, itzultzen ari naizen segmentuaren aurrekoak eta ondokoak kontuan hartzea. Eta nahi nuke NMTak bere itzultze-prozesuan egiten eta erabiltzen dituen itzulpen guztien emaitza bi edo hiru itzulpen oso desberdin izatea, halakorik dagoenean.

Badakit zaila dela bide horretan aurrera egitea. OLI tresnak sakonki aldatu beharko lirateke, eta itzultzaile automatikoak itzultzaile profesionalei begira jarri. Baina amets egiteak ez diezagula eragotz orain eskura ditugun tresnak erabiltzea: itzultzaile automatikoa ez da ametsa, eta OLI tresnak aspalditik erabiltzen ditugu. Aprobetxa ditzagun.

*     SÁNCHEZ-GIJÓN, P. eta PIQUÉ HUERTA, R. (2020). «Conseqüències de la traducció automàtica neuronal sobre les llengües d’arribada». Revista Tradumàtica, 18. zk., 1-10.