Sagarra manzana,
ikatza carbón
Adimen artifizialaren eta itzulpen automatikoaren olatuan sartuta gaudelarik, komeni da olatuen erresakari ere erreparatzea. Artikulu honek itzulpen automatikoaren zabalkuntza bridarik gabeak eragin ditzakeen ondorio kezkagarri batzuk aletzen ditu, hala nola itzulpen automatiko bidez sortutako testuekin elikatzen diren corpusek hizkuntzaren kalitateari eragiten dioten kaltea, etorkizuneko itzultzaileen unibertsitate-ikasketak, euskara ikasteko motibazioa, hizkuntzaren kalitatea bermatzeko tresnetan inbertitzeko beharra, eta erakundeen eta profesionalen erantzukizuna.
Aspaldion badirudi ez dagoela adimen artifiziala aipatzen ez duen artikulurik idazterik. Lehengo batean, lankide zientzialari bati entzun nion esaten DNAren sekuentziazioarekin gertatu zenaren pareko zerbait ari dela gertatzen adimen artifizialarekin eta hari lotutako hainbat adarrekin (itzulpen automatikoa, kasurako). Alegia, edozer dela ere, edukiaz baino gehiago, eduki horretara iristeko metodoaz ari zaizkigula komunikabide-mota guztiak, bonbardaketa etengabean.
Itzulpen automatikoak lotura zuzena du adimen artifizialarekin, eta, beraz, asko eta askotarikoak dira horri buruz irakurtzen ari garenak ere. Zurrunbilo horren erdian, baina, burutik kendu ezinik nabil Juan Garzia itzultzaile eta irakasleari behin baino gehiagotan entzundakoa: «Disko gogorra aipatzen digute maiz, kanpoko disko gogor handietan gorde behar omen da informazioa; oso ondo, baina lehen-lehenik elikatu beharreko disko gogorra norberaren kaskezurra da; ondo elikatu behar da, hortik gero une bakoitzean behar dena atera ahal izateko». Komatxoak jarri dizkiot Juanen hitzei. Ez da izango literal-literala aipua (askoz dotoreago esango luke berak, seguru), baina askotan entzun diot hori, era batera edo bestera esanda.
Gazteenek barre egingo diote aipuari, akaso. Bua, chaval, «disko gogorra», neandertalak baino kontu zaharragoa. Bale, bai, ados. Baina kendu, mesedez, hautsa esaldiari, eta erreparatu mamiari. Izan ere, «kaskezurra elikatzea» da itzultzaile batek —eta nork ez?— txintxo-txintxo egin beharko lukeen dieta, hori du-eta bidaia-maletarik preziatuena. Edo hala behar luke. Eta dieta horren osagai nagusia irakurketa da. Irakurketa zahar beti berria. Piramidearen oinarrian eta piramidearen erpinean, bietan. Jatorrizko hizkuntza(k) eta xede-hizkuntza(k). Biak (edo, gehiago badira, gehiago) landu behar dira. Etengabe landu, gainera. Bai, etenik gabe. Baita orain ere, jakina, adimen artifizialaren garaian are beharrezkoagoak baitira antena (eta garuna) ondo koipeztatuak dituzten profesionalak, itzulpen automatikoko sistemen emaitza ikusirik gai izango direnak alea eta lastoa bereizteko.
Batzuek diotenez, literatura da itzulpen automatikoaren eraginetik (oraingoz) kanpo gelditzen den alor (ia) bakarra, galiarren azken herrixka-edo nolabait. Ez dakit, hala ere, hori esaten denean ez ote ditugun gutxiesten literaturatik kanpo gelditzen diren beste eremu batzuetako itzulpen asko. Zer da prosa zientifikoaren itzulpena? Zer da jakintza-eremu askotako dibulgazio-prosaren itzulpena? Zer da Konstituzioaren itzulpena? (Bai, bai, Espainiako Konstituzioa, eta, nonbaitetik hasi nahi baduzue, irakurri Patxi Petrirena itzultzaile eta irakasleak EHUk argitaratutako itzulpen horri egindako hitzaurrea —«Konstituzioa berriz?»—, eta egiaztatu nola konbina daitekeen prosa eder gozagarria argitasun sintaktikoarekin, terminologia zorrotz bateratuarekin eta laburtasun estilistikoarekin… testu juridiko batean; ikus Bibliografia atalean Euskal Herriko Unibertsitateko Argitalpen Zerbitzua, 2006). Miguel Sáenz gaztelaniazko itzultzaile handi eta RAEko akademikoak honela zioen akademiko izendatu zutenean irakurri zuen sarrera-hitzaldian (2013), gogoan hartuz Nazio Batuen Erakundeko itzultzaile gisa aritu zen garaia eta han izandako lankideak:
Un día me di cuenta de que también aquellos documentos que traducía, muchas veces áridos, eran literatura.
Beste barre-algara ozen batzuk bulegoko kafe-makinaren ondoan. Administrazioko itzulpenak literatura? Bua, tía, zer droga-klaserekin txutatzen zara? Hor ere arrastaka dabilkigu, soinekotik tiraka, maldizio zahar bat. Euskal itzulpengintza «modernoaren» hastapenetan —jar gaitezen 1980ko hamarkadaren erdialdean-edo—, itzultzaileak EAEko administraziora iristen hasi zirenean eta dena (den-dena) egiteko zegoenean, dena zegoen itzuli beharra, azkar, unean uneko beharrei erantzuteko. Gehiegikeriak egin ziren hor? Bai, dudarik gabe. Pikoegia izan da hor ere «Altubeko malda»? (Lertxundi, 2019: 31).1 Bai, nabarmen. Baina bada aurreiritziak zokoratzeko garaia. Administrazio-itzulpenetan ere, beste alor askotan bezala, aurrerapauso izugarriak eman ditu euskal itzulpengintzak, eta, besteak beste, EHUren Legeak egitasmoan argitaratutako hainbat lege-dokumentu —lehenago aipatutako Konstituzioa, kasurako— dira horren adibide. Beraz, utikan aurreiritzi eta kritika batzuetan oinarri gabe —kritikatzen dena irakurri gabe— eta, onenean, zaharkituak.
Izan ere, aspaldi argitu zigun Anjel Lertxundik zer dagoen maiz itzulpenak (berdin zer itzulpen-mota) zailak direla behin eta berriz dioen mito astunaren atzean (2001: 186-187):
Kontua da —kontu tristea— gure belaunaldiak zein gure ondorengoek aiseago irakurtzen dugula gaztelaniazko itzulpen oro, obra horren beraren euskal bertsioa baino. Menperagaitza zaigun hizkuntza arrotz batean bezala irakurtzen dugu euskaraz, eta geure buruari iruzur egitea da Joyce edo Hamsun edo Cocteau zailak direla esanez bertan goxo egitea: euskaldun askok neke berdintsuak ditu Saizarbitoria zein Sagastizabal irakurtzeko. […] Itzulpen versus jatorrizko lehia ez da, aldez edo moldez, benetako arazoaren estalgarri baino: irakurleok dugun ahuleziarena inguruko erdaren eraginez.
Itzulpen automatikoa oso tresna ahaltsua da, eta aldaketa ugari ari da eragiten itzultzaileon lanbidean. Ez da hau baliatzen hasi garen lehenengo tresna teknologikoa. Aurretik, itzulpen-memoriak erabiltzen ikasi genuen, eta ukaezina da zenbateraino laguntzen diguten memoriok batik bat egitura errepikatu ugari, forma estandarizatuak edo dokumentu beraren bertsio eguneratuak behar dituzten itzulpen pragmatikoetan.
Itzulpen automatikoak, ordea, beste paradigma batean kokatzen gaitu. Makinak itzulpen oso bat ematen digu ordain gisa, ona edo txarra, baina osoa, «itxura ona» duena maiz (itxura engainagarria sarri), ondo samar irakurtzen dena, belarrian ondo jotzen duena (baita desegokia denean ere) eta sinesgarria eta «bukatua» ematen duena. Hor dago kosketako —eta arriskuetako— bat: engainagarria da, sinesgarria ematen baitu. Horrek bi arazo-mota berri sortzen ditu gutxienez itzulpen- eta zuzenketa-prozesuan:
- Itzultzaileak ikasi behar du akats-mota ordura arte ezezagunei erreparatzen, ez baitira berdinak giza itzultzaile batek eta itzultzaile automatiko batek egiten dituen akatsak (berehala aipatuko ditugu batzuk). Esate baterako, giza itzultzaile batek nekez utziko du esaldi bat erdizka itzulia. Itzultzaile automatikoa, baina, «nekatu» egiten da maiz esaldi luzeak itzuli behar dituenean, eta, nola segi ez dakienean, itzuli gabe uzten ditu zati batzuk, eta aurrera jarraitzen du gero beste zatiren batekin. Nekatzeaz gainera, lotsagabe samarra ere bada itzultzaile automatikoa: jatorrizkoa ez badu ondo ulertzen (horra hor betiko beste arazo larri bat —jatorrizkoen kalitatea—, itzulpen automatikoarekin are larriago bihurtzen dena) akatsen bat dagoelako edo zabar idatzita dagoelako, lasai asko asmatzen du ordain bat makinak. Eta asmatzen duen hori desegokia izaten da (ia) beti. Eta, desegokiaz gainera, arriskutsua gerta daiteke, noski, makinaren «lotsagabekeria». Aditu batzuek «haluzinazio» esaten diote makinak lotsarik gabe asmatzen dituen horiei.
- Giza itzultzaile profesional baten itzulpen bat zuzentzean, gutxitan jotzen du zuzentzaileak testu itzulia jatorrizkoarekin egiaztatzera.2 Itzultzailearen lana da hori, eta ondo zaintzen dute hori profesional zailduek. Zerbaitek bereziki atentzioa ematen dionean bakarrik jotzen du zuzentzaileak jatorrizkoan egiaztatzera, edo hala zen orain arte. Emaitza itzultzaile automatikoarena denean, ordea, askoz gertuagotik erreparatu behar zaio jatorrizkoari, makinaren «nekeak» edo «lotsagabekeriak» askoz gehiagotan eragin ditzakeelako horrelako arazoak (are gehiago jatorrizkoaren kalitatea eskasa denean, eta oso maiz gertatzen da hori; kontuan hartu behar da, gainera, gaur egun jatorrizko testu ez gutxi adimen artifizial bidez sortzen direla). Beraz, azkartasunari eta errentagarritasunari begira itzulpen automatikoari aitortzen zaizkion ustezko onurak ez dira beti begien bistakoak. Postedizio hitza (eufemismoa?) erabili ohi da makina batek egindako itzulpenaren zuzenketa-prozesua izendatzeko. Eta itzultzeko metodo hibridoaz hitz egiten da: itzulpen neuronala + postedizioa. Lehen zuzenketa esaten genuena, orain postedizio nonbait. Eta, hitz berriarekin, kondizio berriak: lana merkeago egitea makinak jada itzulpen-emaitza bat «eman» duelako. Iruzurrerako bide seguru samarra, itzulpen automatikoaren emaitza zuzentzen giza itzultzaile batena zuzentzen baino (askoz) denbora gehiago behar baita maiz. Begira zer dioen, adibidez, gaztelaniazko zuzentzaileen UniCo elkarteak iaz argitaratutako adierazpenak (2024):
[…] cuando corregimos textos generados por la IA, los clientes esperan un resultado natural, a pesar de que partimos de escritos que tienden a la homogeneidad y en absoluto están exentos de errores. Esto conlleva un esfuerzo cognitivo superior que, sin embargo, no se ve traducido en una remuneración acorde.
Aipa ditzagun orain, labur-labur, itzultzaile automatikoek gaztelaniatik euskarara itzultzean egiten dituzten akats ohiko batzuk:
- Ez ditu ulertzen lokuzioak edo kolokazio bidezko esapideak, eta literalki itzultzen ditu. Adibidez:
ES: Animémonos pensando en las fiestas de Navidad que están ya al caer y la alegría que supone, sobre todo para los pequeños, y el reencuentro que seguramente tendremos con los amigos y familiares que durante todo el año han estado lejos de nosotros.
EU: Anima gaitezen dagoeneko erortzen ari diren Eguberrietako festak eta horrek dakarren poza gogoan, batez ere txikientzat, eta urte osoan gugandik urrun egon diren lagun eta familiakoekin izango dugun berrelkartzea.
- Gaztelaniazko egitura sintaktikoak kalkatzeko joera nabarmena du:
ES: En cuanto a los cambios se nos dice que los motores de combustión ocasionan un deterioro del medio ambiente cuando la realidad es que las técnicas modernas permiten que los motores de combustión sean mínimamente contaminantes.
EU: Aldaketei dagokienez, esaten da errekuntza-motorrek ingurumena hondatzen dutela, teknika modernoei esker errekuntza-motorrak oso kutsagarriak ez direnean.
- Jatorrizkoak dioenaren kontrakoa esaten du batzuetan:
ES: El Ayuntamiento y todo el personal que trabaja en él tiene la responsabilidad de ayudar y garantizar un entorno laboral en el que resulte inaceptable e indeseable el acoso sexual o por razón de sexo.
EU: Udalak eta bertan lan egiten duten langile guztiek sexu-jazarpena edo sexuagatiko jazarpena onartezina eta desiragarria den lan-ingurune batean laguntzeko eta bermatzeko erantzukizuna dute.
- Gaztelaniaren nominalizazio-joera kopiatzen du euskaraz.
ES: La restauración de Tasio (Montxo Armendáriz, 1984), impulsada, conducida y financiada por la Filmoteca Vasca en 2023, fue llevada a cabo por el laboratorio L’Immagine Ritrovata de Bolonia gracias a la subvención del Gobierno Vasco y con la supervisión del director navarro en todo el proceso..
EU: Tasioren zaharberritzea (Montxo Armendáriz, 1984), Euskadiko Filmategiak 2023an bultzatu, bideratu eta finantzatua, Boloniako L’Immagine Ritrovata laborategiak egin zuen, Eusko Jaurlaritzaren diru-laguntzari esker eta nafar zuzendariak prozesu osoan gainbegiratuta.
- Askotan ez ditu bereizten hitzen adierak:
ES: Dado el carácter civil que tiene el presente Convenio, todas las cuestiones o diferencias que puedan surgir con motivo del mismo deberán resolverse…
EU: Hitzarmen honen izaera zibila dela eta, hitzarmen honen ondorioz sor daitezkeen arazo edo desberdintasun guztiak…
- Ezezko esaldietan, erotu egiten da batzuetan (harritzekoa ere ez da tarteka, jatorrizkoaren idazkerari erreparatuta):
ES: Durante 2019, no han existido incumplimientos de la legislación y normativa ambiental.
EU: 2019an ez da bete ingurumenari buruzko legeria eta araudia.
- Jatorrizko hitz baten adiera ondo ulertzen ez duenean —ez denean adiera ohikoena—, asmatu egiten du:3
ES: …una actitud esponjosa y flexible…
EU: …jarrera harroputz eta malgua…
Hori guztia horrela izanik eta kontuan harturik gero eta hedatuagoak daudela alor guztietan itzulpen automatikoko sistemak, bada zer kezkatua eta zer egina itzulpen automatikoaren hedatze-garai bete-betean gauden honetan. Batetik, Karlos del Olmok 2024ko Senez aldizkarian argitaratutako «Adimen artifizial sortzailea: paradigma aldaketaren eta disrupzioaren artean» artikuluan aipatu bezala, bada itzulpengintzaz harago ere, baina harekin estu loturik, kontuan hartu beharreko alor bat: euskararen normalizazioarena. Hona del Olmoren hitzak (2024: 262):
Euskaraz lan egiteko gaitasuna duten euskal langileek nahiz euskaraz trebatzeko bidean ari direnek gero eta pizgarri txikiagoa izango dute hizkuntzazko autonomia edo independentzia handiagoa bereganatzeko, azken batean AA sortzaileak testu itxuroso samarrak eskain diezazkieke eta.
Bestetik, itzulpen automatiko neuronaleko sistemek corpus elebidunak dituztenez bazka nagusi, laster sortzen da corpus horiek ibilian-ibilian izango duten hizkuntza-kalitateari buruzko kezka. Del Olmok horri ere heldu dio (2024: 262):
Apurka-apurka, AAk darabiltzan corpusak AAek berek sortutako emaitzez elikatuz joanez gero, hizkuntz proposamen horiek adituak diren profesionalen edo sen handiaren jabe diren erabiltzaileen eskuetatik igarotzeke, zer corpus mota izango dute?
Lehenago ere azaldua da kezka hori. Esate baterako, ardura hori bera ageri du Gotzon Egiak 2023ko ekainean 31 eskutik blogean argitaratu zuen «Guk bezain gaizki itzultzen du» artikuluan:
Itzultzaile neuronalak hedatzen eta erabiltzen hasi zirenetik, gutxi gorabehera 2017az geroztik, testu masa handiak, oso handiak, itzuli dira ES>EU norabidean. Honez gero, beraz, pentsatzekoa da egun makina neuronalen entrenamendua hobetzeko erabiltzen ari diren testu asko, gehienak ez badira, makina neuronal batek egindako itzulpen batean oinarrituta sortu izan direla. Joera hori, gainera, hasi besterik ez da egin, eta hemendik aurrera areagotu besterik ez daiteke egin, probabilitatez, itzulpen gero eta gutxiago izango baitira giza itzultzaile batek hutsetik sortutako testu batean oinarri hartutakoak.
Begien bistako arrisku bat dugu, beraz, erne ez bagaude makinak etengabe erreproduzitzen dituen hutsegite edo akatsak zuzentzeko: edo giza itzultzaileak ixten die bidea, edo makinak betikotuko ditu.
Ez da, ez, txantxetako kontua. Karlos del Olmok euskal administrazioari egiten dio dei, horretaz jabetu dadin (2024: 262-263):
Euskal administrazioak garaiz konturatzen ez badira baliabideak jarri behar dituztela hizkuntzazko edukiak AAren bidez sortzen dituzten langileen testuak egokitzeko edo berridazteko, alferrik gal liteke azken urteotan normalizazioan aurreratutako bidearen zati luze bat.
Beraz, prozesu honetan guztian, bada hitz garrantzitsu bat: erantzukizuna. Lehenik eta behin, norberarena, erantzukizun profesionala, edo, hitz zaharrunoago bat erabili nahi baduzue, kode etikoa. Profesional bakoitzak jakin behar du zertan lagundu diezaiokeen eta zertan ez teknologiak —orain artekoak eta azken-azkenak—; zertan lagundu diezaiokeen lan txukun bat egiten, jakina, ez gutxi gorabeherako bat (gutxigorabeheratasuna oso zabaldua baitago alor guztietan; «gutxi gorabehera ulertzen da»…).
Hori dela eta, bada garrantzi bereziko alderdi bat: itzultzaile berrien prestakuntzarena, hots, itzulpengintzako unibertsitate-ikasketei dagokiena. Hori ere aipatzen du Karlos del Olmok bere artikuluan (2024: 263):
Lanbidearekin zerikusia duen beste kontu bat genuke itzultzaile, zuzentzaile eta interprete berrien ikasketei dagokiena: noraezekoa da-eta haien curriculumean AAen inguruko prestakuntza teoriko eta praktiko sakonak ematea ikasleei, erabiltzaile arrunten erabilera deskuidatu edo arriskutsutik haratago hel daitezen, zentauroaren burua izan daitezen, lau hankako soin enborra barik.
Izan ere, nork erakutsiko die bestela itzultzaile berriei Marguerite Yourcenarrek esan eta Anjel Lertxundik Itzuliz usu begiak saiakeran jasotakoa? (2019: 107):
Marguerite Yourcenarrek maleta ireki batekin konparatzen du itzulpena: jantzi bat sartzen duzu bertan. Laster bururatzen zaizu ez ote den egokiagoa beste bat. Lehendabiziko jantziari begiratzen diozu berriro, hari ondo zer doakion jakiteko. Beste jantzi bat sartzen duzu. Ondo al datoz, batek ez al du bestea ukatzen? Orain konbentzituta zaude ezetz. Beste hainbat konbinaketaren ondoren, hornitu samar duzu maleta.
Eta, unibertsitatearekin batera, hor da orobat gainerako erakundeen erantzukizuna. Batzuetan, badirudi itsututa gaudela denok euskarak mundu digitalean (presente!) egoteko galdu behar ez duen abiadura handiko (zenbaterainoko?) trenarekin. Mundu horretan egon behar dugu, jakina, baina ezin gara hor sartu ingelesa edo gaztelania bagina bezala. Lehenik eta behin, ez garelako, eta, bigarrenik, horretaz ez jabetzeak eragingo dizkigun kalte akaso atzera-bueltarik gabekoengatik. Erreparatu berriz Karlos del Olmok euskararen normalizazioaz esandakoari edo itzulpen automatikoaren bidez gizendutako corpusek sortuko luketen (jada sortzen ari diren) zaborrari. Begira zer zioen azken horri buruz 2024ko azaroan Raúl Limón El País egunkariko Zientzia saileko kazetariak itzulpen automatikoaz idatzitako artikuluan (artikuluan aipatzen duen Nature aldizkariko lana ere irakur daiteke; ikus Bibliografia atalean Shumailov, 2024):
En este mismo sentido, una investigación publicada en Nature muestra que los resultados de la IA se degradan cuando esta se entrena con datos generados también por inteligencia artificial. Ilia Shumailov, científico informático de la Universidad de Oxford que dirigió el estudio, compara el proceso con tomar fotos de fotos: «Si tomas una imagen y la escaneas y luego la imprimes y repites este proceso, con el tiempo, básicamente el ruido abruma todo el proceso». Es lo que llama ‘colapso del modelo’.4
Euskara mundu digitalean posizio egokian kokatzeaz batera, ezinbestekoa da hizkuntzaren egoerari erreparatzea eta, beraz, itzulpen automatikoak eragiten dituen pitzaduretarako erremedioak bilatzen hastea (edo pitzadurez jabetzea behintzat). Alegia, erosotasunari, azkartasunari (?!) eta errentagarritasunari (?!) bakarrik begiratu ordez, hizkuntzaren kalitatea zaintzeko baliabideetan ere serio inbertitzea. Ez da erraza, seguru ezetz, baina, hori gabe —eta, batez ere, horretan pentsatzeko astirik hartu gabe—, jai dugu. Nonbaitetik hastearren, ez al litzateke komeniko profesionalen elkarteak, itzultzaile-interpreteak, itzultzaile-enpresak, itzulpen automatikoko sistemak garatzen diharduten enpresak eta ingeniariak, unibertsitatea, Euskaltzaindia eta EAEko eta Nafarroako administrazioak bilduko dituen eztabaida-foro bat, lan-mahai bat osatzea zer pauso, nola, zertarako eta zer abiaduratan eman behar diren eztabaidatzen hasi eta adosteko? Horra hor gure erakundeentzako eta gu guztiontzako enbidoa.
Amaitzeko, Itzuliz usu begiakera nator berriz (bakoitzak bere misalitoak ditu mesanotxean…), praktikotasunari buruzko hausnarketa ezin gaurkoago batekin (2019: 60):
Oso praktikoa izatearen sona du euskal gizarteak, gero eta hots gehiago entzuten ari gara bikaintasun zientifikoaren eta kultur estrategia eraginkorren alde […]. Teknologia, zientzia praktikoak, kultur ekimen aplikatuak dira etorkizuna. Hori da gaurko eragile politikoek eta akademikoek herri honentzat bilatzen dituzten plan estrategikoen muina.
Zer esan, nola egin logika horren guztiaren kontra? Liburuko teselok itzulpengintzarekin dute zerikusi nagusia, prestigio gutxi eta onura kultural handia daukan aktibitate batekin. Ez da jardunbide kosturik gabea, baina ezin da etekin ekonomikoekin huts-hutsik neurtu. Ez da, ordea, zuzena: duen kostua baino askoz ere gehiago ematen dio gizarteari. Arazoa da ematen duena ezin dela dirutan —errentagarritasunaren galgan— neurtu […]. Ikusten dudanean itzulpenen baremoak zentimoka neurtzen direla (demagun 0,65, 0,40, 0,15 zentimo hitzeko segun zein itzulpen-klase ordaintzeko), Lizardi imajinatzen dut bere poesia idazten hitzeko zenbat txakur txiki emango dizkioten kalkulatzen.
Orain bai, Berbelitz lagunari deitu (misalito berria!), eta «fu, fiu eta fa, noan fin-fin lotara» (Lertxundi, 2024: 118).5
BIBLIOGRAFIA
Del Olmo, Karlos (2024). Adimen artifizial sortzailea: paradigma aldaketaren eta disrupzioaren artean. Senez 55 (255-270. or.).
Egia, Gotzon (2023ko ekainaren 9a). Guk bezain gaizki itzultzen du.
Euskal Herriko Unibertsitateko Argitalpen Zerbitzua (2006). Espainiako Konstituzioa. LEGEAK bilduma 1.
Lertxundi, Anjel (2019). Itzuliz usu begiak. Alberdania.
——— (2001). Mentura dugun artean. Alberdania.
——— (2024). Berbelitz, Alberdania.
Limón, Raúl (2024ko azaroaren 11). Cuando la gastronomía termina como intervención quirúrgica: los traductores automáticos se encasquillan en los errores. El País.
Sáenz, Miguel (2013). Servidumbre y grandeza de la traducción.
Shumailov, Ilia eta beste (2024ko uztailaren 24a). AI models collapse when trained on recursively generated data.
UniCo (2024). Declaración de UniCo sobre el uso indiscriminado de la inteligencia artificial generativa en la corrección.
Oharrak
1. Anjel Lertxundiren Itzuliz usu begiak liburuko teseletako baten izenburua da «Altubeko malda», non, besteak beste, hau esaten baitu: «Gure sintaxi-trenaren erraila (subjektua-objektua-aditza) ez zaio egokitzen inguruko hizkuntzen errailen neurri ia gehienetan estandarrari (subjektua-aditza-objektua), eta gure trena beste errailetara behartzen dugunean, euskara baldarra ateratzen zaigu, segurtasun gutxi eta korapilo askokoa […]. Gutxi asko, idi nekatuak dira gure testu asko, zeinek gurdi astun bat daramaten pendiz lokaztu batean gora».
2. Betiere testuaren arabera, noski, eta itzultzaileak eta zuzentzaileak aurrez adostu duten lan-metodologiaren arabera.
3. Arazoa areagotu egiten da —oso nabarmen— testu-motaren arabera. Literatura-testuak lirateke adibiderik muturrekoena, jakina, itzulpen automatikoak, oraingoz behintzat, ez baitaki zer den metafora bat, zer den ironia, zer nahita egindako elipsi bat, zer begi-bistakoa ez den aditz-modu edo -aspektu baten erabilera… Baina ez dago literaturaraino joan beharrik. Saiakera-estiloko testu askoren idazkera ere ez du ondo ulertzen, eta horrek areagotu egiten du arriskua.
4. Hala ere, hor ere badira iritziak. Batzuek diote datu «sintetikoak» erabiltzea baliagarria dela, eta emaitzak hobetu egiten direla, eta ez gutxi. Adibidez, corpus elebidun gutxi dituzten hizkuntza txikiek —euskarak, kasurako— baliatzen dituzte datu sintetikook entrenamenduetarako. Bestalde, duela gutxitik hizpide den Deep Seek txatak —Txinatik heldutako adimen artifizialeko txata, AEBko ChatGPT ezagunaren lehiakide bihurtu dena— ChatGPT erabili omen du entrenamendurako datu-multzo handiak lortzeko; hala esan dute behintzat komunikabide askok.
5. Harrapazank, ELIA! Harrapazank, ITZULI!