Ordenagailuz lagundutako itzulpena eta itzulpenaren kalitatea
Itziar Bernaola, Ana I. Morales, Irune Payros

Artikulua PDFn.

Itzulpena automatizatzeko ametsa

Ezin dugu jakin Kristo osteko IV. mende hartan Jaun Done Hieronimok sekulan amets egin ote zuen, lanegun neketsuaren ostean buru unatua burkoaren gainean pausatzean, bere lan eskerga zelanbait erraztuko zuen makina mirakulutsuren batekin. Dena dela, halako amets lizunik eduki balu ere, ez genuke gogorregi hartu behar itzultzaileon patroi txit jakintsua, liburu bakarra itzultzeak bizitzako urte gehienak —hogeita hamar— kendu zizkiola kontuan hartuta.

Edozelan ere, ametsa hor egon da, eta oso aspalditik. Hamazazpigarren mendean Descartesek hainbat hizkuntzatako hitz baliokideak bilduko zituen hiztegi mekanikoaren ideia plazaratu zuen (Hutchings 1995), eta mende horren erdialdean aurkitzen dugu itzulpengintza zelanbait automatizatzeko lehen saioa, beste elizgizon baten eskutik: 1661ean Johannes Becher fraide alemanak metalengoaia matematiko bat asmatu zuen, edozein hizkuntzatako esaldiak deskribatzeko modua emango bide zuena. Character, pro notitia linguarum universali liburuan aurkeztu zuen bere metahizkuntza hori: zenbaki sail batzuek hitzen esanahiak adierazten ei zituzten, eta beste zenbaki batzuek, berriz, flexio hizkien semantika. Horrekin batera, Becher-ek ekuazio zerrenda batzuk ematen zituen, hizkuntza batetik besterako itzulpena modu "mekanikoan" egin ahal izateko (Freigang 2001).

Itzulpen automatikorako benetako lehen saio teknikoak 1930etan etorri ziren, Georges Artsruni ingeniari frantsesak eta P. Smirnov-Trojanskij ingeniari errusiarrak, nork bere aldetik, itzulpen makina bana patentatu zutenean (Freigang 2001). Makinok gai ziren zinta zulatu batean markatutako hizkuntza natural bateko hitz batzuk beste zinta zulatu bateko beste hizkuntza bateko hitzekin kidetzeko. Saio honetatik garrantzitsua da azpimarratzea Trojanskij-k sortutako zenbait printzipio eta prozedura indarrean daudela oraindik itzulpen automatikoan (Munk 1999): gaur egun analisi, transferentzia eta sorkuntza deritzen faseen parekoak, eta transferentzia eta interlingua printzipioak (ikus beherago).

Jakina, saio hauek, benetan ausartak eta batzuetan oso sofistikatuak izan arren, ezin zezaketen ondoren onik izan, hizkuntzari eta itzulpengintzari buruzko kontzepzio sinpleegitik abiatzen baitziren: alde batetik, ez dago inolaz ere frogaturik hizkuntza guztietan komuna den eduki logiko unibertsalik dagoenik, eta, bestetik, itzulpena ez da bi kodeko osagaien arteko "bat eta bat" erako korrespondentzia. Aitzitik, itzuli ahal izateko, beharrezkoa da hizkuntzaren analisi gramatikal eta semantikoa egitea, eta hiztunek dauzkaten ezagutza pragmatiko eta semiotikoak (kultura bakoitzeko sinboloei buruzkoak) kontuan hartzea.

Bigarren Mundu Gerraren ostean ahalmen handiko lehen kalkulagailuak garatu ziren, eta arlo militarrean zenbait zientzialarik proposatu zuten makina horiek mezu zifratuak hizkuntza naturaletara itzultzeko erabiltzea. Testuinguru horretan 1949an Warren Weaver ikertzaileak itzulpenaren eta dekodeketaren arteko analogia ezaguna plazaratu zuen Rockefeller Fundazioarentzat egindako txostenean: errusieraz idatzitako testu bat zera bezalakoa ei zen, ingelesez osatutako baina sinbolo ezezagunez idatzitako testua. Sinbolo ezkutu horien edukia eskuratzea omen zen eginkizun bakarra, eta horretarako teknika kriptografikoak, estatistika eta ustezko logika unibertsalaren esplizitazioa (hau da, hizkuntza ororen azpian bide zegoen logika komun horren formulazioa) besterik ez zen behar. Kontuan hartu behar da garai hartako baliabide eta teknika informatikoak oso mugatuak zirela, eta, beraz, ia ezinezkoa zela halako proposamenak praktikan frogatzea. (Freigang 2001, Abaitua 2002).

Itzultzaile automatiko baten lehenengo emaitza "ikusgarriak" 1954an lortu ziren, Georgetown Unibertsitatean egindako saio publiko batean: IBM ordenadore batek 49 esaldi itzuli zituen, zuzen itzuli ere, errusieratik ingelesera. Sistema hitzez hitzeko itzulpenean oinarritu zen, horretarako 250 berbako hiztegi bat eta ingeleseko hitz ordena lortzeko 6 erregela sintaktiko erabiliz. Lorpen horrek itzelezko oihartzuna izan zuen, eta itzulpen automatikoari buruzko itxaropen ikaragarriak ernarazi zituen. Estatu Batuetan inbertsio eskergak egin ziren itzulpen automatikoa ikertzeko, batez ere Defentsa Ministerioak, eta Kalitate Handiko Itzulpen Automatiko Hutsa (Fully Automatic High-Quality Machine Translation) ikerketaren helmuga bihurtu zen, ustez-eta hiztegi erraldoiak eratzea izango zela arrakastarako giltza.

Erregeletan oinarritutako itzulpen automatikoa

Puntu honetan geldiune bat egingo dugu gure errepaso historikoan, itzulpen automatiko hutsa (machine translation, MT) zertan datzan azaltzeko. Askotan "itzulpen automatikoa" terminoa modu zabalean erabiltzen da ordenagailua erabiliz egiten den edozein motatako itzulpen lana adierazteko, baina itzulpen automatikoa, berez, erregeletan oinarritutako itzulpen automatikoa da, hots: gizakiak itzultze prozesuan parte hartu barik eta erregela batzuk definiturik programa batek egiten duena. Abaituak (2002) bi metodo bereizten ditu:

zuzenak: hots, tarteko errepresentazio abstrakturik erabiltzen ez dutenak. Jatorrizko hizkuntzako hitzak hiztegian kontsultatzen dira, eta zuzenean beste hizkuntzako kideekin ordezkatzen dira. Gutxieneko erregela batzuk baino ez dira erabiltzen, kasuan kasurako sortutakoak, flexioa, komunztadura eta hitz ordena egokiak sortzeko. Gaur egun inongo sistemak ez du bide honetatik jotzen, hitzez hitzeko itzulpen honek ez duelako emaitza baliagarririk sortzen.
zeharkakoak: tarteko errepresentazioren bat erabiltzen dutenak. Bi motatako zeharkako metodoak daude:
- interlingua teknika darabiltenak (hau da, tarteko hizkuntza logikoa dutenak): metodo honen atzean dagoen filosofia da unibertsal semantikoena, hots, hizkuntza guztien atzean semantika bat bakarra dagoelako ustea. Ezagutza-base bat egiten da, hau da, informazio semantikoaren formalizazio bat, eta hori erabiltzen da itzulpena egiteko. Itzulpenean fase bi egongo lirateke: analisia (jatorrizko testuarena) eta sorkuntza (xede testuarena). Adibiderako, PHILIPS enpresaren ROSSETTA proiektuak Montague-ren gramatika erabiltzen zuen interlinguako errepresentazio semantikoa egiteko.
- transferentziaren teknika darabiltenak: tarteko errepresentazio bi erabiltzen ditu, bat hizkuntza bakoitzerako. Jatorrizko hizkuntzaren analisirako erabiliko den A errepresentazioa egiten da; gero A errepresentazio hori xede hizkuntzaren sorkuntzarako erabiliko den S errepresentaziora itzultzen da, eta azkenik, xede hizkuntzako emaitza sortzen da. Beraz, itzulpena hiru fasetan egiten da: analisia, transferentzia eta sorkuntza. Transferentzia maila lexikoan, sintaktikoan edo semantikoan egin daiteke. Transferentzia semantikoa asko hurbiltzen zaio interlingua metodoari.

Hizkuntzetatik erabat independentea den logika unibertsalaren ideia oso eztabaidagarria bada ere, esan beharra dago (Munk 1999) Interlinguaren Printzipioa kontzeptu multzo mugatua darabilten eremu txikietarako dela erabilgarrien, eta Transferentzia Printzipioa, berriz, eremu zabalagoetan erabiltzen dela (adibidez, web orriak itzultzeko). Transferentziaz egindako sistemen adibide batzuk METAL eta MÉTÉO ezagunak dira (ikus beherago).

Baina jarrai dezagun gainbegiratu historikoarekin. 50eko hamarkadako optimismo hark ez zituen, tamalez, espero ziren emaitzak bildu. Sistema automatikoek ez zuten maila onargarriko itzulpenik lortzen, testu ulergaitzak edo akatsez josiak baino. 1960an Yehoshua Bar-Hillel ikertzaileak, Massachussets-eko Institutu Teknologikoak (MIT) hamar urte lehenago itzulpen automatikoa ikertzeko beren-beregi izendatutako espezialistak, Kalitate Handiko Itzulpen Automatiko Hutsaren helburua albo batera uztea proposatu zuen, bai eta asmoen maila jaistea ere, argudiatuz giza itzultzaileek egindako testuen kalitatea lortzeko ezinbestekoa zela ezagutza semantiko eta pragmatikoak neurri handitan formalizatu eta sistemetan sartzea, eta hori artean ezinezkoa zela. 1964an Estatu Batuetako gobernuak ALPAC batzordea eratu zuen itzulpen automatikoaren egoera ebaluatzeko eta 1966an batzordeak balorazio negatiboa egin zuen txostenean: ordura arte itzulpen automatikoak ez zuen lortu testu zientifiko orokorrik ondo itzultzea, eta itzulpen automatikoa, oro har, gizakiek egindakoa baino geldoago, garestiago eta kalitate txarragokoa zen batzordearen ustetan. Txostenaren ondorioz, Estatu Batuetan diru iturriak itxi zitzaizkion itzulpen automatikoari, eta bertan behera geratu zen ikerketa. Hala ere, linguistika teorikoan eta informatikan 60ko hamarkadan barrena izugarrizko aurrerapenak egin ziren (Hutchings 1995, Freigang 2001, Abaitua 2002).

Edozelan ere, Europan eta Kanadan ez zen halako etenik gertatu, ez eta Japonen ere. 1976an Montrealeko Unibertsitateko TAUM taldeak MÉTÉO sistema aurkeztu zuen, interlingua baten bidez eguraldi parteak ingelesetik frantsesera itzultzen zituen sistema arrakastatsua. Urte berean Europako Komunitateak 60ko hamarkadan Georgetown Unibertsitatean diseinatutako SYSTRAN sistemaren lizentzia erosi zuen, programa hori bere barruko dokumentazio administratibo eskerga itzultzeko egokitu nahian. Erakunde biek jarraitu dute sistemok erabiltzen, eta, beraz, badirudi eremu oso murriztuetan (kontzeptu multzo oso mugatuak eta hizkuntza kontrolatua erabiltzen den eremuetan) itzulpen automatikoak baduela erabilgarritasunik eta emaitza onik. Dena dela, 1991n Europako Komunitateak itzulpen automatikoari buruzko Danzin txostena enkargatu zuen, eta txosten horren emaitzen ondorioz, itzal handiko proiektu bi bertan behera geratu ziren: EUROTRA proiektua, Europako Komunitateak 70eko hamarkadan abiarazitakoa, eta ROSETTA proiektua, PHILIPSek bultzatua. Japonen ere inbertsioak asko moteldu ziren (Abaitua 2002).

Esan liteke itzulpen automatikoa bere onenak emanda zegoela, eta bide horretatik ez zela askoz gehiago aurreratuko. Zuzentasun gramatikalean zerbait irabazteko, sistemak gramatika konplexuegiez eta hiztegi erraldoiez zamatu behar ziren. Gainera, gizaki batek eragiketa mental ikaragarri konplexuak egiten ditu instant batez: anbiguotasun lexiko, logiko edo sintaktikoak ebatzi, anaforen erreferenteak zuzen esleitu, egoeraren eta munduaren ezagutzaz baliatuta inferentzia egokiak egin, zubi kulturalak eskatzen dituen moldaketak paratu... Halako eragiketak egiteko gizakiak ezagutza semantiko, pragmatikoak eta semiotikoak erabiltzen ditu, eta ez zegoen modurik ezagutza horiek formalizatu eta sistemetan txertatzeko.

Ordenagailuz lagundutako itzulpenerantz

Nolanahi ere, erregela bidezko itzulpen automatikoaren aukerak gorabehera, ordenagailua sartua zegoen itzultzaileen bizitzan, eta horrek ekarritako iraultzaren tamainari oraindik ez zaio neurria hartu. Izan ere, 80 eta 90eko hamarkadetan gero eta ordenagailu ahaltsuago eta erlatiboki merkeagoak garatu ziren, eta eurekin batera itzultzaileen lanerako tresna informatiko ugari. Internet ere erabiltzaile arrunten etxe eta bulegoetara iritsi zen, eta amestu bariko ateak ireki zituen itzultzaileentzat. Aurrerantzean nekeza izango zen itzulpenaz berba egitea ordenagailuz lagundutako itzulpena (computer-aided translation, CAT) aipatu barik. Ordenagailuko laguntzek goitik eta behera eragin diote itzultzaileen beharrari haren fase guztietan:

a) Dokumentazio fasean: itzultzen hasi aurretik itzultzaileak bere burua jantzi behar du kasuan kasuko gaian eta terminologian. Freigang-ek (2001) dioenez, oraintsura arte liburutegi publiko eta pribatuak ziren itzultzaileentzako dokumentazio gune nagusiak. Horri erantsi beharko genioke itzultzaileak hain ezagun duen telefono bidezko kontsulta (kasuan kasuko adituei, erakundeei eta abar), ez beti ondo etorria eta ez beti emankorra, sarritan itzultzailearentzat ez baita erraza izaten elkarrizketa horietan ondo adieraztea zeintzuk diren argitu edo galdetu gura dituen ñabardurak. Bestetik, ez dugu ahaztu behar liburutegi eta telefono kontsulta horien denbora kostua, oso xehetasun garrantzitsua, itzultze lana askotan erlojuaren kontra egiten dela kontuan hartuta. Gauzak horrela, Internetek mundu bete aukera ekarri du itzultzailearentzat: ordenagailutik aldendu barik, kalitatezko kontsulta asko egin ditzake:

Interneteko bilatzaileen bidezko kontsultak, sarean argitaratuta dauden dokumentuak (egunkariak, aldizkariak, liburu osoak...), nahiz web orriak ikusteko.
Liburutegietako katalogoak, batzuetan artikulu osoak ere eskaintzen dituztenak.
Datu base terminologikoak eta hiztegi elektronikoak.
Datu base dokumentalak.
Itzultzaileen posta zerrendak: eztabaidagune hauek ikaragarrizko aukerak ematen dizkiete itzultzaileei, ez bakarrik dokumentazio faseko kontsultak plazaratzeko, baina baita terminologia bideak erkatu eta bateratzeko, eta itzultze prozesuko edozein arazo lankidetzan aztertzeko ere. Posta elektronikorako programa erabilerrazak edonoren esku egote hutsak ere izugarri leundu du dokumentuak eta materialak trukatu eta konpartitzeko bidea.

b) Testua osatzeko fasean: esan beharrik ez da testu prozesatzaileek itzultzaileen bizitzak erabat aldatu dituztela, bai testuen edizioari dagokionean (gainera, gaur egun edozein hizkuntzatako karaktereak prozesatzen dituzte Unicode-ri esker) eta bai testuak gorde eta berrerabiltzeari dagokionean. Adibiderako, MS Word-ek eskaintzen dituen tresnetako batzuk eguneroko ogia bihurtu dira itzultzaileentzat:

Dokumentuak konparatzeko tresna: horren bidez, antzeko bi dokumenturen artean zein alde dagoen jakin daiteke, eta lehendik itzulitako testutik zein zati zaigun baliagarri.
Bilatu/ordeztu: tresna honekin nahi ditugun testu zatiak bila ditzakegu dokumentuetan eta beste batzuekin automatikoki ordezkatu.
Editorean integratutako hiztegiak: oso baliagarriak kontsulta azkarrak egiteko eta sinonimoak bilatzeko.
Ebaki eta itsatsi: pentsa liteke tresna hau ez dela besteak bezain garrantzitsua, baina esan beharra dago bi funtzio horiek direla, ziurrenik, itzultzaile batek gehien erabiltzen dituenak.

Bestetik, datu baseak egiteko programek terminologia kudeatzen hasteko lehen pausoa eskaini zuten.

c) Testua zuzendu eta berrikusteko fasean: testugintzarako programek eskaintzen dituzten hizkuntza zuzentzaileez gain (ortografiko, gramatikal nahiz estilistikoak), badira giza zuzenketaren fasea erraztu, bideratzeko eta zuzenketei jarraipena egiteko laguntzak ere, adibidez MsWord-eko "iruzkinen" aukerak.

Aurrerapen guztiok, bere horretan, nahikoak lirateke XX. mendeko teknologiak itzulpengintzari egin dion ekarpenaren aurrean kapela eranzteko, denbora eta kostuan horrek suposatu duen aurrezpenagatik eta itzulpenen kalitate eta txukuntasunari egin dion mesedeagatik.

Analogietan oinarritutako itzulpena

Lehen esan dugunez, erregeletan oinarritutako itzulpena kale itsu batean sartu zen. Hala ere, itzulpenerako beren-beregi diseinatutako programen ikerketak aurrera jarraitu du, haien atzeko filosofia aldatu bada ere. Gorago aipatu bezala, Kalitate Handiko Itzulpen Automatiko Hutsaren asmoa bertan behera geratu zen, ez baitzirudien modurik zegoenik gizakiaren hizkuntz jokabidea makinen bidez erreproduzitzeko. Horrek ikuspegi aldaketa bat ekarri zuen: erreproduzitzeko modurik ez egon arren, agian gizakien ekintzak bildu eta analogiaz jokatzeko modurik egon zitekeen. Ikerketak erregeletan oinarritutako itzulpenaren bidea utzi eta norabide berri bat hartuko zuen, analogietan oinarritutako itzulpenarena, hain zuen.

Goian aipatu dugun mikroprozesadore eta ordenagailuen merkatze horrek zerikusi zuzena izan zuen ikerketaren garapenean. Izan ere, Abaituak (2002) dioenez, horri esker testu elektronikoen bilduma handiak sortu ziren, eta Internetek testuok edonoren esku jartzen zituenez, horrek modua eman zuen ahozkoaren tratamendurako dagoeneko erabiliak ziren teknika probabilistikoak ikerketa ildo berri honetan proban jartzeko. Abaituak analogietan oinarritutako hiru teknika bereizten ditu:

- Estatistika metodoen bidezkoa: jatorrizko hizkuntzako eta xede hizkuntzako corpus bana hartu eta lerrokatu edo parekatu egiten dira. Gero jatorrizko testuetako hitz bat edo batzuk itzulpeneko beste bat edo batzuen bidez itzulita egoteko probabilitateak kalkulatzen dira. Lehenengo saioa (estatistika erabiltzeko aukera Warren Weaber-ek aipatua bazuen ere 1949an) IBMko CANDIDE taldeak egin zuen 1990ean, Kanadako legebiltzarreko akten corpus elebiduna (ingeles eta frantsesa) erabiliz. Emaitzak oso onak izan ziren, sistemak ia esaldien erdiak zuzen itzuli zituelako, hitz berberekin edo hitz diferenteekin, baina zentzu bera emanez.

- Adibideetan oinarritutakoa: hau ere corpus elebidunez baliatzen da. Makoto Nagao japoniarrak proposatu zuen 1981ean, baina ez zen proban jarri 1989ra arte. Corpus elebidunak hartu, parekatu eta esaldiak edo sintagmak erauzi eta hautatzen dira. Hipotesia zera da, itzulitako testuak itzulpen berrietarako eredu izan daitezkeela. Metodo honetatik abiatuta garatu dira itzulpen memoriak.

- Itzulpen memoriak: teknika hau planteamendu ezin "ekologistago" batean oinarritzen da: ez da ezer bota behar; sortutako materialak ondo gorde, sailkatu eta gestionatu behar dira, gerora birziklatu egin daitezke eta. Gizakiak itzulpenak egiten ditu, eta gero testuok —segmentatuta eta jatorrizko segmentu bakoitzak bere itzulpenarekin parekaturik itzulpen unitate bat osatuz— memoria batean gordetzen dira. Dokumentu berri bat itzuli behar den bakoitzean, memoriak bere bilduma arakatzen du, ikusteko ea horren antzeko testurik itzuli den inoiz, eta hala bada, zelan itzuli zen. Abantailak begi bistakoak dira: denbora eta kostua ikaragarri aurrezten dira, eta itzulpenek koherentzian irabazten dute (Septuaginta-ren mirakuluaz geroztik —non itzulpen memoria nor-eta Izpiritu Santua bera izan zen— ez baita sekula lortu ekipo bateko itzultzaile guztiek testu bat bera berdin-berdin itzultzea; ezta itzultzaile batek testu bat bera beti berdin itzultzea ere). Sistema hauek, aurrerago azalduko dugunez, askotan errepikatzen diren testuak itzultzeko dira erabilgarrien (dokumentazio administratibo mota bat, enpresa batek sortzen duen tresna jakin bat erabiltzeko liburuxkak —esaterako, faxen eskuliburuak— eta abar), eta ez oso aldagarriak edo "pertsonalak" diren testuetarako (horien muturrean testu literarioak egongo lirateke, baina publizitate testuak eta gutun mota asko ere talde honetan sartzen dira).

Garrantzitsua da aipatzea merkatuko itzulpen memoria gehienek, memoriaren moduluaz gain, itzulpenerako beste programa oso erabilgarri batzuk ere badakartzatela: terminologiako datu baseak sortu eta gestionatzeko programak, segmentatzaile-lerrokatzaile automatikoak, eta dokumentuen formatuak bihurtzeko iragazkiak.

Abaituak (2000) dioenez, analogietan oinarritutako itzulpena corpus elebidunez baliatzen da, eta horregatik ikerketaren joera bat corpus horiek parekatzeko teknika eta moduetara bideratu da, zein izan daitekeen emankorrena ikertzeari begira. Abaituak, Martinez-i (1999) jarraiki, corpusak parekatzeko hiru ikuspegi nagusi bereizten ditu:

- estatistikoa: ezaugarri zenbatgarri batzuen antzekotasunean oinarritzen da, hala nola esaldien luzera, karaktere edo hitzen kopurua etab (adibidez, estatistikak ateratzen dira ikusteko jatorrizko corpusean halako luzera duten esaldiak zenbateko luzerako esaldien bidez itzuli diren), eta hortik aurreikuspenak egiten dira.

- linguistikoa: aurretik unitate sintagmatikoak edo mendeko egiturak parekatzen dira corpus bietan.

- mistoa: aurreko bien konbinazioa. Lerrokatze estatistikoa erabiltzen du, baina kategoria gramatikalen identifikazioaz osatzen du. Horretarako, testuetan aurretik etiketa sintaktikoak jarri behar dira, baina aurreko etiketatze lan hori oso luzea eta kostu handikoa da. Deustuko Unibertsitateko DELi taldeak beste proposamen bat egin du euskara eta gaztelaniazko corpus elebidun batekin LEGEBIDUNA proiektuan: testuan etiketa sintaktikoak jarri barik, etiketa estrukturalak jarri dituzte hizkuntza bakoitzeko corpusa segmentatzean.

Azkenik, eta atal honi amaiera emateko, aipatu nahi dugu badela itzulpen automatikoa (erregeletan oinarritutakoa) eta itzulpen memoriak konbinatzerik ere. Halaxe egiten dute Osasun Erakunde Panamerikarreko itzultzaileek, adibidez (León 2002): itzulpen memoriarako Wordfast programa erabiltzen dute, eta itzulpen automatikorako, berriz, erakundeko bertako sistemez baliatzen dira (SPANAM, gaztelaniatik ingeleserako itzultzeko, eta ENGSPAN, ingelesetik gaztelaniara itzultzeko).

Itzulpen memoriak^[1]

Aurreko atalean azaldu dugu itzulpen memoriak analogietan oinarritutako itzulpenaren aplikazio teknologikoak direla. Gizakiak berak egin eta ontzat emandako itzulpenak gorde egiten dira, gerora berriro erabiltzeko antzeko testuetan. Itzulpen posibleak proposatzeko, programak logika lausoan oinarritutako antzekotasun indizeak erabiltzen ditu.

Itzulpen memoriak, izatez, datu baseak baino ez dira, eta hainbat etxek merkaturatu dituzte datu base horiek eratzeko produktu teknologikoak: TRADOS (Translator's Workbench), ATRIL (Déjà-Vu), STAR (Transit), CHAMPOLLION (Wordfast) eta CYPRESOFT (Trans Suite), besteak beste. Itzultzaileak halako sistema batez lagunduta egiten badu lan, programako motoreak itzuli beharreko materialaren berdina edo antzekoa bilatuko du memorian, eta egokia izan daitekeena emango du.

Itzulpen memorien inguruko kontzeptuak

1) Itzulpen unitateak

Arestian esan dugunez, itzulpen memoriak datu baseak dira. Baina, nola gordetzen da itzulpena datu baseotan? Fitxategietan gordetako itzulpenak tratatu egin behar dira memorian edo datu basean sartzeko: fitxategietako informazio guztia gordetzen da, baina zatikatuta. Izan ere, itzulpen memoria itzulpen unitate deitzen diren zatiki horiek osatutako datu basea da.

Definizio hori emanda, itzulpen unitatea zer den ere azaldu beharko dugu: jatorrizko hizkuntzan idatzitako testu zatia eta zati horren ordaina den xede hizkuntzakoa biltzen dituen segmentu parea (ikus 6. pantailako beheko leihoa). Unitate horien mugak zeintzuk diren irizpide kontua da: esaldia, paragrafoa, hitza, hitz multzoa, sintagma, egitura atala.... (Abaitua 1997b). Itzulpen unitateak memorian gordetzean, zenbait ezaugarriz hornitu daitezke, nolabait sailkatzeko. Ezaugarri horiek atributuak dira (ikus beherago).

2) Segmentuak

Itzulpen memoriekin lan egitean, gordailu horretan dauden unitateak (zatiki bakoitza eta bere ordaina) berriz erabili eta konbinatzeko aukera ustiatzen da. Zeintzuk dira, orduan, segmentu egokiak itzultzailearentzat? Hortxe dago gakoa: itzultzaileak aukeratuko duen unitateak egokia izan behar du egin nahi duenerako. Beraz, pentsa daiteke segmentuaren neurria arbitrarioa dela eta itzultzailearen beharren arabera definitu daitekeela.

Hala ere, merkatuan dauden programak erabiltzean itzultzaileak ezin du definitu segmentua; programek beraiek daukate segmentuaren neurria zehaztuta, eta eskaintzen zaizkion aukeretatik bat hautatu beharko du itzultzaileak lan egiteko. Segmentu batek itzul daitekeen item bat izan behar du gutxienez (letra bat behintzat), eta normalean esaldiak izaten dira, puntuazioko marka baten bidez adierazitakoak (puntua, galdera ikurra, harridura ikurra, eta abar). Baina batzuetan beharrezkoa gerta daitekeenez paragrafo osoak itzultzea, aukera hori ere ematen dute.

Dena dela, segmentu erabiliena esaldia da eta horrek arazoak sortzen ditu laburdurekin. Izan ere, programak, besterik adierazten ez bazaio, esaldi markatzat hartzen du laburduraren osteko puntua eta hortxe zatitzen du testua. Horri aurre egiteko, zerrenda bat osatu behar da, laburdura erabilienak jasoko dituena. Programak ezagutu egingo ditu zerrendako laburdurak eta ez du testua zatituko horietako bat aurkitzean.

3) Atributuak

Itzulpen unitatea definitu dugunean beste hitz bat ere erabili dugu: atributuak. Atributuak itzulpen unitateen ezaugarriak dira, guk definitzen ditugunak. Esate baterako, itzultzailearen izena, bezeroarena, itzulpenaren gaia, idatzi mota, eta abar.

Atributuak lagungarri dira itzulpen memoria antolatzeko, eta itzulgaiaren ordain gisa memoriak proposatuko duen testuari buruzko informazioa emango diote itzultzaileari. Itzultzaileak, atributuei esker, eman zaion ordaina noizkoa den jakingo du (testua zaharra ala berria den, eta oraindik normalizazio bidean dagoen euskara bezalako hizkuntza baten kasuan datu horrek badu bere garrantzia), itzulpena nork egin zuen (eta memorian itzultzaile baten baino gehiagoren testuak sartuko badira garrantzitsua izan daiteke batzuetan itzulpena nork egin zuen jakitea), norentzat egin zen itzulpena eta zein testu motatarako (testu motak ere baldintzatzen du itzultzeko era: ez da gauza bera gutun bat itzultzea edo web orri bateko testua itzultzea).

Itzulpen memorien funtzionamendua

Jakin beharreko kontzeptuak behin definituta, merkatuan dauden itzulpen memoriekin lan egiteko modua zein den azalduko dugu. Itzultzaileak halako aplikazio bat eskuratzen duenean egin behar duen lehenengo gauza da memoria sortu (hots, datu basea) eta memoria hori elikatu. Eta nola elikatzen du? Bi bide ditu: hutsetik hasi eta itzuli ahala jatorrizko zatiki bakoitza dagokion itzulpenarekin memorian gorde, edo lehendik eginda dituen itzulpenak euren jatorrizko testuekin lerrokatu (parekatu) eta memoriara eraman.

1) Fitxategiak prestatu eta lerrokatzea

Testuak, memorian sartzeko, zatikatu edo segmentatu egin behar dira. Prozesu hori automatikoa da, merkaturatutako aplikazio guztiek programa bat eskaintzen dutelako lan hori egiteko. Eta, gainera, lerrokatu ere egiten dituzte segmentu horiek.

Itzultzaileak eman beharreko lehen urratsa, beraz, hauxe da: dokumentuak lerrokatzeko programa ireki eta lerrokatu nahi dituen jatorrizko hizkuntzako testua eta xede hizkuntzako testua pantailaratu. Esan gabe doa jatorrizko testua eta xede hizkuntzako testua fitxategi banatan egon behar direla gordeta, lerrokatzeko programek ezin dutelako egin lan bi hizkuntzetako testuak fitxategi bakarrean badaude. Ondoren, erabili nahi duen segmentuaren neurria aukeratu behar du itzultzaileak eta programak ezagutu behar dituen laburduren zerrenda osatu.

2. pantaila: segmentatu eta lerrokatutako bi dokumentu

Programak jatorrizkoa eta xede hizkuntzako testua segmentatu eta lerrokatu ondoren, itzultzaileak begiratu egin behar ditu programak egindako lerrokatzeak, zuzenak diren ala ez egiaztatzeko. Ondoren, lerrokatuta dauden itzulpen unitate horiek memoriara pasatzeko agindua ematen zaio programari eta bertan gordeko dira itzultzaileak hurrengo batean erabil ditzan. Memorian itzulgaiak eta horren itzulpenak unitate bakarra osatzen dute, programak zatiki bakoitza ondo bereizten badu ere.

2) Elikatutako itzulpen memoriaz lan egitea

Eta nola egingo du lan itzulpen unitateak gordeta dauzkan memoriaz baliatu nahi duen itzultzaileak? Lehenik eta behin memoria irekita izanda ordenadorean.

Itzultzaileak, itzulgaia helduko zaionean, itzulpen memoriek daukaten baliabide batera joko du: testua itzultzen hasi baino lehen, testu hori aztertzeko esango dio memoriari. Memoriako segmentatzaileak testua zatikatuko du, eta segmentu horietako zenbaten ordaina eman dezakeen adieraziko. Gainera, datu basean aurkitu dituen ordainen parekotasun maila zenbatekoa den ere jakinaraziko du. Kopuruak zenbatekoak diren ikusita, itzultzaileak erabakiko du testua zuzenean itzuliko duen eta memorian gorde ala tresna hori gabe itzuliko duen eta gero lerrokatuko dituen fitxategiak memoriara pasatzeko^[2] (ikusi 3. pantaila).

3. pantaila: Itzuli beharreko dokumentua aztertzeko

Erabakitzen bada memoriaz egitea lan, memoriako "itzuli" aukera erabiliko da, datu basean gordeta dauden segmentuen ordainak makinak berak eman ditzan (ikusi 3. pantaila). Itzultzaileak badu zehaztea %100ean berdinak diren segmentuen ordainak bakarrik emateko, ez guztienak; edota, egokitzat hartzen badu, parekotasun maila handia dutenenak baita ere (esate baterako, %85).

4. pantaila: Workbenchek testua itzultzea

Itzultzaileak, itzuli beharreko fitxategia irekiko duenean, beste era batera ikusiko du: zati batzuk itzulita eta beste batzuk itzuli gabe (baina jatorrizko testua kopiatuta). Dokumentua osatzen hasita, itzuli gabeko zati batera heltzean, eta zati hori memorian gordetako baten antzekoa bada (baina dokumentua itzultzeko agindu dugunean zehaztutako parekotasun mailara heldu gabe), memoriak ordaina emango dio eta azalduko dio zenbatekoa den aldea (zenbakiak emateaz gain, kolore desberdinak erabiltzen dira segmentua berdin-berdina edo antzekoa den adierazteko). Adibide moduan, ikusi 5. pantaila:

5. pantaila: parekotasun desberdineko segmentuak

Parekotasuna %100 ez denean programak berak esaten digu zein den memorian gordetako jatorrizkoaren eta oraingo jatorrizkoaren arteko aldea, hau da, markatu egiten ditu desberdinak diren hitzak (hori jakiteko, hala ere, Word pantaila utzi behar dugu eta memoriako programaren pantailara joan, edo pantaila erdibitu, goian Word eta behean Workbench, TRADOSen memoria programa, ditugula). Ikusi 6. pantaila:

Itzultzaileak banan-banan «konpondu» beharko ditu halako segmentuak, eta ordainik proposatzen ez denean osorik itzuli. Unitate berri horiek guztiak, bai «konponduak» bai hutsetik itzuliak, memorian gordeko dira eta, horrela, memoria handituz joango da.

Testu guztia itzuli eta egiaztatu ondoren, dokumentua garbitu egin behar da bezeroari emateko. Izan ere, memoriaz itzulitako dokumentuak 5. pantailan ikusten den moduan geratzen dira. Programak berak egiten du garbiketa lan hori, eta orduantxe pasatzen ditu itzulpen unitateak memoriara (ikusi 7. pantaila).

3) Memoria nagusitik memoria txikietara

Memoria zenbat eta handiagoa izan, hots, zenbat eta itzulpen unitate gehiago gorde, denbora gehiago beharko du itzuli beharreko segmentuaren ordaina topatzeko. Horrexegatik, gomendatzen da itzulpen memoria txikiak ateratzea itzulpen memoria nagusitik, itzuli beharreko testurako aproposak izango direnak, eta horiekin lan egitea. Aplikazioek lan hori ere automatikoki egiten dute (ikusi 3. pantaila): itzulgaia aztertzeko agindu behar zaio memoriari eta hori egin ostean, memorian aurkitutako segmentu berdinen edo antzekoen kopurua esanguratsua dela uste dugunean, lan horretarako memoria sortzeko eskatuko diogu programari ("Crear TM del proyecto"). Jatorrizko testua memoria txiki horretaz baliatuta itzuliko da nagusiarekin egin beharrean. Hala egitean, antzekotasunik izango ez duten segmentuen ordainak memorian bilatzeko denbora gutxitu egingo da: memoria nagusitik ateratako memoriak askoz unitate gutxiago izango dituenez, bilaketa azkarrago egingo da. Itzulpena bukatu ondoren dokumentua garbitzeko agindua memoria nagusitik emango dugu eta itzulpen unitate berriak bertan gordeko dira, beste batean erabiltzeko.

Testuen antzekotasuna

Atal honi amaiera emateko, argi utzi nahi dugu azalpenean zehar behin baino gehiagotan aditzera eman dugun ideia. Itzulpen memoriak bilaketa motorrak dira, itzultzaileak itzuli beharreko segmentuaren antzekorik memorian gordeta dagoen ala ez jakiteko bidea. Beraz, memoria horiek emaitzak eman ditzaten, itzultzaileak esku artean duen testuak aurreko baten berdina edo antzekoa izan behar du, denboran zehar errepikatuko den testua. Alferrekoa da gerora inork sekula erabiliko ez dituen segmentuak gordetzea memorietan. Ildo horretatik Champollionek gomendatzen du noizean behin memoria arakatu eta aspaldian erabili gabeko unitateak ezabatzeko, horrela memoria aurrezteko (Champollion 1999 2002).

Segmentazioa eta itzulpenaren kalitatea

Itzulpen memoriekin lan egiteko modua azaldu dugunean behin eta berriro aipatu dugun hitza segmentazioa izan da. Testua segmentuetan banatzeak abantaila nabarmenak ditu itzultze lana bera egiterakoan, nahiz eta itzultzaileak aurretik jakin bere itzulpen memorian ez duela aurkituko unitate baliagarririk, edota itzulpen hori gero memorian gordetzeko asmorik ez izan arren. Honela laburbiltzen ditu abantaila horiek Champollion-ek (1999 2002):

1) Begietako tentsioa gutxitzea: modu tradizionalean behar egitean, itzultzaileak begirada paperetik ordenadoreko pantailara eta pantailatik paperera aldatzen du etengabe eta begiek sarri aldatu behar dute enfokea minutu batean.

2) Buruko tentsioa gutxitzea: esaldi bat itzuli ondoren itzultzaileak papera begiratu behar du itzulitako azken esaldia paperaren barruan aurkitzeko eta hurrengoa irakurtzeko. Eginbehar horrek ahalegin handia eskatzen du.

3) Laneko hutsegiteak murriztea: itzultzaileak, tentsioaren eraginez, esaldiren bat irakurtzeke eta itzultzeke utz dezake. Eta beste batzuetan elkarren segidan dauden esaldiak oso antzekoak izan daitezke eta itzultzaileak horietako bat itzuli gabe utz dezake. Halakoetan, hutsegitea larria da, penalizazioa izan daitekeelako kalitate kontroletan. Baina testua segmentatua duela lan egiten duen itzultzaileari ez zaio horrelakorik gertatuko: programak itzulpena segmentuka egitera derrigortuko du (testu kutxa huts bat zabalduko zaio pantailan segmentu bat amaitzen duen bakoitzean) eta ezingo du utzi zatirik itzultzeke. Horrez gain, antzeko esaldietako lehena behin itzulita, ordaina proposatuko dio gainerako guztiak itzuli behar dituenean.

Horri eransten bazaio lana bukatzean segmentu parekatu guztiak (itzulpen unitateak) ondo gordeta eta atributuz hornituta biltegiratuko direla memorian, argi geratuko da segmentazioak zernolako onura itzelak dituen itzulpenerako.

Hala ere, segmentatzailearekin lan egiteak badauzka bere arriskuak itzulpenaren beraren kalitaterako, eta post-edizio lan arduratsua eskatzen du, gure itzulpenak zenbait arriskutatik babestu gura baditugu. Hiru mailatan bereiztu ahal dira arriskuok:

1) koherentzian
2) kohesioan
3) erretorika testualean

Itzulpengintzak testua dauka langai, ez hitzak edo esaldiak, eta, beraz, Diskurtsoaren Analisiaren barruan aztertu behar dira haren produktuak. Diskurtsoaren interpretaziorako printzipio funtsezko bi koherentzia eta kohesioa ditugu.

Koherentzia

Esan izan da (Blum-Kulka 1986 2000) koherentzia testuko parteen artean dagoen esangurazko erlazio potentzial ezkutua dela, irakurleak edo entzuleak ageriko bihurtzen duena interpretazio prozesuen bidez. Diskurtsoa koherentea da irakurlearentzat, baldin eta irakurleak, kasu bakoitzean dagozkion eskemak aplikatuta (adib. munduaren edo kultura jakin baten ezagutzan, gaiaren ezagutzan edo generoaren konbentzioen ezagutzan oinarritutako eskemak), testua ondo ulertzeko inferentzia egokiak egin baditzake.

Irakurleria jakin batentzat idatzitako testua beste irakurle batzuei zuzenduz gero, gerta daiteke testu horrek koherentzia-eten ugari izatea, batez ere erreferentzien arloan. Pertsonen, lekuen edo beste testu batzuen aipamenak berebiziko zeregina bete dezake testu baten koherentzia eraikitzean, eta itzultzaileak erabaki behar du zein neurritaraino azaldu behar dion irakurleari jatorrizko testuaren erreferentzia sarea, eta zein neurritaraino egokitu behar duen.

Ildo honetatik joango lirateke Nida-ren "baliokidetza dinamikoaren kontzeptua" (Nida 1964) edo Newmark-en "itzulpen komunikatiboaren nozioa" (Newmark 1981)^[3]. Testuak irakurlearengan ustez sortu behar lukeen eragina gogoan hartuta sortutakoak dira kontzeptu biak, eta testu jakin batzuetan pentsatuz garatutakoak. Labur esateko, itzulpenaren helburu nagusia irakurlearengan eragin jakin bat sortzea bada (Nida-k Biblia aipatzen du, eta Newmark-ek, berriz, "testu komunikatibo" deritzenak: administrazio, publizitate, kazetaritzako testuak etab.), itzulpena jatorrizkotik askatu beharra dago, eta irakurlearengan jatorrizko testuak sortzen zuenaren pareko efektua sortzeko behar diren egokitzapen guztiak egin, formalak eta bestelakoak. Egokitzapen horiek jatorrizko testuaren egituran aldaketa nabarmenak egitea eska dezakete, koherentziaren mesedetan.

Adibide bat ikusteko, Euskal Agintaritzaren Aldizkarian argitaratutako okerren zuzenketa bat ekar genezake hona. Lehendabizi erabaki bat argitaratu zen aldizkarian, euskaraz eta gaztelaniaz, testuak zutabe banatan, ohi bezala. Erabakia argitaratu ondoren, gaztelaniazko testuan akats batzuk antzeman ziren, eta, beraz, akats horiek zuzentzeko beste ohar bat prestatu zen argitaratzeko, "donde decía... debe decir" erakoa. Akatsen zuzenketa hori itzultzerakoan, itzultzaileak ohartu ziren akatsak bi motatakoak zirela:

baziren gaztelaniazkoan eta euskarazkoan azaltzen ziren akatsak
baziren gaztelaniazkoan bakarrik azaltzen ziren akatsak

En la página número 22783, concurso número 27, donde dice: Actividades docentes a realizar por quien obtenga la plaza: Física Apicada; debe decir: Actividades docentes a realizar por quien obtenga la plaza: Física Aplicada.	EZ
En la página número 22791, concurso número 94, donde dice: Actividades docentes a realizar por quien obtenga la plaza: Genética de Poblaciones y Genética Evolutiva. Fundamentos de Biología; debe decir: Genética de Poblaciones y Genética Evolutiva. Fundamentos de Biología Aplicada (Genética).	22791. orrian, 94. lanpostuan, honakoa dioenean: Plaza lortuko duenak egin beharreko irakaskuntza jarduerak: Populazioen genetika eta bilakaeraren genetika. Biologiaren oinarriak; honakoa esan behar du: Plaza lortuko duenak egin beharreko irakaskuntza jarduerak: Populazioen genetika eta bilakaeraren genetika. Biologia aplikatuaren oinarriak (Genetika).
En la página 22797, concurso número 150, donde dice: Actividades docentes a realizar por quien obtenga la plaza: Diseño Asistido por Ordenador; debe decir: Diseño Asistido por Ordenador. Expresión Gráfica.	22797. orrian, 150. lanpostuan, honakoa dioenean: Plaza lortuko duenak egin beharreko irakaskuntza jarduerak: Ordenagailu bidezko diseinua; honakoa esan behar du: Plaza lortuko duenak egin beharreko irakaskuntza jarduerak: Ordenagailu bidezko diseinua. Adierazpen grafikoa
En la página 22808, concurso número 237, donde dice: E.Y. de Enfermería (U.D. Donostia-San Sebastián); debe decir: E.U. de Enfermería (Donostia - San Sebastián).	EZ

Beraz, euskal itzultzaileak bere bertsioa benetan testu autonomo eta koherentea egingo bazuen (hau da, abiapuntu izanda euskal irakurleak euskarazko bertsioa besterik ez duela irakurriko), gaztelaniazko bi paragrafo itzuli barik utzi beharko zituen, gaztelaniaz egindako akats horiek ez zirelako euskaraz egin erabakia lehenengoz argitaratu zenean, eta inkoherentzia edo koherentzia-etena izango zelako esatea aurreko argitalpenean halako edo holako gauza idatzi zela, benetan halakorik egin ez baldin bazen.

Itzulpenak segmentatzailea erabiliz egiten direnean, arriskua dago itzultzaileari oharkabean joateko hasieran esan dugun hori, hots, itzultzailearen langaia testua dela, diskurtsoa, hau da: banakako hitz, esaldi edo paragrafoez gorako makrounitatea. Segmentatzailearekin lan egitean itzultzailearen arreta begi aurrean zabaltzen zaion kutxaren barruko testu zatira mugatzen da, eta oso erraza da horri baino ez erreparatzea, eta, ondorioz, koherentziak (eta baliokidetza dinamikoak edo itzulpen komunikatiboak) eskatzen dizkion egokitzapen edo moldaketak azpi-unitate horretara bakarrik murriztea, testuaren osotasunak eskatzen dituenak bistaz galduta. Beste adibide honek ere ederto erakusten du azaldutakoa; izan ere, segmentatzailea erabilita ezinezkoa izango litzateke ondorengo testua itzultzaileak antolatu duen bezala antolatzea:

Gaztelaniaz:

La Escuela de Ingeniería Técnica Industrial de Bilbao, con el fin de lograr unos titulados con un perfil adecuado a las necesidades tecnológicas de las zonas en que están ubicadas y, además respetar la libertad que desde las directrices generales se ofrece para que el estudiante perfile su propio diseño curricular, ha organizado el conjunto de materias optativas —que completan las materias obligatorias que garantizan al futuro titulado su plena capacitación técnica— de modo que el futuro titulado posea una capacitación en dos entornos profesionales de gran importancia. Para conseguir ese importante objetivo las materias optativas estarán organizadas en dos líneas curriculares, de manera que cada alumno o alumna debe elegir necesariamente una de ellas.

Euskaraz:

Bilboko Industria Ingeniaritza Teknikorako Unibertsitate Eskolaren nahia da inguruko premia teknologikoetara egokitutako tituludunak prestatzea, baina ikasle bakoitzak bere curriculum diseinua zehazteko irizpide orokorrek eskaintzen duten askatasuna errespetatuta. Horretarako, hautazko irakasgaiak antolatzean, gure helburua izan da ikasleek etorkizunean garrantzi handiko bi esparru profesionaletan aritzeko gauza izan daitezela. Hautazko irakasgaiak —hots, titulua eskuratuko duenaren gaitasun teknikoa bermatzen duten derrigorrezko irakasgaien osagarriak— beraz, bi curriculum ildotan banatu dira eta ikasleek horietako bat aukeratu beharko dute nahitaez.

Izan ere, segmentatzaileak lehen puntuaren ostean egingo luke lehenengo banaketa, eta horrainoko guztia paragrafo batean itzultzera behartuko gintuzke:

{0>

La Escuela de Ingeniería Técnica Industrial de Bilbao, con el fin de lograr unos titulados con un perfil adecuado a las necesidades tecnológicas de las zonas en que están ubicadas y, además respetar la libertad que desde las directrices generales se ofrece para que el estudiante perfile su propio diseño curricular, ha organizado el conjunto de materias optativas —que completan las materias obligatorias que garantizan al futuro titulado su plena capacitación técnica— de modo que el futuro titulado posea una capacitación en dos entornos profesionales de gran importancia.

<}0{>

<0}

Kohesioa

Hasieran aipatutako beste printzipioa aintzat hartuta, bestetik, esan genezake kohesioa testuko parte guztiak elkarrekin lotzen dituen erlazio agerikoa dela, hizkuntz marka berezien bidez adierazia (Blum-Kulka 1986 2000). Maila testualean egindako zenbait ikerketek erakutsi dutenez (Levenston 1976, Berman 1978, biok Blum-Kulka 1986 2000n aipatuak), kohesio elementuen esplizitutasun mailak eta marka motak aldatu egiten dira hizkuntzatik hizkuntzara. Hizkuntza batzuek, esate baterako, errepikapen lexikala nahiago dute, eta beste batzuek, aldiz, erreferentziakideak (izenordeak, juntagailuak, sinonimoak, elipsiak...).

Ikus adibide hau, eta erreparatu bakoitzean letra etzanean nabarmendutako erreferentziakideei (Blum-Kulka 1986 2000-tik hartutako adibidea):

Ingelesa:

Marie was helping Jimmy climb the biggest branch of the tree in the front yard, to start work on their tree house. The branch looked very strong but when Jimmy grabbed hold, it sarted to crack. He might really get hurt!

Frantsesa:

Marie était en train d'aider Jimmy à grimper sur la plus haute branche de l'arbre du jardin pour commencer à construire leur cabane. La branche avait l'air tres solide, mais quand Jimmy l'attrapa, elle commença à craquer. Il pourrair vraiment se faire mal.

Itzultze prozesuak, Blum-Kulka-k dioen moduan, diskurtsoaren interpretazio eta prozesamendu konplexua eskatzen du, eta horren barruan testu osoari batasuna eta esanahia emango dioten kohesio tresnak ondo erabiltzea. Hemen ere, segmentatzaileak sortzen duen fragmentazioak zera ekar dezake:

a) alde batetik kohesiorako markatzaileak jatorrizkoaren orpotik erabiltzea, eta ez kasuan kasuko hizkuntzan usuago direnak (hots, itzultzaileak une bakoitzean begi aurrean daukan testu zatia horren arabera itzultzea) eta

b) testu osoaren batasuna bistaz galdu eta kohesiorako markatzaile desegokiak erabiltzeagatik, esanahia lausotzea. Esate baterako, badirudi euskarak joera handiagoa daukala errepikapen lexikala edo sinonimia erabiltzeko, eta gaztelaniak, berriz, erreferentziakideez baliatzeko. Gaztelaniaz izenordain pertsonal edo erakusleak erabiltzen direnean lehen aipatutako gauza bati erreferentzia egiteko (él, ésta, mirarlo, invitarla, indicarle, el cual) hiztunari genero gramatikalari buruzko informazioa ematen zaio, eta horrek anbiguotasunak gutxitzen laguntzen du. Euskarak ez du genero gramatikala markatzen (hiketako adizkietan salbu), eta horregatik errentagarriago zaio anbiguotasun gutxien eta informazio gehien emango duten kohesio markak erabiltzea, hots, unitate lexikalak.

Eman dezagun gaztelaniazko testu hau daukagula:

1) "El recurrente insultó a la institución, con lo que obligó a ésta a tomar las medidas oportunas para poner fin a semejante atropello."

Hauek izango lirateke erreferentziakideak (lexikalak eta bestelakoak):

Errekurtsogilea: "El recurrente"/"[él]" ("obligó"-ren subjektu eliptikoa)
Erakundea: "La institución"/"ésta"/"[ella]" ("tomar"-en subjektu eliptikoa)
Ekintza: "El recurrente insultó a la institución" (esaldi osoa)/"lo que"/"semejante atropello"

Ikusi orain euskarazko itzulpena:

2) "Errekurtsogileak erakundea iraindu zuen, eta horrek erakundea neurriak hartzera behartu zuen, halako bidegabekeriari amaiera emateko."

Euskaraz, ikusten denez, "erakundea" item lexikala bi bider agertzen da, izenordain erakuslea erabiliz gero, lausotu egingo litzatekeelako hiru elementuen arteko bereizketa (errekurtsogilea=el recurrente/erakundea=la institución/horrek=lo que).

Eman dezagun aurreko paragrafoaren ostean honako hau daukagula:

3) "Persistiendo aquél en su empeño, se prodece a convocar al Comité de Disciplina...".

Gramatika aldetik ez legoke arazorik esaldia honela hasteko:

4) "Hark bere jokabideari eutsi zion, eta Diziplina Batzordea biltzeko deia egin zen".

Isolatuan zuzena izan arren, euskaraz esaldi hori anbiguoa da, eta gainera, argudia liteke kohesio lausoegia duela (Blum-Kulka 1986 2000) aurreko paragrafoarekiko. Bestela esanda, banan banaka hartu beharrean zati biek unitate bat osatzen dutela kontuan hartu bagenu, honelako zerbait itzuliko genukeen:

5) "Hala ere, errekurtsogileak bere horretan jarraitu zuen, eta horregatik Diziplina Batzordea biltzeko eskaria egin zen" [edo, hobeto, "Diziplina Batzordea biltzeko eskaria egin zuen x-k", subjektua nor den ikertzea lortuz gero; itzultzaileari bigarren pauso hau ematea bururatzea ere zailagoa da paragrafo edo esaldi mailan mugitzen bagara, testu osoa kontuan izan barik].

Ikusten denez, izenordaina kendu eta item lexikala jartzeaz gain, juntagailu bi erantsi ditugu kohesioa sendotzeko, eta lausotasuna gutxitu egin da. Gogoan izan behar dugu itzultzaileei sarritan suertatzen zaiela zazpi, hamar edo hamabi orriko testu monotonoak itzuli beharra, non behin eta berriro azaltzen diren "la citada resolución", "la misma" , "la cual", "el cual", "cuyo", "aquel", "éstas", "los susodichos", "en su virtud" eta halako markatzaileak, eta testu beraren barruan askotan item jakin bakoitzaren erreferente posibleak ugariak direla ("nortzuk ziren "aquellos?" galdetzen du itzultzaileak behin baino gehiagotan, "nor da 'su' horren erreferentea 'en su virtud' dioenean?"). Gainera, arriskua dugu xede hizkuntzari berezko zaizkion kohesio elementuak ez erabiltzeko, eta jatorrizkoak kopiatzeko. Kohesioari testu osoan barrena eustea eta lexikalak ez diren kohesio loturen erreferente zuzenak asmatzea askoz ere lan zailagoa da segmentatzaileak emandako unitateak banan bana itzuliz gero.

Erretorika testuala

Hirugarrenez, erretorika testualari dagozkion arazoak aipatuko ditugu. Testu antolaketa jakin bat oso egokia izan daiteke jatorrizko hizkuntzarako, dela kultura eta hizkuntza horretan tradizio luzea daukalako (eta beraz irakurleak ohituta daudelako berarekin), dela hizkuntza horren sintaxiari bortxa egin ez-baina xamur isurtzen uzten diolako etab. Hala ere, testu antolaketa bera xede hizkuntzako testuan guztiz desegokia izan daiteke, eta goian aipatutako arrazoien alderantzizkoengatik: bere tradizioan halakorik sekula egon ez delako (eta beraz arrotza edo deserosoa suerta daitekeelako) edo hizkuntza horren gramatikaren aurka doalako. Softwarearen lokalizazioaz hainbeste berba egiten den garai honetan, lokalizazioaren kontzeptua oso erabilgarria gerta daiteke erretorika testualerako ere. Hiztunengan eraginen bat izateko edo hiztuna zerbait egitera bultzatzeko helburua duen itzulpena ("itzulpen komunikatiboa", Newmark-en terminologia erabiliz), testuaren antolamenduaren alderdian ere lokalizatu behar da.

Administrazioan diharduten euskal itzultzaile gehienek oso ezagunak dituzte Hizkera Argiaren Bidetik (1994) eta Argiro idazteko proposamen eta ariketak (1997) eskuliburuak. Izenburuek eurek oso argi erakusten dute zein den euren predikuaren nondik norakoa: administrazioak argiro ("komunikatiboki") egin behar dio berba herritarrari, eta ez bakarrik sintaxiari dagokionez, baina baita dokumentuen egitura erretorikoaren aldetik ere. Ikus, adibidez, gaztelaniazko agiri hau:

Dña. Mirentxu Zabalegi Arriortua, como jefa del Negociado de Títulos de la Universidad del País Vasco/Euskal Herriko Unibertsitatea,

CERTIFICO QUE:

D/DÑA ...............................
Natural de ..............................., con documento nacional de identidad (o pasaporte) ................... y domicilio en ................. calle........... nº......... ha cursado y superado en el año académico/bienio/trienio ........., ........ créditos del programa aprobado por la Junta de Gobierno y pagado los derechos de expedición del títulos:

Master universitario en
.................................

Y para que surta los mismos efectos del Título, con carácter provisional hasta que éste se edite, expido la presente certificación, a solicitud del interesado en Leioa, a ..... de marzo de 2001.

Dokumentu hau segmentatzaileaz itzuli eta paragrafoz paragrafo edo esaldiz esaldi joanez gero, gaztelaniazkoaren egitura bera emango genuke, baina egitura horrek ez lioke batere mesederik egingo testuaren ulergarritasunari; kontrara, asko ilunduko luke mezua, hainbat arrazoirengatik:

- informazio ugari bildu arren, testuak bi esaldi baino ez ditu: testu luzeegia eta trinkoegia gizakiak erosotasunez prozesatu ahal izateko.

- CERTIFICO aditzaren subjektua (lehen paragrafoan dagoena) luzeegia da, aposizio bi dituelako (eta gainera, komunztadura xelebrea ageri du, subjektua 3. pertsonan eta aditza 1. pertsonan azaltzen baitira).

- bi multzo diferentetako datuak —interesatuarenak eta ikastaroarenak— batera doaz esaldi bakar batean. Kontuan hartu behar da euskaraz aditza amaieran doala, eta, beraz, irakurleari memoria esfortzu handia eskatzen zaiola, informazio asko irakurri behar duelako, eta gogoan gorde, aditzera heldu baino lehen.

Horren ordez, euskaraz honako egitura hau proposa genezake:

ZIURTAGIRIA

Interesatuaren datuak:
Izena:
Jaioterria:
NAN edo pasaporte zk.:
Helbidea: kalea: ................... zk.: ....... herria: ............

Goiko datuak dituen pertsonak Gobernu Batzarrak onartutako honako ikas programa hau egin eta gainditu du, eta titulua eskuratzeko eskubideak ordaindu ditu:
Masterraren izena: .........................
Ikasturtea/biurtekoa/hirurtekoa: ...............
Kreditu kopurua: ..........

Horregatik, eta interesatuak hala eskatuta, ziurtagiri hau egin dut, tituluaren balio berberak izan ditzan, berori prest egon artean.

Leioa, 2001eko martxoaren ...a
Mirentxu Zabalegi Arriortua

TITULUETAKO BULEGOKO BURUA
EUSKAL HERRIKO UNIBERTSITATEA

Ikusten denez, kasu honetan itzultze prozesuak, adierazteko moldeari ez eze, antolaketa erretorikoari ere eragin dio:

- aditza zena izenburu izatera pasatu da;

- bi motatako datuz jositako esaldiak zirenak (interesatuarenak eta ikasketenak) zerrenda sinple bihurtu dira;

- testuak hiru bloke tematiko ditu (interesatua, ikasketak, ziurtapena) eta lehenengo biak baliabide tipografikoez nabarmenduak;

- ziurtagiria egin duen pertsonaren izena sinadura bihurtu da (izan ere, esango genuke garrantzitsuagoa dela lehenengo begiratuan batek izenburuan ikustea zein dokumentu den hori, eta ez nork egin duen).

Berrantolaketa honek guztiak, alde batetik, eskatzen du jatorrizkoa bere osoan ondo aztertu eta haren barruko harremanei antzematea; bestetik, egitura alternatibo eta euskararako arrazionalago bat proposatzea, jatorrizkoarekiko simetriarik zertan eduki behar ez duena.

Segmentatzailearekin lan eginez gero, ezinezkoa litzateke hori egitea, berriz ere orpoz orpo jarraituko geniokeelako jatorrizko ereduari. Edozelan ere, esan beharra dago itzulpena segmentatzailerik gabe egin arren, ziur aski ezinezkoa izango litzaigukeela dokumentu biak gero lerrokatzaileekin parekatzea, programa horiek ez baitute onartzen halako parekatze gurutzaturik (a—b', b—a').

Halako arazoak ikusita, uste dugu segmentuaren definizioa malguagoa izan behako litzatekeela, eta ildo honetatik alternatiba interesgarri bat izan daitekeela Deustuko DELi taldeak erakusten duen bidea, corpusak etiketatzean testuen egitura orokorra eta barruko atalak aintzat hartuz, eta horiek deskribatzen dituzten etiketak jarriz. Bestetik, interesgarria izan liteke segmentuen barruko azpisegmentuak ere definitzea, sistemak jatorrizko segmentuaren ordainik aurkitzen ez duenean memorian gordeta egon daitezkeen azpizatikiak bilatzeko.

Honek beste arazo bat ere jartzen digu begi aurrean, hau da, jatorrizko dokumentuaren kalitatearena. Izan ere, itzulpenaren neurri bateko edo besteko automatizazioa planteatzen denean, horri ahal den onura gehiena aterako bazaio, ezinbestekoa da jatorrizko dokumentuak osatzeko modua ere itzulpen prozesuan integratzea, aurreko etapa gisa. Horrek esan gura du dokumentuak sortzeko modua arautu egin behar dela, testu horiek gero itzuli, gorde eta berrerabili egingo direla gogoan izanik. Beste era batera esanda, eskuliburu batean arau jakin batzuk emango lirateke, testuak sortu behar dituztenek bete beharrekoak. Arnold et al -ek (1995) itzulpen automatikoa erabiliko zuen enpresa hipotetiko baterako deskribatzen duten jokabidetik badago zer ikasirik, itzulpen memoria erabiltzeak agian horrenbesterako zehaztapena eskatzen ez badu ere:

"all the sentences are relatively short and rather plain (...) in accordance with the Language Centre document specification and with MT very much in mind (...) There are no obvious idioms or complicated linguistic constructions. Many or all of the technical terms (...) are in regular use in the company and are stored and defined in paper or electronic dictionaries available to the company's technical authors and translators".

Itzultzaileen prestakuntzan dihardutenak ere ondo ohartuta daude testuak idazteko arau eta argibideak zehaztu beharraz itzulpen proiektuen gestiorako, zenbait unibertsitateko ikas programetan ikusten denez.

Itzulpen memoriekin lan egiteak, oro har, itzulpenaren kalitaterako izan dezakeen beste arrisku bat, orain artekoan aipatu direnei lotua, memoriek unitateka funtzionatzeak dakarrena da. Memorietan unitateak biltzen dira, ez testuak, goian adierazi legez, baina testuak ez dira unitate bildumak, barne koherentzia eta kohesioa duten osotasunak baino. Gerta daiteke jatorrizko hizkuntzan lehendabizikoz gutun batean azaltzen zen paragrafo bat hurrengo batean web orri bateko testuan agertzea, eta jatorrizko bertsioa ondo geratu arren bi dokumentuetan, xede hizkuntzan moldaketaren bat behar izatea, nahiz eta memoriak esan, eta zuzen esan, segmentu bien arteko antzekotasuna %100ekoa dela.

Jo dezagun, esate baterako, gutun batean honako paragrafo hau azaltzen zela gaztelaniaz:

"Los precios de los viajes en autobús, que estarán en vigor durante todo el curso 2000/2001, figuran en el cuadro adjunto".

Jo dezagun itzultzaileak honetara eman zuela:

"Autobuseko bidaien prezioak honekin batera bidaltzen dizudan taulan dauzkazu. Preziook 2000/2001 ikasturte osoan egongo dira indarrean".

Handik denbora batera, itzultzaileak web orri baterako testu bat itzuli behar izan zuen, eta erdarazko paragrafo berbera azaldu zitzaion, inongo aldaketarik gabe. Hala ere, memorian gordetako itzulpenak moldaketaren bat behar zuen, hor "adjunto" hitzak beste esanahi bat zeukalako (ez "honekin bidaltzen dizudan taulan", baizik "alboko taulan" edo antzeko zerbait). Arrisku hau murrizteko, oso gomendagarria da unitateen atributuetan dokumentu mota zehaztea, eta memoriaren konfigurazioan ordain bat baino gehiago onartzea jatorrizko segmentu bakoitzerako.

Azkenik, itzulpen memoriek dakarten beste arrisku bat errebisio faltarena izan daiteke. Izan ere, testuak itzuli ahala unitateak memorian gordetzen direnez, egindako itzulpenak "betiko" onesten dira zelanbait, eta horrek itzultzaileen lanari koherentzia emango badio ere, bestetik oztopoa izan daiteke itzulpen estiloak eguneratzeko eta arazoen konponbideak berraztertzeko. Horrez gain, okerrik eginez gero, akats berberak dokumentuz dokumentu zabaltzea ekar dezake. Horretarako konponbidea gordetako unitateak aldiro eta sistematikoki berraztertzea izan daiteke.

Arazo horiek guztiek ez dute ezelan ere baliogabetzen itzulpen memorien erabilgarritasuna. Ohar hauek caveat bat besterik ez dira, gogoan izan dezagun itzulpenaren kalitateari eusteko itzultzaileak bi aukerotako bat hartu beharko duela:

a) edo itzulpena egin ondoren parekatzea testuak

b) edo testua bezeroari bidali aurretik zuzenketa fase berezia egitea, koherentzia, kohesio eta erretorika testualeko arazo horiek gogoan hartuta.

BIBLIOGRAFIA

Abaitua, J. (1997a). El proyecto LEGEBIDUNA. Eskuratua: 02/08/09.

Abaitua, J. (1997b). Segmentos y unidades de traducción. Eskuratua: 01/10/02.

Abaitua, J. (2000). Tratamiento de corpora bilingües. Eskuratua: 02/08/09.

Abaitua, J. (2001). Memorias de traducción en TMX compartidas por Internet. Tradumàtica, 0. Eskuratua: 02/09/02.

Abaitua, J. (2002). Itzulpengintza automatikoa. Hamar orduko sarrera. Eskuratua: 02/08/02.

Aldezabal, I. eta Arriola, J. M. (2001-2002). Hizkuntzalaritza Konputazionala I. Hizkuntza Teknologiak graduondoko apunte sorta. UEU. Eibar

Arnold, D. et al. (1995). Machine Translation: an Introductory Guide. Eskuratua: 02/05/22.

Blum-Kulka, S. (1986 2000). Shifts of Cohesión and Coherence in Translation. The Translation Studies Reader. London and New York: Routlege.

Cámara, L. (2001). El papel de las herramientas TAO en la documentación técnica multilingüe. Tradumàtica, 0. 02/09/02.

Champollion, Y. (1999 2002). Wordfast. User Manual. Eskuratua: 02/06/27. http://www.champollion.net

Champollion Wordfast Ltd. (2001). + Tools Manual. Eskuratua: 02/06/27. http://www.champollion.net

EAGLES Evaluation Working Group (1995). Evaluation of Natural Lenguage Processing Systems Final Report. Eskuratua: 02/05/31.

Erkoreka, J. eta Lozano, J. (koord.) (1994). Hizkera argiaren bidetik. Vitoria-Gasteiz: IVAP-HAEE.

Freigang, K. H. (2001). Automation of Translation: Past, Presence and Future. Tradumàtica, 0. Eskuratua: 02/09/02.

Fustegueres, S. (2001) Qui té por de les memories de traducció. Tradumàtica, 0. Eskuratua: 02/09/02.

Hutchins, J. (1991, November). Why Computers do not Translate Better. Translating & the Computer, 13. Eskuratua: 02/07/11.

Hutchins, J. (1995). Reflections on the History and Present State of machine Translation. Eskuratua: 02/10/08.

Leon, M. (2002). La traducción automática y memoria de traducción. Eskuratua: 02/08705.

Lozano, J. (koord.) (1997). Argiro idazteko proposamenak eta ariketak. Vitoria-Gasteiz: IVAP-HAEE.

Munk, M. (1999). Shallow statistical parsing for machine translation. (Diploma Thesis, Carnegie Mellon University, 1999). Eskuratua: 2003/07/10. http://www.is.cs.cmu.edu/papers/speech/masters-thesis/MS99.munk.ps.gt

Nogueira, D. (2002). Translation Tools Today. Translation Journal, 6 (1). Eskuratua: 02/08/09.

Newmark, P. (1988). A Textbook of Translation. Hemel Hempstead: Prentice Hall.

Nida, E. (1964). Toward a Science of Translating, with Special Reference to Principles and Procedures Involved in Bible Translating. Leiden: Brill.

Sánchez-Gijón, P. (2001). Catalég de sistemes de memories de traducció. Tradumàtica, 0. Eskuratua: 02/09/02.

Strandvik, I. (2001). Las memorias de traducción en la Comisión Europea. Tradumàtica, 0. Eskuratua: 02/09/02.

Trados GmbH. (1992 2000). Team Edition 3. User Manual CD-ROM.

Oharrak

Artikulu hau Hizkuntza Teknologiak-HIZTEK graduondoan (2001-2002) egindako amaierako proiektutik aterea da. Lanaren zuzendaria EHUko eta UEUko irakasle Kepa Sarasola Gabiola izan zen. Eskerrak ematen dizkiogu bere laguntzagatik.

1. Puntu honetan ikusiko diren pantailak TRADOS aplikaziokoak dira.

2. Erabakia itzultzaile bakoitzaren irizpideen eta testu motaren arabera hartuko da.

3. Nida-k baliokidetza formala (edukiari nahiz formari dagokiena) eta baliokidetza dinamikoa (edukiari eta sortu beharreko eraginari dagokiona, baina ez formari) bereizten ditu. Newmark-ek, berriz, itzulpen semantikoa (non forma eta edukia gorde behar diren) vs itzulpen komunikatiboa (non formari ez zaion fideltasunik zor).

-KO ez da (inolaz ere) -EN

Interpretazioa: alor eta mota berriak Euskal Herrian

Ordenagailuz lagundutako itzulpena eta itzulpenaren kalitatea Itziar Bernaola, Ana I. Morales, Irune Payros