Euskarazko software librearen lokalizazioan murgiltzen
Euskarak teknologia berrietan duen presentziak nabarmen gora egin du mende berri honetan. Librezalek eta halako ekimenek software librearen alde egindako apustua erabakigarria izan da garapen hori lortzeko. Artikulu honen xedea euskarazko software librearen lokalizazioan murgiltzea da. Lehenik, software librearekin loturiko kategoriak zein diren zehaztuko dugu. Segidan, software mota hori erabiltzea bultzatzen duten taldeak bildu ditugu, baita euskaraturiko aplikazioak eskuragarri dituzten gordailuak ere. Azkenekoz, lokalizazioan maiz agertzen diren fitxategiak izango ditugu ikergai, batetik, eta haiek itzultzeko erabil ditzakegun OLI tresna libreak, bestetik.
Honi buruz
IKTen garapen azkarrak eragin handia izan du informazioaren gizartea deiturikoan. Hizkuntzekin lan egiten dugunok teknologia berrietara moldatzeko beharra sentitu izan dugu etengabe, ordenagailua ezinbesteko bihurtu baita gure egunerokotasunean. Memento honetan, esan liteke itzulpen‑tresnetan adituak garela, eta, gehienetan, bezeroak erabakitzen du zer programa erabili behar dugun –software pribatiboa edo ez-askea izan ohi da haren aukera–. Esan dezakegu euskarazko lokalizazioak nabarmen gora egin duela xxi. mendearen lehenengo hamarkadan, Euskadiko hizkuntza-politikari eta, batik bat, software libreak euskaratzea sustatzen duten ekimenei esker.
2015eko uztailean, Introducción a la localización de software libre en euskera1 izeneko gradu amaierako lana aurkeztu nuen, EHUn. Lan praktikoa izan zen batez ere, bi aplikazioren euskarazko lokalizazioan jarri genuenez gero arreta, eta, horregatik, alderdi batzuk aztertu gabe geratu ziren. Alderdi horiei erreparatzeko aukera izango dugu hemen, neurri batean behintzat.
Hasi
Hitzetik hortzera entzun ohi dira software librea kontzeptua eta software librea erabiltzearen onurak. Baina, egia esanda, gehienek ez dakite zer den, eta askoz ere gutxiagok zehazki zer esan nahi duen. Ingelesezko free software hitz elkartuko izenondoak "libre" zein "doan" esan nahi izateak nahasmena sortzen du, baina software libreak ez du zertan doakoa izan. Kode irekiko softwarea nahiz jabari publikoko softwarea gauza bera direla sinesten dute beste askok. Horregatik, komeni da software librearekin zerikusia duten zenbait unitate terminologiko labur‑ labur argitzea, aurrerantzean nahasmenak edo gaizki-ulertuak saihestearren.
a) Software librea
b) Jabari publikoko softwarea
Domeinu publikoko software modura ere ezagutzen da, eta jaberik ez duena da. Hau da, ez du ez copyrightik, ez lizentziarik argi eta garbi utzi behar da lizentzia duen softwarea ezin dela izan jabari publikoko software. Bestalde, iturburu-kodea publikoa izanez gero, esan daiteke berezia dela copyleftik gabeko software librearen kasua, baina halako softwarearen kopiak eta aldaturiko bertsioak ez-libreak izan daitezke. Beste kasu batzuetan, izan daiteke aplikazio bat domeinu publikoko software izatea baina iturburu-kodea ez egotea eskuragarri, eta, beraz, hori ez da software librea, arestian ikusi dugun moduan.
c) Kode irekiko softwarea
Hamahiru urteren ondoren, Open Source Initiative iritsi zen, eta, horrekin batera, open source software edo kode irekiko softwarea. Marketin-arrazoiak direla medio eratu zen ekimen hori, free hitza bitarikoa zelako, eta, ondoren, ez zirudien oso erakargarria enpresentzat. Bien arteko ezberdintasun nagusia, berez, izaera filosofikoan oinarritzen da: kode irekiko softwarea garapen-metodologian datza, eta software librea, aldiz, gizarte-mugimendutzat hartzen da; beste modu batez esanda: lehenengoa bikaintasun teknikoan zentratzen da, eta bigarrena, berriz, askatasunaren alderdi etikoan.
Halaber, komenigarria da azpimarratzea erabiltzailea programaren iturburu-kodera sar daitekeela baina garatzaileak sarbide hori mugatu dezakeela lizentzia jakin batzuen bidez.
d) Kode irekiko software librea
Kode irekiko softwarea eta software librea kontzeptuak biltzen ditu. Normalean, foss/floss ingelesezko siglen bidez ezagutzen da, eta haren xedea alderdikeriarik gabeko unitate-terminologia bat izatea da; hain zuzen ere, izendapen bata edo bestea erabiltzeak sortzen duen eztabaida baztertzeko.
e) Freewarea edo doako softwarea
Kosturik gabe banatzen den programa da, hemen free hitzak "dohainik" esan nahi baitu. Halako aplikazioak erabiltzeko epea mugagabea da -sharewarea edo partekatzeko softwarea ez bezala, denbora mugatu batean eta murrizketekin erabil daiteke bakarrik-. Normalki, erabiltzaileak ez du inolako eskubiderik, baina horri buruz ikertu beharko genuke.
Software mota edozein dela ere, zer lizentziapean dagoen jakitea gomendatzen dugu beti, etorkizunean arazorik ez izateko. Hori irakurri ondoren oraino zalantzarik baldin badago, irtenbide onena garatzailearekin edo garatzaileekin harremanetan jartzea da.
Laguntza
Azken urteetan, begi-bistakoa da euskara IKTen munduan sartu dela, gero eta zabalduago baitago, hein batean, Euskal Herriko zenbait erakundek IKTetan euskara sustatzeko eman dituzten eta gaur egun ere ematen dituzten diru‑laguntzei esker. Esaterako, Bizkaiko Foru Aldundiak 157.200 euroko aurrekontu-esleipena izan zuen iaz kontzeptu horretarako; Eusko Jaurlaritza, berriz, Microsoftekin aritu zen elkarlanean, bai Windows 8 sistema eragilea bai Office bulegotika-suitea euskaratzen.
Bestalde, benetan azpimarratzekoa da ekimen batzuek egindako lan desinteresatua; batez ere, EuskalGNU Elkarteak (gaur egun desagertua) eta Librezale lantaldeak eginikoa. Haiei zor diegu gaur egun software libre asko euskaraz erabili ahal izatea. Hona hemen informatika arloan euskararen erabilera bultzatu eta sustatzen duten zenbait erakunde:
a) EuskalGNU Elkartea
b) Librezale
Bi urte geroago sortu zen ekimen hau gaur egungo lantalderik aktiboena da. Informatika-munduan euskal hizkuntzak orain duen garrantzia Librezalek egindako lanaren ondorioa dela esan daiteke. Zenbait proiektu kudeatzen dituzte, aurrerago ikusiko dugun moduan. Lan‑zama hain handia denez eta aplikazioak etengabe gaurkotzen direnez, kolaboratzaile berrien bila dabiltza beti. Laguntza eskaintzen diete parte‑hartzaile guztiei. Izan ere, mundu librearen inguruko informazio ugari euskaratu dute. Dokumentazio hori euren wikian dago eskuragarri, eta benetan baliagarria izango zaigu software‑lokalizazioan murgiltzeko.
c) SALE «Software Askea/Librea Euskadin»
Eusko Jaurlaritzak 2010eko maiatzean abian jarritako bulego tekniko honen xede nagusia administrazioan software librearen erabilera handiagotzea da. Aplikazio askeek ekar ditzaketen abantailak azpimarratzen dituzte, eta, horregatik, haien euskarazko lokalizazioak egitea bultzatzen du, diru-laguntzen bitartez batik bat. Iaz, 810.000 euro eskaini zizkien Lakuako Gobernuak eginkizun hauei: software libreak euskaratzea, programa libreak garatzea eta eduki libreak dituzten proiektuei laguntzea.
d) Itsas Software Libre Taldea
EHUko talde hau 2007ko martxoan agertu zen aurreneko aldiz, unibertsitatean software librearen erabilera sustatzeko xedearekin. Berdin da ikasleak, irakasleak, ikertzaileak edo kanpoko pertsonak garen; edonor izan daiteke kide, laguntzeko prest badago. «Software libreak eta jakintzaren hedapenak lotura estua» dutela adierazten dute; berez, ezagutza zabaldu ahal izateko, guztion eskura egon behar du software libreak. Taldeak zenbait jarduera mota antolatzen ditu urtero, baina, zoritxarrez, badirudi azken bi urteetan geldirik egon direla.
Bilatu
Euskaratutako softwarea non aurkitu dezakegun azaltzen eta zehazten saiatuko gara segidan. Egia da askotan izugarri zaila egiten zaigula igartzea programa bat dagoeneko euskaraturik dagoen ala ez. SourceForge izeneko software‑gordailuan, esaterako, aplikazio ororen xehetasun gehigarrietan adierazten da zer hizkuntzatan dagoen eskuragarri, baina informazio hori osatugabea izan ohi da sarritan, zoritxarrez. Nabarmentzekoak dira, alabaina, euskarazko aplikazioak biltzen dituzten hiru katalogo:
a) Euskarazko IKTen inbentarioa
Librezale zenbait proiektuz arduratzen da, gorago aipatu dugun bezala, eta lantaldearen wikian bilduta daude horiek guztiak. Android, Firefox, LibreOffice eta VLC adibide batzuk baino ez dira, esparru ia guztietan gutxienez programa bat euskaraz izateko asmoa du-eta. Aplikazio bakoitzaren orriak honako informazio hau ematen du: softwarearen bertsioa, webgunea, lokalizazioaren arduraduna, azalpena, eta abar. OmegaT-ren kasuan, proiektuak arduraduna behar duela adierazten da, eta interfazea 3.1.9 bertsioraino itzuli da, azken bertsioa 3.5.4 izanik.
c) Softkat Euskarazko Software Katalogoa
Formatuak estandarizatzea izan da software libreen garatzaileen kezkarik handiena hasiera-hasieratik, elkarreragingarritasuna bermatzearren. Hots, lokalizazio‑lanetarako itzulpen-tresnak erabiltzeko mentura izatea da estandarizazioaren xedea. Erabiltzaile‑interfazeari dagokion informazioa dakarten fitxategi‑formatu libre ohikoenei baino ez diegu erreparatuko jarraian, hau da, erabiltzaileentzako laguntza, eskuliburuak, lizentzia-hitzarmenak eta abar ez dira ikergai izango kasu honetan.
a) .po, .pot, .mo
.po formatua de facto bihurtu da software librearen internazionalizazioan. Fitxategi editagarriak dira, eta gettext izeneko tresna‑multzoak sortzen dituzte, softwarearen testu itzulgarria ateraz.
.pot (Portable Object Template) eratzen den lehenengo artxiboa da, iturburu-kodetik ateratako kate guztiak dituena. Txantiloi hori itzultzean, .po (Portable Object) dokumentu elebiduna sortuko da, automatikoki, sorburu‑ eta xede‑hizkuntzen kateekin. Horregatik, lokal bakoitzak bere fitxategia du: euskarara lokalizaturikoak eu.po edo eu_es.po dira. Azpimarratzekoa da eskualdea ez dela beti adierazten, batez ere euskararen kasuan; baina, batzuetan, behar‑ beharrezkoa da bi egokitzapen egitea: esaterako, Iparraldeko eta Hegoaldeko zerga-sistemen artean, zenbait ezberdintasun aurkitu daitezke, eta hori kontuan hartzekoa da.
Testu arrunteko fitxategia da .po. Horri esker, haren sintaxia edo egitura analizatzea lan erraza izango da. Segidan, OmegaT itzulpen-aplikazioaren itzulpenaren lagin bat izango dugu ikergai. Inportantea da, betiere, lerroaren hasierari erreparatzea nagusiki, puntuazio‑ markei, horrek zer nolako argibideak dakartzan esango digunez gero.
Lehen lerroan, garatzaileak iturburu‑kodean egin dituen oharrak datoz, traolaren eta puntuaren ondoren, eta, sarritan, itzultzaileoi zuzenduak egoten dira. Testuingurutik kanpo egoteak sor ditzakeen zalantzak argitzeko goiburuarekin gehitu ohi dira. Laukitxoak eta bi puntuek programaren iturburu-kodeari egiten diote erreferentzia. Traolak eta komak, berriz, banderak adierazten dituzte: gako‑hitz batzuk, laguntza-mezuaren egoera edo mota esplikatzeko. Gure laginean, adibidez, mezua Phyton programazio-hizkuntzan idatzirik dagoela ohartarazten da. Lerro horretan ageri den %s aldagaia, hain zuzen, ezin dugu inola ere kanporatu. Azken bi lerroek itzuli gabeko eta itzuliriko kateak adierazten dituzte, hurrenez hurren. Itzulpen-tresnek prozesu hori arintzen lagunduko dute.
Itzuli eta gero, .po artxiboa konpilatuko dugu, eta .mo (Machine Object) luzapena duen bertsio bitarra lortuko. Kasu horretan, OmegaT programak erabiliko duen fitxategia da.
b) XLIFF
XML Localization Interchange File Format esan nahi du. Alegia, XMLan oinarrituriko formatu hori lokalizazioa estandarizatzeko sortu da industriari eta irakaskuntzari loturiko arloetan, eta itzulpen-proiektu baten parte‑hartzaile guztien artean datuak trukatzeko aukera ematen du. Hau da, eduki itzulgarria gordetzen du, diseinua alde batera utzita. Formatu hori eta .po erabat bateragarriak dira, eta, maiz, itzulpen‑memoria gisa erabiltzen dira.
Fitxategi‑luzapenaren izena .xlf da, eta estandarizaturiko azken bertsioa (2.0. XLIFF 1.1) nolakoa den erakusten du hurrengo adibideak, Virtaal‑en eu.xlf fitxategiak.
Hiru etiketa ditugu aurreko adibidean. Lehen etiketak itzulpen-unitatea esan nahi du, eta lokalizatzeke dauden datuak gordetzen ditu: eta horren barruan daude eta. id atributuak itzulpen-unitatea identifikatzen du, eta ez du zertan sorburu‑ hizkuntzaren katearekin etorri, nahiz eta gure etsenpluan hala dagoen. -ren barruan, jatorrizko testua dago: ia beti, ingelesetik itzultzen dira programak, informatika-arloan lingua franca baita, maizenik programatzailearen ama-hizkuntza ez bada ere. Bestalde, etiketak itzuliriko katea gordetzen du, eta, kasu horretan, jadanik euskaratua dela adierazten du. Softwareetan gaurkotzeak egiten direnean, beraz, errazago izango da itzuli gabeko kateak detektatzea, egoera edo state horri esker.
c) .lang
Testu arrunteko fitxategi honi buruz ez dago oraindik balio handiko informaziorik, baina, gradu amaierako lanean,harekin borrokatu behar izan ginen, zenbait itzulpen‑tresnak ez baitzuten artxiboa hautematen. Horregatik, komenigarria da .lang Notepad++ aplikazioaren laguntzarekin itzultzea.
Lerro bakoitza berdin ikurrak zatitzen du: ezkerrean, katea ageri da, komandoaren izenarekin, ingelesez; eskuinean, komandoaren euskal itzulpena, erabiltzaile‑interfazean azalduko den moduan. Adi egon behar dugu, Todomoo softwarea erabiltzean aurkeztuko den testu guztia biltzen duelako artxibo horrek: menuak, elkarrizketa‑koadroak eta mezuak.
d) .properties
Oro har, Java-n idatzitako programei loturiko parametro konfiguragarriak biltegiratzen dituzte .properties dokumentuek, hala nola itzulpenak, balioak eta web‑helbideak. Hori dela eta, aplikazioaren egituraren informazio zehatza dakar berekin. Fitxategi honen sintaxia korapilatsuagoa izan daiteke lehendabizi aipaturikoen egiturarekin alderatuta.
Tomodo-ren "eu.lang" artxiboan adierazten den konbinazio bera daukagu kasu honetan. Egitura bihurriagoa izan daitekeen arren, itzulpen‑tresnek bidea samurragoa egingo dute, programazio-hizkuntza ezkutatuz. Adibidean, & ikurra ikusten dugu bost komandoetan. Itxi-ren laster‑tekla alt+x da, et ikurra x hizkiaren aurrean kokatu delako; Iragazkia-ren kasuan, berriz, alt+r sakatu behar dugu hura aukeratzearren.
Hautatu
Egun, itzulpen- edo lokalizazio-lanetan lagungarri diren software libre ugari ditugu eskura, eta, hortaz, programa komertzial gehienak alde batera utz ditzakegu. Datozen lerroetan, ordenagailuz lagunduriko zenbait itzulpen-tresna bildu ditugu, gutxienez Microsoft Windowsen erabilgarri direnak, sistema eragilerik erabiliena baita. Funtsezkoa da ikastea zer dokumentu onartzen dituen programa bakoitzak, bata edo bestea erabiltzeko; baina artxibo bat formatu batetik beste batera aldatzen duten aplikazioak ere badaude.
a) OmegaT
Hasiera batean, itzultzaile profesionalentzako sorturiko softwarea zen, haren ezaugarriak nahiz abantailak aintzakotzat hartzen baditugu. Aplikazio hau Java programazio-hizkuntzan garatuta dago, interfaze propioa du, eta azken bertsioa 3.5.4 da. Abantaila handiena da proiektuekin lan egiteko aukera ematen duela, hau da, dokumentu asko itzul ditzakegu aldi berean. Azpimarratzekoa da ezaugarri hori, programa batzuek .po zein .properties artxiboak izan ditzakete eta. Horrez landa, itzulpen‑memoriak eta glosarioak gehitzen ahal dira: oso onuragarria litzateke, adibidez, softwarearen bertsio berria lokalizatzeko orduan.
Fitxategi kopuru eskerga itzul daiteke OmegaT‑rekin:
–– bulegotika-suiteetan erabiltzen direnak: .doc, .docx, .odt, .pptx, .rtf, .txt, .xlsx…
–– softwarearen lokalizaziorekin loturikoak: .po, .properties, .xlf…
–– web-orrien informazioa gordetzen duten artxiboak: .html, .xhtml.
Itzulpen‑memoriak .tmx estandarrean eratzen dira; glosarioen kasuan, berriz, .tab da lehenetsia, baina .utf8 formatuan kodetzea gomendatzen da. OmegaT‑ri buruzko informazio gehiago nahi izanez gero, ikusi Asier Sarasua2 librezalekideak idatziriko artikulua.
b) Virtaal
Translate.org.za‑k garatutako oli tresna libre honek erabiltzaile-interfaze erabilerraza eta intuitiboa du. Software-lokalizaziorako diseinatu da bereziki, eta, horregatik, .mo, .po, .tbx, .txm edo .xliff motako fitxategiak onartzen ditu. Python hizkuntzan idatzita dago. Artxibo bat irekitzen badugu, kateak taula elebidun batean aurkezten ditu, eta hori oso lagungarria izango zaigu edukia itzultzeko, askoz erosoagoa da eta.
Horrez gain, kalitate‑kontrola egiteko hautua du, hau da, sorburu‑ eta xede‑kateak elkarrekin alderatu daitezke, akatsak ekiditearren: letra xeheren bat letra larri bihurtu dugun edo puntuazioa aldatu dugun abisatzen digu. Erne egon behar dugu, jatorrizkoan akatsak egon baitaitezke –litekeena da informatikariak jatorrizko hiztunak ez izatea–, eta halakoak ezin ditugu kopiatu. Berrikuspena egoki egiteko, bilatu eta ordeztu tresna dakar Virtaal‑ek. Katearen egoera ere adieraz dezake; guztiz erabilgarria, lokalizazioa talde-lana bada.
c) Poedit
Esklusiboki .po dokumentuak itzultzeko garaturiko oli tresna da, izenak berak dioenez. Berez, Virtaal aplikazioaren antzekoa da, eta ez du ezaugarri berezirik eskaintzen. Itzuli gabeko kateak aurkezten ditu lehenengo, eta itzulitakoak, ondoren. Fitxategian mezuak errepikatuz gero, berriz erabiltzen ditu mezu horiek –itzulpen‑memoria bat izango balitz bezala–.
d) Okapi Framework
Marko honen xedea lokalizazio-prozesuan parte hartzen duten osagaien bateragarritasuna eta elkarreragingarritasuna erraztea da. Horregatik, estandar irekiak edo libreak sustatzen ditu, eta, horri esker, dokumentuen bihurketa eta egokitzapena egin daiteke. Are gehiago, Trados eta beste software pribatibo batzuen formatuak onartzen ditu; kontuan hartzeko ezaugarria. Ez da itzulpen‑tresna ohikoa, beraz, lokalizazio-prozesuan lagungarria den osagarri bat baizik.
Tresna bat baino gehiago du, baina Rainbow da, segurki, nabarmentzekoa. Esaterako, euskarazko bertsioa duen .po artxibo bati onura atera nahi badiogu, hurrengo itzulpenetan denbora eta lana aurrezteko, artxibo hori .tmx luzapena duen itzulpen‑memorian bihurtzeko aukera dugu. Itzulpen-konparazioak ere egin ditzakegu, bi edota hiru artxiborekin; hori bereziki baliagarria da zuzentzaileak gure lokalizazioan egin dituen aldaketak ikusi eta ontzat hartu ahal izateko. Terminologiaren homogeneotasuna eta trinkotasuna ziurtatzeko, bilatu eta ordeztu aukera ematen du, baita kalitate‑kontrol sakona egiteko funtzioa ere.
Amaitu
Komeni da gogoan izatea beste tresna batzuk erabili behar ditugula, nahitaez, merkaturako itzuli ohi diren softwareak lokalizatzeko; sdl Passolo edo Alchemy catalyst, adibidez. Alde batetik, lokalizazio-lan baten atzean pertsona asko daudelako: itzultzaileak, orraztaileak, ingeniariak, terminologoak, probagileak eta abarren abarra; bestetik, lehen aztertu ez ditugun formatuekin borrokatu beharko garelako. Hala ere, espezialitate honetan hasteko aukera paregabea eskaintzen digu software librearen lokalizazioak. Eta, horrez gain, euskara teknologia berrietan zabaltzen nahiz hedatzen lagunduko dugu.
Programak euskaratzen hasi baino lehen, erabat komenigarria eta ia nahitaezkoa da lokalizazioarekin zerikusia duten ikastaro edo irakasgaietan parte hartzea. Formazio eza agerian geratu ohi da, eta lokalizazioko hasi‑masiak izatea ez dator inoiz gaizki. Horregatik, graduko azken mailako itzulpen-praktiketan lokalizazio‑proiektu bat egitea aholkatzen dugu: gorantz doan espezialitate horretan murgiltzeaz gain, ikasleen artean lantalde bat sustatuko litzateke, zenbait eginkizun betetzeko eta gaitasun berriak garatzeko.
Azkenekoz, euskarazko lokalizazio‑gida bat argitaratzearen beharra nabarmendu nahi dugu; itzulpen mota horren alderdi adierazgarrienak biltzen dituen gida bat, zehazki. Era berean, tralima/itzulik taldeak ikerketa‑ildo berri bat abia lezake lokalizazioaren inguruan, teknologia berrietan euskararen erabilera analizatzeko corpus digital baten bidez, eta, oro har, prozesuan ohikoak diren arazoak aztertzeko. Ez dugu ahaztu behar iktek gure gizartean duten eginkizun garrantzitsua, euskarak duen papera bistan baitago.
1. Baraja Nuñez, Ander (2015). Introducción a la localización de software libre en euskera. http://hdl.handle.net/10810/15860
2. Sarasua Garmendia, Asier (2008). OmegaT, itzulpenak egiteko CAT aplikazio librea. http://www.eizie.eus/Argitalpenak/Senez/20080201/sarasua