Definizioz, hizkuntza batetik bestera itzultzen duen sistema informatikoa da itzulpen automatikoa; itzulpen prozesuan zehar gizakiak parte hartu behar izanik gabe ematen du itzulpena.

komunikazioa

Askotan, itzulpen automatikoko sistemak eta hiztegiak nahasten ditugu. Bi baliabide hauen ezberdintasun nagusia honakoa da: hiztegietan bilaketak egiten ditugunean, bertako emaitzak profesionalek eskuz landuak dira. Itzulpen automatikoan aldiz, nahiz eta oinarri bezala erabiltzen diren datuak profesionalek landutakoak izan, erantzuna beti makinak berak sortzen du; automatikoki sortzen da. Hala ere, erabiltzaile arrunten ikuspuntutik desberdintasun nagusiena hauxe da: itzulpen automatikoko sistemek esaldi osoak nahiz hitzak itzul ditzakete.

Itzulpen automatikoko sistema ezagunenen artean dago Google Translator. Sistema honen bidez, 70 hizkuntzen arteko itzulpenak egin daitezke automatikoki, eta 2010a geroztik Euskara ere hizkuntza hauen artean aurki dezakegu.

Itzulpen xelebreak, zergatik gertatzen dira?

Interneten nabigatzen dugun bitartean, nahiko arrunta da bilatzen ari garen informazioa beste hizkuntza batean topatzea, eta bertan jartzen duena ulertzeko itzulpen automatikoko sistema bat erabiltzea. Horregatik, itzulpen automatikoa erabiltzearen arriskuak zein diren jakitea komeni da. Horrelako sistema batek ez du beti itzulpen zehatza emango, eta erabiltzailearen esku dago automatikoki lortutako itzulpen horrekin zer egin erabakitzea. Sarri gertatu izan da, automatikoki lortutako emaitza horiek publizitate nahiz bestelako karteletan ikustea.

Ondoko adibide hauek ezagun izango ditugu gehienok:

Autobuses, mañana y tarde -> Autobusak bihar eta berandu.
Combinación de trenes -> Trenen azpikogona.
Primera planta -> Lehenengo landarea.
Últimas novedades -> Azken batekoak.

Urtarrilean bertan, berri honetan esaten duten moduan, Googleen itzulpen automatikoko sistemak futbolaren munduan aski ezagunak diren Guardiola eta Iniesta, beraien jaioterriekin nahasten zituen katalanetik ingelesera itzulpena egiteko orduan.

Baina, zergatik gertatzen dira horrelako xelebrekeriak?
Itzulpen automatiko sistemak, bi multzotan sailkatu ditzakegu: estatistikan oinarritutako sistemak eta erregeletan oinarritutako sistemak.

Estatistikan oinarritutako itzulpen automatikoko sistemak
Google Translate da sistema hauen artean ezagunenetarikoa. Sistema hauetan, estatistika da oinarria eta testu-bildumak erabilita sortzen da. Adibidez, euskara eta gaztelania arteko sistema bat sortu nahi bada, modu honetako testu-bilduma bat hartu beharko dugu oinarri: euskarazko esaldi bakoitzeko gaztelaniazko itzulpena beharko dugu.
Testu-bilduma horietatik abiatuz, modelo estatistiko batzuk sortzen dira eta modelo hauek izango dira itzulpen automatikoko sistema.

Elhuyar Hizkuntza eta Teknologia unitatean ere, baditugu mota honetako sistemak, eta urte honetan zehar horrelako sistema bat ezarriko dugu MINHAPen(Espainiako Ogasun eta Administrazio Publikoetako Ministerioan).

Erregeletan oinarritutako sistemak
Sistema hauek oinarri linguistikoa dute, hau da, hiztegiak eta hizkuntzari lotutako erregelak dituzte. Normalean, estatistikoek baino emaitza zentzudunagoak ematen dituzten arren, sistema mota honek ere baditu zailtasunak eta xelebrekeriak. Hitz polisemikoek adibidez, nahiko lan ematen dute itzultzeko garaian. Demagun gaztelaniazko ‘tiempo’ hitza. Euskaraz, hamabi adiera ditu euskaraz: denbora, eguraldi, … itzulpen automatikoko sistemari adiera guztien artean egokiena zein den aukeratzen erakutsi behar zaio.

matxinMatxin da EHUko IXA taldearekin batera garatutako, erregeletan oinarritutako gaztelaniatik euskararako itzulpen-automatikoko sistema baten adibidea. Matxin sistemak, testu-hutsa itzultzeaz gain, hainbat dokumentu formatu ezberdin eta webguneak itzultzeko ere balio du. Hala ere, esan moduan, itzulpen automatikoa erabiltzen dugunean, ez dugu ahaztu behar automatikoki sortutako emaitza horiek errepasatzeaz.

Oinarri estatistikoa eta linguistikoa duten sistemen arteko aldea ikusteko, hona hemen pare bat adibide.

Adibideak:

El hombre que vino era mi tío.
Google Translate: Gizona etorri zen nire osaba izan zen.
Matxin 2.0: Etorri zen gizona nire osaba zen.

Han dicho que mañana va a hacer buen tiempo
Google Translate: Bihar eguraldi azoka izango esan dute
Matxin 2.0: Esan dute bihar denbora ona egitera doala

Itzulpen automatikoko sistemak erabiltzearen alde positiboak zein negatiboak, hau erabiltzeko moduarekin lotuta dago zuzenean. Erabiltzaileak, momentu oro izan behar du argi, erabiltzen ari dena sistema automatiko bat dela…. artikulu honetan esaten den moduan “itzulpen automatikoaren erabilgarritasuna lortu nahi den helburuaren araberakoa dela”.

 

Esteka interesgarriak: Opentrad, itzulpen automatikoari buruzko erreportajea, Zazpika aldizkaria (2012ko martxoan)

Euskadi irratia. A Bildua saioa 2013.10.13