Elhuyar I+G

Hizkuntza-teknologietan ikertuz

Browsing Posts published by admin

Aste honetan Portorožen (Slovenian) ospatuko den LREC 2016 Biltzarrean (http://lrec2016.lrec-conf.org/en/) lau lan aurkeztu behar ditu Elhuyar I+G taldeak. Honakoak dira aurkeztuko ditugun lanak:

[1] I. San Vicente, X. Saralegi. Polarity lexicon building: to what extent is the manual effort worth?. In Proceedings of the 10th Language Resources and Evaluation Conference (LREC’16). 2016.

Testuetan adierazten diren sentimendu eta iritziak automatikoki aztertzeko oinarrizko baliabideak dira polaritate-lexikoak. Artikulu honetan lexiko horiek modu automatikoan sortzeko hiru bide aztertu dira, lexiko eraginkorrak hutsetik modu azkar batean eta adituen ahalegin handirik gabe sor daitezkeela erakutsiz.

[2] Iñaki San Vicente, Iñaki Alegria, Nora Aranberri, Cristina España-Bonet, Pablo Gamallo, Hugo Gonçalo Oliveira, Eva Martínez Garcia, Antonio Toral, Arkaitz Zubiaga. TweetMT: A parallel microblog corpus. In Proceedings of the 10th Language Resources and Evaluation Conference (LREC’16). 2016.

TweetMT hainbat erakundek elkarlanean sortutako baliabidea da, iberiar penintsulako hizkuntzak barne hartzen dituen txioen corpusa, euskara, galiziera, katalana, eta portuguesa espainierarekin lotzen dituzten datu multzoak eskaintzen ditu, (eu-es,ga-es,ca-es,pt-es). Corpusa publikoki eskuragarri dago.

[3] X. Saralegi, E. Agirre, I. Alegria. Evaluating translation quality and CLIR performance of Query Sessions. In Proceedings of the 10th Language Resources and Evaluation Conference (LREC’16). 2016.

Bilaketa eleaniztuna hobetzeko teknika berri bat aztertu da artikulu honetan. Bilaketaren itzulpena urrats kritikoa da bilaketa eleaniztunaren prozesuan. Urrats horretan ebatzi beharreko problema nagusia itzulpen anbiguotasuna da. Itzulpen anbiguoa tratatzeko teknika estatistiko berri bat proposatzen da artikuluan, saio bereko kontsulta guztiak testuinguru bezala erabiltzen dituena.

[4] López de Lacalle M., Laparra E., Aldabe I., Rigau G. 2016 A Multilingual Predicate Matrix. In Proceedings of the Proceedings of the 10th Language Resources and Evaluation Conference (LREC’16). 2016.

VerbNet, FramenNet, PropBank eta WordNet bezalako baliabideek predikatu mailako informazio interesgarria eskaintzen dituzte bakoitzak bere aldetik. Lan honetan baliabide hauek guztiak ingurune berdinean bateratu ditugu eta gainera, ingelesezko predikatu nominalak jasotzeko NomBank baliabidearekin elkartu dugu. Honez gain, Gaztelania, Katalana eta Euskerara ere hedatu dugu. Predicate Matrix 1.3 da lan honen emaitza, analisi semantiko interoperablea hizkuntza desberdinetan egiteko aukera ematen duen lexikoi eleaniztuna.

(Artikulu hau “Eraldaketa Elhuyar da” blogean argitaratu da aurretik)

Krisi-garaian, zerbitzuak merkatzeko ahalegina egin beharrean aurkitzen gara. Gainera, globalizazioaren eraginez munduko beste puntan dauden enpresak ere gure zerbitzuak eskaintzen hasi badira, are gehiago.

Egoera hau oso nabarmena da itzulpengintzaren alorrean. Azken urteetan, itzulpenen prezioak nabarmen jaitsi dira, eta direnak eta ez direnak egiten ari dira itzulpen-enpresak gastuak murrizteko. Kudeaketan pasatzen den denbora murriztea da hori lortzeko modu bat. Efizienteagoak bagara kudeaketan, denbora gehiago izango dugu produkziorako; alegia, itzulpenak egiteko.

Orain arte, itzulpen-enpresa askok antolatu du bere kudeaketa-lana kalkulu-orri batekin eta posta elektronikoarekin. Horrek, ordea, baditu desabantailak. Batetik, posta-helbide bat sortu ohi da mezuak pertsona batek baino gehiagok jaso ahal izateko. Baina konplikatua izaten da mezu bakoitza zeinek ikusi edota erantzun duen jakitea, lana egiten norbait hasi den jakitea, eta abar.

Bestetik, kalkulu-orri batean idazten dira egiten ari garen lanen xehetasunak. Datuak eskuz kalkulatzen dira, eta norbaitek apuntatu behar ditu kalkulu-orrian. Baina non gordetzen da kalkulu-orria? Norbaiten ordenagailuan? Pertsona bakar baten esku? Gaur egun, sarean ere gorde liteke, baina horrek ez liguke aurreztuko datuak eskuz sartzeko behar dugun denbora.

Bada irtenbiderik, ordea; ItzulpenFlow aplikazioak horrelako arazoak ekidin eta askoz laguntza gehiago ematen du: https://demo.itzulpenflow.com/

ItzulpenFlow_logoa

continue reading…

Koperniko zientzialariari buruzko infotaula

Irudia: Koperniko zientzialariari buruzko infotaula

Elhuyar Fundazioko Hizkuntza eta Teknologiako I+G sailean Galdetu Wikipedia izeneko webgunea kaleratu dugu (http://galdetuwikipedia.elhuyar.org/galdetu_wikipedia). Bertan euskarazko informazio egituratua kontsultatzeko galdera-erantzun sistema bat aurkezten da.

Galdera-erantzun sistema honek eskuragarri duen informazio egituratua RDF ezagutza-base bat da. Erabiltzaileek aukera dute hizkuntza naturalean idatzitako galderak burutzeko eta sistema erantzun zehatza ematen saiatzen da. Adibidez, “Non jaio zen Ruper Ordorika?” galdera egin eta sistemak “Oñati” erantzungo du.

Zehazki Wikipediako artikuluen infotauletako informaziotik erauzitako RDF sarea kontsultatzen du galdera-erantzun sistema honek. Honetarako, lehendabizi erabiltzaileek hizkuntza naturalean idatzi dituzten galderak SPARQL lengoaiara itzultzen ditu sistemak, ondoren, aipatutako RDF sarearen gainean erantzuna bilatu ahal izateko.

continue reading…

ItzulTerm web-zerbitzua sareratu berri dugu, itzulpen-memoria batetik euskarazko eta gaztelerazko termino baliokideen bikoteak automatikoki erauzten dituen doako zerbitzua. Itzulpen-memoriekin lan egiten duten erabiltzaileengan dago, batik bat, pentsatua: itzultzaileak, itzulpen-zerbitzuak, terminologoak, hizkuntzalariak, euskara-teknikariak…

765_medium_itzulterm-pantaila

continue reading…

Urriaren 17tik 18ra bitartean, itzulpen automatikoari buruzko jardunaldiak egin ziren Bartzelonan, Traducción automática: pasado, presente y futuro izenburupean. Jardunaldiak Proz.com itzulpen-webguneak antolatu zituen itzultzaileei begira —itzultzaile autonomoei begira, batik bat—, eta hizlari batzuek informazio teknikoa ere eman zuten arren, jardunaldiak ez zeuden teknikarientzat eta informatikarientzat pentsatuta.

continue reading…

Powered by WordPress Web Design by SRS Solutions © 2018 Elhuyar I+G Design by SRS Solutions