Elhuyar Fundazioko I+G+Bko lantaldea hizkuntza-teknologien LREC 2008 biltzarrean izan da, Marrakechen. Hizkuntza-teknologietako azken joerak ezagutu, eta Elhuyarren I+G+Bren azken ikerketa-proiektuak nazioartean ezagutarazi ditugu.
LREC biltzarra (Language Resources and Evaluation Congress) hizkuntza-teknologien ikerketa- eta ebaluazio-mailako biltzarrik nagusietakoa da. Aurtengo edizioa Marrakech-en izan da, maiatzaren 26tik ekainaren 1era. LREC biltzarra foro ezin hobea da hizkuntza-teknologien arloko ikerketa-proiektuak ezagutu, joera nagusiez jabetu eta I+G+b jardueraren emaitzak ezagutarazteko. Horretan ari garen ikerketa-taldeontzat oso garrantzitsua da bertan izatea, eta Elhuyar Fundazioko I+G+b lantaldearen presentzia handia izan da aurtengo edizioan.
LREC 2008ko biltzar nagusian, bi ikerketa-proiektu aurkeztu ditu Elhuyar Fundazioak. Maiatzaren 28an, Eli Pociellok WNTerm proiektua aurkeztuko du (WNTerm: Enriching the MCR with a terminological dictionary. Eli Pociello, Antton Gurrutxaga, Eneko Agirre, Izaskun Aldezabal and German Rigau). WNTerm zientzia eta teknologiaren domeinu-ontologia eleaniztuna garatzeko proiektua da (euskaraz eta ingelesez), eta IXA taldearen EusWordNet eta Elhuyar Fundazioaren Zientzia eta Teknologiaren Hiztegi Entziklopedikoa-ren baliabideak erabiltzen ari gara ezagutza-basea eratzeko.
Maiatzaren 29an, Igor Leturiak “Analysis and Performance of Morphological Query Expansion and Language-Filtering Words on Basque Web Searching. Igor Leturia, Antton Gurrutxaga, Nerea Areta and Eli Pociello” artikulua aurkeztu du. Lan horren helburua da CorpEus eta Elebila tresnen eraginkortasuna are gehiago hobetzeko erabili diren teknikak garatzea.
Biltzar nagusiaz gainera, hainbat workshop izango dira, ikerketa-arlo jakinetako tailer praktikoak. Maiatzaren 31n, Building and Using Comparable Corpora workshop-ean Xabier Saralegi eta Iñaki San Vicentek “Automatic extraction of bilingual terms from comparable corpora in a popular science domain. Xabier Saralegi, I. San Vicente, A. Gurrutxaga” ikerketa-lana aurkeztu dute. Corpus konparagarrietatik abiatuta terminologia elebiduna erauzteko teknikak garatzeko egiten ari garen ikerketa-lanaren eta esperimentuen berri eman dugu.
Amaitzeko, ekainaren 1ean Igor Leturia eta Iñaki San Vicentek Web As Corpus workshop-ean “Collecting Basque specialized corpora from the web: language-specific performance tweaks and improving topic precision. Igor Leturia Azkarate, Iñaki San Vicente, Xabier Saralegi, Maddalen Lopez de Lacalle“ lana aurkeztuko dute. Corpus espezializatuak Internetetik automatikoki eratzeko ikerketa-proiektua abian dugu, eta proiektuaren orain arteko emaitzak aurkeztu ditugu.
Hizkuntza-teknologien ikerketa eta garapenean hainbat baliabide eta tresna garatu ditugu orain arte, ibilian-ibilian bagoaz aurrera, eta LREC 2008 biltzarrak gure lanaren emaitzak nazioartean ezagutarazteko aukera eman digu.
Tags: gizarteratzea, Hizkuntza-teknologiak, I+G+B, ikerketa, LREC