Elhuyar I+G bloga

Hizkuntza-teknologietan ikertuz

Browsing Posts tagged I+G+B

ECIRen aurtengo edizioa apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR Informazioen Berreskurapenaren (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere Elhuyar I+G taldea bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak egitea izan dugu helburu.
continue reading…

Joan den astean Poloniako Mrągowo herrian izandako CLA’09 (Computational Linguistics – Applications) nazioarteko workshop-ean AnHitz-ek, euskaraz egiten duen zientzia eta teknologiako aditu birtualak, aplikazio onenaren saria irabazi zuen.
 
 anhitz

continue reading…

Hizkuntzalaritzan eta, bereziki, hizkuntza-teknologietan, corpus konparagarriak gero eta garrantzia handiagoa hartzen ari dira azken urteotan. Artikulu honetan corpus konparagarriak zer diren, eta hizkuntzalaritzan nahiz hizkuntza-teknologietan zertarako balio dezaketen azaltzen saiatuko gara.

Testu-corpusak idatzizko dokumentuen bildumak dira, eta oinarrizko baliabideak dira hizkuntza naturalaren zenbait ezaugarri aztertu ahal izateko edota hipotesiak kontrastatzeko. Hizkuntza naturalaren prozesamendua egiteko behar den ezagutza inferitzeko ere oso garrantzitsuak dira. Hala ere, corpus-mota asko daude, eta, zereginaren arabera, batzuk aproposagoak dira besteak baino. Corpus konparagarriak, adibidez, antzeko testuez osatutako bildumak dira. Dokumentuak “antzekoak” direla esateko irizpide ezberdinak badaude ere continue reading…

Informatikari Euskaldunen VII. Bilkura ospatuko da gaur . Aurten ere, bilkuraren gai nagusitzat Internet hartu dute antolatzaileek eta ohi bezala, bilkuran gaiari lotutako hitzaldiak eta mahai ingurua izango dira.

Elhuyar Hizkuntza Zerbitzuetako I+Gko eta Elekako kideok izango dira Bilkuran eta hainbat hitzaldi emango ditugu:

UEUko Informatika Saila eta Miramon Enpresa Digitala elkarlanean aritu dira Bilkura honen antolakuntzan. Jardunaldiaren informazio gehiago UEUren webgunean eta IEB2009ko blogean duzue.

Igor Leturia AnHitz proiektuaren aurkezpenean:

ZT Corpusa, Zientzia eta Teknologiaren Corpusa, handitu egin da, eta kontsulta-aukera berriak eskaintzen ditu. Zientzia eta teknologiaren alorreko euskara ikertzeko garatutako hizkuntza-baliabide ahaltsua da ZT Corpusa. Elhuyar Fundazioak eta EHUko IXA Taldeak elkarlanean garatutako proiektu honen lehen emaitzak 2006aren hondarrean aurkeztu ziren jendaurrean, on-line kontsultatzeko interfazea kaleratu zenean. Baina beti hedatu eta hobetzeko asmoari jarraituz, kontsulta-aukera hedatuez eta testu gehiagoz hornitu da berriki.

continue reading…

Berriki eta oso denbora tarte txikian, bi web zerbitzu interesgarri agertu dira euskal Internetaren panoraman: CorpEus eta Elebila. Interneteko hainbat tokitan irakurritakoagatik, badirudi zerbitzuok aurkeztean ez dela ongi ulertu zertan datzan teknologia hori. Artikulu honetan argiago azaltzen saiatuko gara CorpEus eta Elebilaren azpian dagoena.

continue reading…

Martxan da dagoeneko Anhitz proiektua. Euskarazko hizkuntza-teknologietan ikerketa eta garapena sustatzeko asmoz jaio den ikerketa-proiektu estrategikoa da, eta bost partzuer elkartu dira xede horretarako, Elhuyar Fundazioa tarteko.

Jakintza eta Informazioaren Gizartean, gero eta garrantzi handiagoa du eleaniztasunak. Eta hizkuntza-teknologiek zeresan handia dute horretarako erabili behar diren tresnen garapenean. continue reading…

Powered by WordPress Web Design by SRS Solutions © 2018 Elhuyar I+G bloga Design by SRS Solutions