Posts Tagged ‘Hizkuntza-teknologiak’

Turitec 2012 biltzarraren kronika

Astelehena, azaroa 5th, 2012

Urriaren 25 eta 26an, Elhuyar I+Gko Iker Manterola Malagan izan zen, TURITEC 2012 kongresuan. Biltzar horren helburu nagusia turismoaren alorrean aplikatutako informazioaren eta komunikazioaren teknologien (IKT) ezagutza eta esperientziak elkarbanatzea da. Horretarako, aditu eta ikerlari ezberdinek turismoaren alorrean burututako ekarpen zientifiko-teknikoak aurkezten dituzte.

Aurten aurkeztutako lanetako bat gurea izan da (Manterola et al., 2012), “Extracción automática de fichas de recursos turísticos de la web” izenburupean egindako lana, hain zuzen ere. (gehiago…)

eLEZKARI, bilaketa eleaniztunak euskaratik abiatuta

Astelehena, urria 22nd, 2012

Webean gero eta informazio gehiago dago eskuragarri. Hazkunde horren froga da azkeneko 30 urte hauetan aurreko 5.000 urteetan (zibilizazioaren historia osoa) baino informazio gehiago ekoiztu izana. Informazio hori, gainera, hainbat hizkuntzatan idatzia dago. Zoritxarrez, webean kontsultagai dagoen informazio guztiaren proportzio txiki bat soilik dago euskaraz (%0,01ra ez da iristen). Bestetik, euskaldun gehienok, elebidunak edo eleaniztunak garenez, informazioa bilatzen dugunean gaztelania, ingelesa edo frantsesa erabiltzera jotzen dugu hizkuntza handietan informazio gehiago dagoelako (ikusi 1. irudia)1, euskarazko edukiak zokoratuz. Euskara bezalako beste hizkuntza txiki batzuetan ere errepikatzen da fenomeno hori; elebidunak diren erabiltzaileek dakiten hizkuntza nagusia erabiltzen dute interneteko bilaketetan [1,2].

1. irudia. Webeko edukien banaketa hizkuntzen arabera

(gehiago…)

  1. http://w3techs.com/technologies/overview/content_language/all

LREC 2012 kongresuaren kronika

Osteguna, abuztua 2nd, 2012

Maiatzaren 21etik 27ra, LREC 2012 biltzarraren 8. edizioa izan zen Istanbulen. Biltzar hori bi urtez behin egiten da, eta azken aldian garatutako tresna eta baliabideak ezagutzeko aukera ematen du. Gainera, hizkuntza-teknologien inguruan dauden Europako proiektuen berri izateko bilkura ezin hobea da.

(gehiago…)

AnHitz proiektua, Polonian saritua

Osteguna, urria 22nd, 2009
Joan den astean Poloniako Mrągowo herrian izandako CLA’09 (Computational Linguistics – Applications) nazioarteko workshop-ean AnHitz-ek, euskaraz egiten duen zientzia eta teknologiako aditu birtualak, aplikazio onenaren saria irabazi zuen.
 
 anhitz

(gehiago…)

Hizkuntzaren teknologiak eta hizkuntzaren industriak

Asteartea, abuztua 4th, 2009

Elhuyar Zientzia eta Teknologia aldizkariko ekaineko alean Andoni Sagarnak artikulu interesgarria idatzi du hizkuntzaren teknologiak eta hizkuntzaren industriaren inguruan. Besteak beste, hizkuntzaren prozesamenduan oinarritutako aplikazioak heldutasunera eta merkatura iristen ari direla azaltzen digu, eta horiek lantzen dituzten industria batzuk indarra hartzen ari direla.

Asko idatzi du Andoni Sagarnak hizkuntzaren industriaren eta hizkuntzaren teknologien inguruan: gai hauetan sakontzeko gomendagarria da benetan Iparrorratza bloga jarraitzea eta  Euskaltzaindiko sarrera-hitzaldia irakurtzea.

Hizkuntzaren industriaren erronka berriez gehiago jakiteko.

Web semantikoa: Interneten benetako ahala iristeko dago oraindik

Asteazkena, uztaila 1st, 2009

1990ean, Sir Tim Berners-Lee CERNeko ikertzaileak World Wide Web-a asmatu zuen, hipertestuaren kontzeptua eta Interneteko TCP/IP eta DNS protokoloak konbinatuz. Asmakizun hark gu guztion bizitza eta mundu osoa aldatu zituen. Hala ere, aldaketa hori ez da ezer izango Berners-Lee azkenaldian lantzen ari den ideia berria, web semantikoa alegia, gauzatuz gero sortuko denaren aldean.

Web semantikoaz Igor Leturiak idatzitako artikuluaren lehen zatia irakurgai duzue osorik Elhuyar Zientzia eta Teknologia aldizkari berrituan.

Hizkuntzen industriaren erronka berriak

Osteguna, ekaina 25th, 2009

EHUko Udako XXVIII.  ikastaroen barnean Soziolingusitika Klusterrak “Zein hizkuntza hitz egiten du komunikazio gizarteak?” ikastaroa antolatu du. Ikastaro honetan Elhuyar Fundazioko Josu Waliñok hitzaldia eman zuen atzo “Hizkuntzen industriaren erronka berriak” izenburupean.

Hitzaldiko aurkezpena hemen duzue:

Corpus konparagarriak: zer dira eta zertarako erabil daitezke?

Asteartea, maiatza 26th, 2009

Hizkuntzalaritzan eta, bereziki, hizkuntza-teknologietan, corpus konparagarriak gero eta garrantzia handiagoa hartzen ari dira azken urteotan. Artikulu honetan corpus konparagarriak zer diren, eta hizkuntzalaritzan nahiz hizkuntza-teknologietan zertarako balio dezaketen azaltzen saiatuko gara.

Testu-corpusak idatzizko dokumentuen bildumak dira, eta oinarrizko baliabideak dira hizkuntza naturalaren zenbait ezaugarri aztertu ahal izateko edota hipotesiak kontrastatzeko. Hizkuntza naturalaren prozesamendua egiteko behar den ezagutza inferitzeko ere oso garrantzitsuak dira. Hala ere, corpus-mota asko daude, eta, zereginaren arabera, batzuk aproposagoak dira besteak baino. Corpus konparagarriak, adibidez, antzeko testuez osatutako bildumak dira. Dokumentuak “antzekoak” direla esateko irizpide ezberdinak badaude ere (gehiago…)

AnHitz zientzia aditu birtuala Argia.com-en

Larunbata, maiatza 9th, 2009

AnhHtz zientzia aditu birtualaren erreportajea Argia.com-en

AnHitz zientzia aditu birtuala Teknopolis saioan

Igandea, azaroa 9th, 2008

AnHitz zientzia aditu birtuala Teknopolis saioan