Irailaren lehen astean (5-7) SEPLNren (Sociedad Española del Procesamiento del Lenguage Natural) urteroko biltzarra ospatu zen Castelló de la Planan. Azken bi urtetan bertaratzerik izan ez badugu ere, aurten arrazoi polita genuen SEPLNren biltzarrera hurbiltzeko. Izan ere, biltzarrarekin batera antolatu den TASS txapelketako sistema irabazlea gurea izan da. Txapelketan proposatutako erronka ez zen makala: gaztelaniazko tuiten polaritatea sailkatzea (positibotasuna, negatibotasuna edo neutraltasuna).
Aurtengo biltzarrak beste urte batzuetan baino aurkezpen eta jarduera gutxiago izan baditu ere, bizi ditugun garai zailen seinale, gauza interesgarriak eta kalitatezko lanak ikusi ahal izan ditugu. Hala, biltzarraren lehen egunean Ido Dagan ikertzaile israeldarrak oso hitzaldi erakargarria eman zuen testuetatik ezagutza inferitzearen inguruan. Egunean zehar hainbat gai landu ziren. Horien artean informazioaren berreskurapenean garrantzia hartu du informazio geografikoaren erauzketa eta tratamenduak. Arratsaldeko saioan hiponimia-hiperonimia erlazioen azterketak presentzia handia izan zuen. Interesgarria iruditu zitzaigun Rogelio Nazarrek egindako proposamena: kookurrentzietan oinarritutako grafoak erabiltzea informazio taxonomikoa erauzteko[1].
Ostegunean goizeko saioetako bat ahotsaren ezagutza eta sintesian zentratu zen eta bertan Aholab taldeko kideek izan ziren protagonista. Arratsaldean Demo eta poster saioa ospatu zen, alor ezberdinetako lanak ikusi ahal izan genituelarik. Esaterako, azpitituluak automatikoki sortzeko sistema Daedalus-eko Julio Villenaren eskutik edo itzulpen automatikoko sistemen eta pertsonen itzulpenak konparatzeko proposamena.
Azken eguneko (ostirala 7) gai nagusia sentimenduen analisia izan zen. Hasteko, David Losadak, hizlari gonbidatu gisa, iritzi erauzketaren alorrari buruzko ikuspegi orokorra erakutsi zuen, eta alorreko joerak zein diren landu. Bereziki nabarmentzekoa da diskurtsoaren analisiak ematen duen laguntza iritzien polaritatea sailkatzeko garaian. Biltzarreko azken saioan ere presentzia nabarmena izan zuen iritziaren erauzketak, alor periodistikoko aipuen polaritatearen analisia [2] egiteko sistema horren adibide.
Ostiral arratsaldean, TASS (Taller de Análisis de Sentimientos en la SEPLN) tailerra ospatu zen. Bertan, gaztelaniazko tuiten polaritatea (positibotasuna, negatibotasuna edo neutraltasuna) sailkatzeko atazan sistemarik onena izan da gure taldeak aurkeztutakoa. Xabier Saralegik gure sistema aurkeztu zuen. Tailerra oso dinamikoa izan zen, talde bakoitzak bere sistemak aurkeztu ahala erabilitako hurbilpenen eta baliabideen inguruko eztabaida piztu zen, eta ideia truke handia izan zen. Bai Iñakik eta bai Xabierrek oso modu aktiboan parte hartu genuen eztabaidan. Bereziki interesgarria iruditu zitzaigun inesc-id talde portugaldarraren hurbilpena, hainbat sailkatzaile bitar entrenatuz osatzen dutelako bere sistema. Bigarren geratu ziren gure sistemaren atzetik. Bestela, orokorrean ikasketa automatikoko sistemak nagusitu ziren, gurearen antzekoak oinarrian, baliabide ezberdinak erabiltzen zituztenak. Erregeletan oinarritutako sistema bat ere aurkeztu zen, Malagako unibertsitatean garatutakoa. Sistema honek a priori lexiko osoena bazuen ere emaitza okerrenak lortu zituen. Esan behar da inolako optimizaziorik ez zutela burutu, sistema twitterren eremura egokitzeko, eta, gainera, 3 kategorien gaineko sailkapena besterik ez zuten egin.
Horixe, Castelló de la Planara egindako bidaiak eman zuena. Pena, aireportu famatua bisitatzerik ez genuen izan, hegazkinik ez eta, bidaia kotxez egin baikenuen.
Iñaki San Vicente eta Xabier Saralegi
Erreferentziak
[1] R. Nazar, J. Vivaldi, eta L. Wanner, «Co-occurrence Graphs Applied to Taxonomy Extraction in Scientific and Technical Corpora», Procesamiento de Lenguaje Natural, libk. 49, zenb. 0, or. 67–74, ira. 2012.
[2] A. M. Ráez, E. M. Cámara, M. T. M. Valdivia, eta L. A. U. López, «Detección de la polaridad en citas periodísticas: una solución no supervisada», Procesamiento de Lenguaje Natural, libk. 49, or. 149–156, 2012.