ECIRen aurtengo edizioa apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR Informazioen Berreskurapenaren (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere Elhuyar I+G taldea bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak egitea izan dugu helburu.
Biltzarraren saio nagusiak hiru egun hartu ditu, IRko gaur egungo ikergai nagusiak jasotzeko. Saio nagusiari Università degli Studi di Milano-ko Paolo Boldiren keynote-ak eman zion hasiera. Loturen azterketa (Link analysis) egiteko algoritmoei buruz hitz egin zigun. Algoritmo-mota horiek pil-pilean daude IRaren munduan. Google, adibidez, bilaketen emaitzak ordenatzeko erabiltzen hasi zen. Boldik argi utzi nahi zuen Googlekoak ez zirela algoritmo-mota horien asmatzaileak, soziologian lehenagotik erabiltzen ari zirelako. Yahoo! Research-eko Amit Kagianek kontsulta transakzionalak lantzeko metodo bat aurkeztu zuen. Metodoak interfazeak automatikoki sortzen ditu, erabiltzaileak transakzioa (adibidez, hegaldi baten erreserba) errazago egin dezan.
Lan batzuek mezu elektronikoen bilaketen gaiari heldu zioten. David Elsweiler-k adierazi zuen bezala, oraindik ez da existitzen posta elektronikoa baino sare sozial handiagorik. Twitter baliabide moduan erabiltzen zituzten lanak ere aurkeztu ziren. Adibidez, Morgan Harvey-k URLak dituzten tuitetatik gako-hitzak erauzteko metodo bat azaldu zigun, Delicious-ekoen modukoak.
Beste egile batzuek erantzunak ordenatzeko algoritmo berriak edo hobekuntzak proposatu zituzten. Hao Wu-k, adibidez, tf-idf estatistikoa kalkulatzeko “and” erlazioa kontuan hartzen duen aldaera bat proposatu zuen. Oso interesgarria iruditu zitzaigun -Elhuyarrek estrategikotzat duen CLIR ikerketa-ildoan kokatzen baita- Bo Li-k aurkeztutako bilaketak prozesatzeko hizkuntzen arteko eredu berria. Bestetik, Stephen E. Robertson-ek (BM25 eredu arrakastatsuaren asmatzailea) IR sistemak ebaluatzeko MAP metrika klasikoaren aldaera sendoago bat aurkeztu zuen.
Aplikazioen atalean, aipatzekoak dira Claudio Lucchesek aurkeztutako ibilbide turistikoak automatikoki sortzen dituen sistema, eta Parikshit Sondhi-k azaldu zigun medikuntzako informazio sinesgarria eskaintzen duten webguneak automatikoki detektatzeko aplikazioa.
Azkenik, industriaren eta ikertzaileen interesak uztartzen dituen saioan (Industry day izenekoa) nabarmena zen -eta, era berean, adierazgarria- social media-z baliatzen diren iritziak erauzteko sistemen presentzia. Gavagai, AOL, Oxyme, Websays enpresek berek garatutako sistemei buruz hitz egin zuten.
Xabier Saralegi.
ECIRen aurtengo edizioa apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR Informazioen Berreskurapenaren (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere Elhuyar I+G taldea bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak egitea izan dugu helburu.
Biltzarraren saio nagusiak hiru egun hartu ditu, IRko gaur egungo ikergai nagusiak jasotzeko. Saio nagusiari Università degli Studi di Milano-ko Paolo Boldiren keynote-ak eman zion hasiera. Loturen azterketa (Link analysis) egiteko algoritmoei buruz hitz egin zigun. Algoritmo-mota horiek pil-pilean daude IRaren munduan. Google, adibidez, bilaketen emaitzak ordenatzeko erabiltzen hasi zen. Boldik argi utzi nahi zuen Googlekoak ez zirela algoritmo-mota horien asmatzaileak, soziologian lehenagotik erabiltzen ari zirelako. Yahoo! Research-eko Amit Kagianek kontsulta transakzionalak lantzeko metodo bat aurkeztu zuen. Metodoak interfazeak automatikoki sortzen ditu, erabiltzaileak transakzioa (adibidez, hegaldi baten erreserba) errazago egin dezan.
Lan batzuek mezu elektronikoen bilaketen gaiari heldu zioten. David Elsweiler-k adierazi zuen bezala, oraindik ez da existitzen posta elektronikoa baino sare sozial handiagorik. Twitter baliabide moduan erabiltzen zituzten lanak ere aurkeztu ziren. Adibidez, Morgan Harvey-k URLak dituzten tuitetatik gako-hitzak erauzteko metodo bat azaldu zigun, Delicious-ekoen modukoak.
Beste egile batzuek erantzunak ordenatzeko algoritmo berriak edo hobekuntzak proposatu zituzten. Hao Wu-k, adibidez, tf-idf estatistikoa kalkulatzeko “and” erlazioa kontuan hartzen duen aldaera bat proposatu zuen. Oso interesgarria iruditu zitzaigun -Elhuyarrek estrategikotzat duen CLIR ikerketa-ildoan kokatzen baita- Bo Li-k aurkeztutako bilaketak prozesatzeko hizkuntzen arteko eredu berria. Bestetik, Robertson-ek (BM25 eredu arrakastatsuaren asmatzailea) IR sistemak ebaluatzeko MAP metrika klasikoaren aldaera sendoago bat aurkeztu zuen.
Aplikazioen atalean, aipatzekoak dira Claudio Lucchesek aurkeztutako ibilbide turistikoak automatikoki sortzen dituen sistema, eta Parikshit Sondhi-k azaldu zigun medikuntzako informazio sinesgarria eskaintzen duten webguneak automatikoki detektatzeko aplikazioa.
Azkenik, industriaren eta ikertzaileen interesak uztartzen dituen saioan (Industry day izenekoa) nabarmena zen -eta, era berean, adierazgarria- social media-z baliatzen diren iritziak erauzteko sistemen presentzia. Gavagai, AOL, Oxyme, Websays enpresek berek garatutako sistemei buruz hitz egin zuten.