<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ber2a &#187; I+G</title>
	<atom:link href="http://komunitatea.elhuyar.eus/hizkuntza/tag/ig/feed/" rel="self" type="application/rss+xml" />
	<link>http://komunitatea.elhuyar.eus/hizkuntza</link>
	<description>Elhuyar Hizkuntza Zerbitzuen bloga</description>
	<lastBuildDate>Tue, 10 Nov 2020 05:22:12 +0000</lastBuildDate>
	<language>eu</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.8.1</generator>
	<item>
		<title>Turitec 2012 biltzarraren kronika</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2012/11/05/turitec-2012-biltzarraren-kronika/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2012/11/05/turitec-2012-biltzarraren-kronika/#comments</comments>
		<pubDate>Mon, 05 Nov 2012 11:33:24 +0000</pubDate>
		<dc:creator><![CDATA[Elhuyar I+G]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[biltzarrak]]></category>
		<category><![CDATA[I+G]]></category>
		<category><![CDATA[TourExp]]></category>
		<category><![CDATA[Turismo]]></category>
		<category><![CDATA[Turitec]]></category>

		<guid isPermaLink="false">http://www.elhuyar-blogak.org/hizkuntza/?p=491</guid>
		<description><![CDATA[Urriaren 25 eta 26an, Elhuyar I+Gko Iker Manterola Malagan izan zen, TURITEC 2012 kongresuan. Biltzar horren helburu nagusia turismoaren alorrean aplikatutako informazioaren eta komunikazioaren teknologien (IKT) ezagutza eta esperientziak elkarbanatzea da. Horretarako, aditu eta ikerlari ezberdinek turismoaren alorrean burututako ekarpen zientifiko-teknikoak aurkezten dituzte. Aurten aurkeztutako lanetako bat gurea izan da (Manterola et al., 2012), “Extracción [&#8230;]]]></description>
				<content:encoded><![CDATA[<p dir="ltr">Urriaren 25 eta 26an, <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-unitatea" target="_blank">Elhuyar I+Gko</a> Iker Manterola Malagan izan zen, <a href="http://www.turitec.com/" target="_blank">TURITEC 2012</a> kongresuan. Biltzar horren helburu nagusia turismoaren alorrean  aplikatutako informazioaren eta komunikazioaren teknologien (IKT)  ezagutza eta esperientziak elkarbanatzea da. Horretarako, aditu eta  ikerlari ezberdinek turismoaren alorrean burututako ekarpen  zientifiko-teknikoak aurkezten dituzte.</p>
<p dir="ltr">Aurten aurkeztutako lanetako bat gurea izan da (<a href="http://www.turismo.uma.es/turitec/turitec/actas/2012/Actas_Turitec_2012_Completas.pdf">Manterola et al., 2012</a>), “Extracción automática de fichas de recursos turísticos de la web”  izenburupean egindako lana, hain zuzen ere. <span id="more-491"></span>Bertan, “produktu  esperientzialak” deiturikoak sortzeko behar diren oinarrizko baliabideak  lortzeko metodologia bat aurkezten da, webetik abiatuta eta erabat  automatikoa. Lan hori <a href="http://www.tourexp.es/" target="_blank">TourEXP</a> (ETORGAI 2010-n lagundua) proiektuaren testuinguruan kokatzen da,  proiektu horren lehen urratsetako bat lantzen duelarik. TourEXP  proiektuak bi helburu nagusi ditu. Lehena,  turismo-ekosistema digital eta eskalagarriak garatzea da, produktu eta  zerbitzu turistikoak modu erangikor batean banatzeko. Bigarrena, “bideko  B2B2C“<sup class='footnote'><a href='#fn-491-1' id='fnref-491-1' onclick='return fdfootnote_show(491)'>1</a></sup> motako banaketa sistema bat sortzea. Garatutako azpiegitura gai  izango da bidaiariek beren bidaiaren edozein unetan izan ditzaketen  eskaera aldakor eta bereziei erantzuteko. Helburu horien lorpenean,  CICtourGUNE, Tecnalia, Eleka eta beste hainbat kidek osatutako  kontsortzio batek dihardu lanean.</p>
<div id="attachment_565" style="width: 310px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/11/turitec_101621.jpg"><img class="size-medium wp-image-565" src="http://komunitatea.elhuyar.org/ig/files/2012/11/turitec_101621-300x225.jpg" alt="" width="300" height="225" /></a><p class="wp-caption-text">Lehen eguneko hitzaldietako bat</p></div>
<p style="text-align: left" dir="ltr">Biltzarra interesgarria izan da, turismoaren alorrean IKTen mundutik  egiten ari diren ekarpenak sakonago ezagutzeko aukera izan baitugu.  Ikuspegi hau oso baliagarria izango da etorkizuneko proiektuei begira,  Hizkuntza Teknologiek zertan lagun dezaketen aztertzeko.</p>
<p dir="ltr">Turitec-en  aurkeztutako lan gehienetan, nabarmena izan da IKTen erabilera gero eta  garrantzitsuagoa bihurtzen ari dela, eta, beraz, turismoaren alorreko  baliabideen etorkizunean faktore erabakigarria dela. Hala ere, bi kezka  edo behar nagusi azaleratu dira. Alde batetik, sistema ezberdinen arteko  elkarreragingarritasunaren beharra azpimarratu da. Turismoaren alorrean  aplikatzen diren sistema eta prozesuen artean informazio nahiz edukiak  modu eraginkorrean trukatzea ezinbestekoa da, maila altuko emaitzak  lortzeko. Bestetik, argi geratu da turismoaren arloan dihardutenen  trebakuntza beharra, hizkuntza nahiz informazio eta komunikazio  teknologietan. Ezagutza hainbat hizkuntzatan sakabanatuta egoteak  turismoaren alorrean duen eragina ukaezina da. Hortaz, alor horretan  ere, ezinbestekoa da eleaniztasunaren kudeaketa, Elhuyar I+Gk garatutako  teknologia eta tresnak oso baliagarriak izanik.</p>
<p dir="ltr">Horrela, kongresuan zehar aurkezpen interesgarri ugari ikusi ahal izan  ditugu. Adibidez, aipagarriak dira hoteletako bezeroek bertako langileen  adeitasunaren trukean zenbat ordainduko luketen aztertzen zuen lana (<a href="http://www.turismo.uma.es/turitec/turitec/actas/2012/Actas_Turitec_2012_Completas.pdf">Benítez et al., 2012</a>) edota sare sozialetako adimen kolektiboa erabiliz turismoko albisteak garrantziaren arabera sailkatzeko gai den sistema (<a href="http://www.turismo.uma.es/turitec/turitec/actas/2012/Actas_Turitec_2012_Completas.pdf">Astigarraga et al., 2012</a>).</p>
<p dir="ltr">Bide batez, eta euripean izan bada ere, ordu batzuez behintzat Malagako  kaleez gozatzeko aukera izan dugu. Nork esan behar zuen behingoz  hegoaldera jaitsi eta hemen baino eguraldi okerragoa topatu behar  genuenik&#8230;</p>
<p dir="ltr">
<p dir="ltr">Iker Manterola.</p>
<div class='footnotes' id='footnotes-491'>
<div class='footnotedivider'></div>
<ol>
<li id='fn-491-1'> B2B2C (business to business to consumer): B2B (business to business) eta B2C (&#8216;business to consumer&#8217;) uztartzen dituen merkataritza elektroniko mota bat da.  <span class='footnotereverse'><a href='#fnref-491-1'>&#8617;</a></span></li>
</ol>
</div>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2012/11/05/turitec-2012-biltzarraren-kronika/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>eLEZKARI, bilaketa eleaniztunak euskaratik abiatuta</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2012/10/22/elezkari-bilaketa-eleaniztunak-euskaratik-abiatuta/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2012/10/22/elezkari-bilaketa-eleaniztunak-euskaratik-abiatuta/#comments</comments>
		<pubDate>Mon, 22 Oct 2012 09:25:00 +0000</pubDate>
		<dc:creator><![CDATA[Elhuyar I+G]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[Informazioaren Berreskurapena (IR)]]></category>
		<category><![CDATA[bilatzaileak]]></category>
		<category><![CDATA[eleaniztasuna]]></category>
		<category><![CDATA[eLEZKARI]]></category>
		<category><![CDATA[I+G]]></category>
		<category><![CDATA[I+G+B]]></category>
		<category><![CDATA[IR]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/?p=482</guid>
		<description><![CDATA[Webean gero eta informazio gehiago dago eskuragarri. Hazkunde horren froga da azkeneko 30 urte hauetan aurreko 5.000 urteetan (zibilizazioaren historia osoa) baino informazio gehiago ekoiztu izana. Informazio hori, gainera, hainbat hizkuntzatan idatzia dago. Zoritxarrez, webean kontsultagai dagoen informazio guztiaren proportzio txiki bat soilik dago euskaraz (%0,01ra ez da iristen). Bestetik, euskaldun gehienok, elebidunak edo eleaniztunak [&#8230;]]]></description>
				<content:encoded><![CDATA[<p lang="eu">Webean gero eta informazio gehiago dago eskuragarri. Hazkunde horren froga da azkeneko 30 urte hauetan aurreko 5.000 urteetan (zibilizazioaren historia osoa) baino informazio gehiago ekoiztu izana. Informazio hori, gainera, hainbat hizkuntzatan idatzia dago. Zoritxarrez, webean kontsultagai dagoen informazio guztiaren proportzio txiki bat soilik dago euskaraz (%0,01ra ez da iristen). Bestetik, euskaldun gehienok, elebidunak edo eleaniztunak garenez, informazioa bilatzen dugunean gaztelania, ingelesa edo frantsesa erabiltzera jotzen dugu hizkuntza handietan informazio gehiago dagoelako (ikusi 1. irudia)<sup class='footnote'><a href='#fn-482-1' id='fnref-482-1' onclick='return fdfootnote_show(482)'>1</a></sup>, euskarazko edukiak zokoratuz. Euskara bezalako beste hizkuntza txiki batzuetan ere errepikatzen da fenomeno hori; elebidunak diren erabiltzaileek dakiten hizkuntza nagusia erabiltzen dute interneteko bilaketetan [1,2].</p>
<div id="attachment_513" style="width: 361px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/10/WebEdukiak.png"><img class="size-medium wp-image-513   " src="http://komunitatea.elhuyar.org/ig/files/2012/10/WebEdukiak.png" alt="" width="351" height="312" /></a><p class="wp-caption-text">1. irudia. Webeko edukien banaketa hizkuntzen arabera</p></div>
<p lang="eu"><span id="more-482"></span>Egoera horren aurrean honako galdera egiten dugu: erabiltzaile batek ez luke informazio aberatsagoa lortuko, baldin eta bilaketa baten emaitzak berak dakizkien hizkuntza guztietan jasoko balitu? Informazioaren berreskurapena ez luke erosoago burutuko kontsultak bere ama-hizkuntzan egingo balitu? Alde batetik, zenbait ikerketetan frogatu dute erabiltzaileak erosoago sentitzen direla informazioa eskuratzeko prozesuak bere ama-hizkuntzan burutuz [3]. Bestetik, ezin dugu ahaztu elebitasuna ez dela fenomeno isolatu bat (ikusi 2. irudia)<sup class='footnote'><a href='#fn-482-2' id='fnref-482-2' onclick='return fdfootnote_show(482)'>2</a></sup>. Europan adibidez, populazioaren erdia elebiduna da [4]. CLIR (<em>Cross-language Information Retrieval</em>) teknologiari esker, erabiltzaile askok, bere ama-hizkuntzatik abiatuta, menderatzen dituzten hizkuntzetan idatzita dauden edukiak eskuratu ahal izango dituzte.</p>
<p>Eleaniztasunaren oztopoaz gain, informazio kopuru handiak kudeatzeko arazoarekin ere egiten dugu topo. Informazio kopuru handi horiek modu antolatu batean ez badira atzitzen saturazioaren problema gertatu daiteke. Informazio gehiegi egoteak behar dugun ezagutza eskuratzea oztopa dezake, erabiltzaileak bilaketetan oinarritutako erabaki okerrak hartzera bideratuz. Informazioa modu antolatuan eskuragai jartzeko helburuarekin,  <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-unitatea">Elhuyarreko I+G taldeak</a> <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/eLEZKARI-(CLIR)">eLEZKARI</a>, hizkuntza arteko bilatzaile eleaniztuna, garatu du.</p>
<div id="attachment_512" style="width: 370px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/10/WebHizkuntzak.png"><img class="size-medium wp-image-512  " src="http://komunitatea.elhuyar.org/ig/files/2012/10/WebHizkuntzak.png" alt="" width="360" height="252" /></a><p class="wp-caption-text">2. irudia. Hiztun kopuruak (L1=jatorrizko hizkuntza eta L2=bigarren hizkuntza)</p></div>
<p lang="eu">Tresna hau, Elhuyar Fundazioaren I+G taldeak hizkuntza arteko dokumentuen berreskurapen automatikoaren (ingelesez, CLIR) ikerketa-ildoan burutzen duen jardueraren [5,6,7,8] emaitza da.</p>
<p lang="eu"><strong>eLEZKARI, hizkuntza arteko bilatzaile eleaniztuna</strong></p>
<p>Hemen aurkezten den <a href="http://zientzia.net/bilaketa_aurreratua_form/">CLIR bilatzailea</a> domeinuarekiko independentea den arren, kasu honetan, zientzia eta teknologiaren domeinurako egokitu da,  zientzia.net eta Elhuyar Zientzia eta Teknologia aldizkariaren webguneetan inplementatuz. Bilatzaile horrek, hizkuntza batetik abiatuta (euskara), hizkuntza batean baino gehiagotan dauden zientzia eta teknologiako albisteak bilatzen ditu (euskara eta ingelesezko albisteak).</p>
<p>Erabiltzaile euskaldunei dago zuzenduta tresna hau. Zientzietako irakasgai baterako gai baten inguruan informazio bilatu nahi duten ikasle zein irakasleek; artikulu bat idazteko informatu nahi duten kazetariek; edo, besterik gabe, zientzia eta teknologia gaiak interesatzen zaizkien erabiltzaile arruntek, kontsulta orokorrak (adibidez, “<em>Hiesaren aurkako txertoa”</em>) nahiz zehatzagoak (adibidez, “<em>herentzia genetikoaren eragina minbiziaren garapenean</em>”) burutu ditzakete, informazio esanguratsua hainbat hizkuntzatan lortuz (ikusi 3.irudia). Kontsulta horiek hizkuntza naturalean adierazi ditzake  erabiltzaileak (ikusi 3.irudia), izan ere, bilaketa prozesuan kontsultak lematizatzen dira.</p>
<p>Interneten dauden bilatzaileen aldean hainbat abantaila eskaintzen ditu tresna honek. <a href="https://www.google.com/">Google</a> bilatzaile ospetsuak esaterako, kontsultako hitzen formak eta hauen aldaera gutxi batzuk bilatzen ditu, eta hori, euskararen kasuan, morfologia aberatsa duen hizkuntza izanik, oso kaltegarria izan daiteke emaitza egokiak bilatzeko.</p>
<p>Bestetik, <a href="http://www.elebila.eu/search_basic/">Elebila</a> euskarazko bilatzaileak, <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/EusBila">EusBila</a> teknologian oinarrituta, erdibideko estrategia erabiltzen du morfologiaren problemari aurre egiteko: kontsulta lematizatu eta morfologia-sorkuntza aplikatzen ditu kontsultako lemen flexio guztiak lortzeko. Hala ere, berreskurapena burutzeko bilatzaile komertzialak erabiltzen ditu, eta horietan bildumak lematizatuta ez daudenez, dokumentu esanguratsuen ranking okerragoak sortzen dira.</p>
<p lang="eu">Desabantaila horiek izanda ere, Elebila bilatzaileak eta Googlek hemen aurkezten dugun bilatzaileak baino estaldura handiagoa dute. Elebilak eta Googlek  internet osoaren gainean burutzen dituzte bilaketak, eLEZKARIk ordea, zientzia eta teknologiako edukietan soilik.</p>
<div id="attachment_514" style="width: 340px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/10/bilaketa_biak_Elezkari.jpg"><img class="size-medium wp-image-514  " src="http://komunitatea.elhuyar.org/ig/files/2012/10/bilaketa_biak_Elezkari.jpg" alt="" width="330" height="289" /></a><p class="wp-caption-text">3.irudia. Bilaketaren emaitzen adibidea</p></div>
<p lang="eu">eLEZKARI bilatzaileak bi osagai nagusi ditu: sarrerako kontsultaren itzulpenerako modulua eta informazioaren berreskurapenerako modulua. Jarraian, modulu horiek azalduko dira.</p>
<p lang="eu"><strong>Kontsultaren Itzulpena</strong></p>
<p lang="eu">Kontsultaren itzulpena egiteko, hainbat modu proposatzen dira literaturan. Garatu dugun tresnak hiztegietan oinarritutako teknikak erabiltzen ditu, horiek ondo egokitzen baitira euskara bezalako baliabide urriko hizkuntzetara [5,6]. Kontsultaren itzulpen-prozesuan,  hiztegien bidezko itzulpen prozesuan sortzen diren arazo nagusiak tratatzen dira [7]:</p>
<p style="padding-left: 30px"><strong>a) Hiztegitik kanpoko hitzak</strong>: hiztegietan agertzen ez diren hitzak itzultzeko, helburu hizkuntzan dagoen bilduman antzekotasun ortografiko handiena duten hitzak aukeratzen dira itzulpen-hautagaitzat. (Adibidez, “<em>korrupzio</em>” -&gt; ”<em>corruption</em>”).</p>
<p style="padding-left: 30px" lang="eu"><strong>b) Itzulpenen anbiguotasuna: </strong>jatorrizko hitzaren adierari ez dagozkioen itzulpenak tratatzeko, “kontsulta egituratuak” deiturikoak [9] erabiltzen ditugu. Kontsulta egituratuetan, kontsultako hitz baten itzulpen-hautagai guztiak multzokatuta tratatzen dira dokumentuen (albisteak) rankinga zehatzago kalkulatzeko. Adibidez, “<em>baleak ehizatzea debekatua dagoen erreserbak”</em> kontsultaren itzulpen bezala “<em>#syn(whale) #syn(shoot hunt) #syn( forbid prevent prohibit ban ) #syn( booking reserve)</em>” kontsulta egituratua sortuko genuke.</p>
<p lang="eu"><strong>Informazioaren berreskurapena</strong></p>
<p lang="eu">Kontsultaren itzulpen-prozesua amaitutakoan, informazioaren berreskurapen prozesuari ekiten zaio. Albisteak bi tokitan bilatzen dira, zientzia.net barruko edukietan eta zientzia eta teknologia alorreko erreferentziazko webguneetan (<em>BasqueResearch, Futurity, Science, Nature</em> eta <em>PhysicsWorld</em>). Webgune horietan albiste berriak argitaratu ahala, eguneratze-moduluak gure dokumentu-bildumetan gehitzen ditu RSS-en (<em>Really Simple Syndication</em>) bitartez. Horrela, erabiltzaileek estaldura handiko lagina izango dute kontsultagai.</p>
<p lang="eu">Berreskurapen-algoritmoa erabilita jatorrizko kontsulta euskarazko albisteekin osatutako bildumaren aurka prozesatuko dugu, eta, kontsultaren itzulpen-prozesuan lortu dugun itzulpena ingelesezko albisteekin osatutako bildumaren aurka. Berreskurapen-algoritmoak dokumentu (albiste) esanguratsuen rankinga osatuko du. Ranking hauetan dokumentuak kontsultak adierazten duen gaiarekiko duten antzekotasun mailaren arabera daude ordenatuta. Ranking hauek kalkulatzeko <a href="http://www.lemurproject.org/indri/" target="_blank"><em>Indri</em></a> algoritmoa erabili dugu.</p>
<p lang="eu"><strong>Ebaluazioa</strong></p>
<p lang="eu">Guk garatutako bilatzailearen eraginkortasuna neurtzeko asmoz, <em>Google</em> bilatzailearekin alderatu dugu. Horretarako, <em>Google mugatu dugu</em> bilaketak zientzia.net-eko edukien gainean soilik burutu ditzan, <a href="http://googlecustomsearch.blogspot.com.es/" target="_blank"><em>Google Custom Search</em> zerbitzua</a><a href="#sdfootnote4sym"></a> erabiliz. Ebaluazio honetan bilatzailearen garapen-prozesutik at egon diren bi pertsonek hartu dute parte giza-ebaluatzaile moduan.</p>
<p lang="eu">Ebaluatzaileek, ausaz aukeratutako berrogei kontsultentzat bi sistemek itzulitako rankingetako dokumentuak banan-banan aztertu dituzte, eta egokitasun-maila adierazten duten hiru kategorien arabera sailkatu dituzte<sup class='footnote'><a href='#fn-482-3' id='fnref-482-3' onclick='return fdfootnote_show(482)'>3</a></sup>:</p>
<ul>
<li><em>Oso esanguratsua:</em> dokumentuak kontsultan adierazten den informazio beharrari erantzuten dio. Dokumentuan kontsultako gaia sakon aztertzen da.</li>
<li><em>Esanguratsua</em>: dokumentuak kontsultan adierazten den informazio beharrari zati batean erantzuten dio.</li>
<li><em>Ez-esanguratsua</em>: dokumentuak ez du kontsultan adierazten den gaiari buruzko informaziorik ematen.</li>
</ul>
<p lang="eu">Ebaluazio prozesuan ahalik eta desbiderapen txikienak egon daitezen, ebaluazio itsua diseinatu dugu. Horretarako ebaluatzaileei ezkutatu egin zaie dokumentu bakoitza zein bilatzailek itzuli duen eta dagokion rankingeko zein posiziotan kokatuta dagoen.</p>
<p lang="eu">Kontsulta bakoitzarentzat bilatzaile bakoitzak itzulitako lehen hamar dokumentuak ebaluatu dira. 5. irudian, Bilatzaile bakoitzak zenbat galderatan lortu duen ranking egokiena adierazten da. Nabarmentzekoa da eLEZKARIk <em>Google Custom Search</em>-ek baino ranking hobeak eskaintzen dituela kontsulta gehienetarako (%78).  Hiru kontsultentzat ranking berdinak itzuli dituzte bi bilatzaileek.</p>
<p lang="eu">
<div id="attachment_515" style="width: 370px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/10/grafika_blog_ebal1.jpg"><img class="size-medium wp-image-515  " src="http://komunitatea.elhuyar.org/ig/files/2012/10/grafika_blog_ebal1.jpg" alt="" width="360" height="222" /></a><p class="wp-caption-text">5. Irudia. Eraginkortasun onena berrogei kontsultetan; Google Custom Search vs. eLEZKARI elebakarra</p></div>
<p style="text-align: center" lang="eu">
<p lang="eu"><em>Google Custom Search</em>-en eta gure bilatzailearen arteko ebaluazioa egiteaz gain, bilaketa elebakarrarekin lortutako emaitzak eta hizkuntza arteko bilaketarekin lortutako emaitzak ere konparatu ditugu. Espero bezala, bilaketa elebakarrarekin emaitza hobeak lortu dira, baina, aipatu behar da, zortzi kontsultarentzat hizkuntza arteko bilaketarekin rankingetan dokumentu esanguratsu gehiago itzuli direla (Ikusi 6. irudia).</p>
<p lang="eu">
<div id="attachment_516" style="width: 370px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/ig/files/2012/10/grafika_blog_ebal2.jpg"><img class="size-medium wp-image-516  " src="http://komunitatea.elhuyar.org/ig/files/2012/10/grafika_blog_ebal2.jpg" alt="" width="360" height="205" /></a><p class="wp-caption-text">6. irudia. Eraginkortasun onena berrogei kontsultetan; eLEZKARI elebakarra vs. hizkuntza arteko eLEZKARI</p></div>
<p lang="eu">Orokorrean, bilaketa elebakarrarekin emaitza hobeak lortzen diren arren, hizkuntza arteko bilaketa erabiliz kanpoko webguneetatik ere emaitza esanguratsuak itzultzen dira, gai bati buruzko informazio osagarria lortuz. Hortaz, bilaketa elebakarrarekin batera erabiltzen bada informazio aberatsagoa eskaintzen zaio erabiltzaile eleaniztunari. Horrez gain, bilaketa bakarrean hizkuntza desberdinetako informazioa jasoz, batetik, denbora aurrezten du erabiltzaileak, eta, bestetik, erosotasuna ere irabazten du.</p>
<p lang="eu">
<p lang="eu">Maddalen Lopez de Lacalle eta Xabier Saralegi.</p>
<p lang="eu">
<p lang="eu">
<p lang="eu"><strong>Bilbliografia</strong></p>
<p lang="eu">
<p lang="eu">[1] N. Gandal. 2006. Native Language and Internet Use. International Journal of the Sociology of Language, 182, 25 – 40.</p>
<p lang="eu">[2] Carolyn Y. Wei, Beth E. Kolko. 2005. Resistance to globalization: Language and Internet diffusion patterns in Uzbekistan. New Review of Hypermedia and Multimedia.                                                                               Vol. 11, Iss. 2, 2005</p>
<p lang="eu">[3] Vundavalli Srinivas Rao, and Vasudeva Varma. 2010. User Behavior in a Multilingual Information Access Task,, Indian Institute of Information Technology Allahabad, India. Report no: IIIT/TR/2010/30.</p>
<p lang="eu">[4] Tabouret-Keller, A. (2004). Bilingualism in Europe. In T. K. Bhatia &amp; W. C. Ritchie (Eds.), The handbook of bilingualism (pp. 662-688). Malden, MA: Blackwell Publishing.</p>
<p lang="eu">[5] Saralegi, X. and Lopez de Lacalle, M. 2009. &#8220;Comparing different approaches to treat Translation Ambiguity in CLIR: Structured Queries vs. Target Co-occurrence-Based Selection&#8221;. Proceedings of TIR 2009. Linz.</p>
<p lang="eu">[6] Saralegi, X. and Lopez de Lacalle, M. 2010. Estimating Translation Probabilities from the Web for Structured Queries on CLIR. ECIR 2010. Milton Keynes.</p>
<p lang="eu">[7] Saralegi, X. and Lopez de Lacalle, M. 2010. Dictionary and Monolingual Corpus-based Query Translation for Basque-English CLIR. LREC 2010. Malta.</p>
<p lang="eu">[8] Saralegi, X. 2012. Hiztegietan oinarritutako hizkuntza arteko dokumentuen berreskurapena. HAP masterra. UPV/EHU.</p>
<p lang="eu">[9] Ari Pirkola. 1998. The effects of query structure and dictionary setups in dictionary-based cross-language information retrieval. In Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (SIGIR &#8217;98). ACM, New York, NY, USA, 55-63.</p>
<p lang="eu">
<div class='footnotes' id='footnotes-482'>
<div class='footnotedivider'></div>
<ol>
<li id='fn-482-1'> http://w3techs.com/technologies/overview/content_language/all  <span class='footnotereverse'><a href='#fnref-482-1'>&#8617;</a></span></li>
<li id='fn-482-2'> http://www.vistawide.com/languages/top_30_languages.htm  <span class='footnotereverse'><a href='#fnref-482-2'>&#8617;</a></span></li>
<li id='fn-482-3'> Desadostasunak guk ebatzi ditugu.  <span class='footnotereverse'><a href='#fnref-482-3'>&#8617;</a></span></li>
</ol>
</div>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2012/10/22/elezkari-bilaketa-eleaniztunak-euskaratik-abiatuta/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>LREC 2012 kongresuaren kronika</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2012/08/02/lrec-2012-kongresuaren-kronika/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2012/08/02/lrec-2012-kongresuaren-kronika/#comments</comments>
		<pubDate>Thu, 02 Aug 2012 11:27:30 +0000</pubDate>
		<dc:creator><![CDATA[Elhuyar I+G]]></dc:creator>
				<category><![CDATA[Sailkatugabeak]]></category>
		<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[I+G]]></category>
		<category><![CDATA[LREC]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/?p=435</guid>
		<description><![CDATA[Maiatzaren 21etik 27ra, LREC 2012 biltzarraren 8. edizioa izan zen Istanbulen. Biltzar hori bi urtez behin egiten da, eta azken aldian garatutako tresna eta baliabideak ezagutzeko aukera ematen du. Gainera, hizkuntza-teknologien inguruan dauden Europako proiektuen berri izateko bilkura ezin hobea da. Elhuyar Fundazioko I+G unitateko ikertzaileak ere han izan gara, gure ikerketaren berri emanez. Aurtengoan [&#8230;]]]></description>
				<content:encoded><![CDATA[<p>Maiatzaren 21etik 27ra, <a href="http://www.lrec-conf.org/lrec2012/" target="_blank">LREC 2012</a> biltzarraren 8. edizioa izan zen Istanbulen. Biltzar hori bi urtez behin egiten da, eta azken aldian garatutako tresna eta baliabideak ezagutzeko aukera ematen du. Gainera, hizkuntza-teknologien inguruan dauden Europako proiektuen berri izateko bilkura ezin hobea da.</p>
<p><span id="more-435"></span></p>
<p>Elhuyar Fundazioko I+G unitateko ikertzaileak ere han izan gara, gure  ikerketaren berri emanez. Aurtengoan hiru proiekturen inguruko lanak  aurkeztu ditugu: <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/PaCo2" target="_blank">PaCo2</a>, <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Pibolex" target="_blank">Pibolex</a> eta <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Konbitz" target="_blank">Konbitz</a>.  Lehen eguneko lehen aurkezpena (sarrera-hitzaldiaren ostean) gurea izan  zen, corpus paraleloak Internetetik automatikoki biltzen dituen  PaCo2[1] tresnari buruzkoa. Urduritasunak alde batera utzita, jendeak  interes handia erakutsi zuen gure lanarekiko. Ostegunean ere (maiatzak  24) goizeko saioetako bat irekitzea tokatu zitzaigun, eta Pibolex[3]  proiektuaren barnean euskara-txinera hiztegiak sortzen egin dugun  ikerketa aurkeztu genuen. Elhuyarren azken aurkezpena ostegunean bertan  izan zen, bazkalosteko lehen saioan. Bertan, hitz anitzeko terminoen  konposizionaltasunaren inguruan egindako ikerketa plazaratu genuen:  Konbitz [3].</p>
<div id="attachment_448" style="width: 345px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/DSCF2690.jpg"><img class="size-medium wp-image-448 " src="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/DSCF2690-300x225.jpg" alt="PaCo2 aurkezten." width="335" height="225" /></a><p class="wp-caption-text">Iñaki San Vicente PaCo2 tresna aurkezten</p></div>
<p>Biltzarrean ikusitakoei dagokienez, nabarmentzekoa da proiektu  europarrek izan duten presentzia; lan asko aurkeztu ziren, proiektu  ezberdinen aterkipean garatutakoak. Aipagarriak dira gure jarduerarekin  bete-betean bat datozen bi proiektu: <a href="http://www.accurat-project.eu/">Accurat</a> eta <a href="http://www.ttc-project.eu/">TTC</a>.  Lehenengoak hizkuntza gutxituentzat corpus konparagarriak sortzea eta  terminologia erauztea du helburu; bigarrenak, berriz, corpus  konparagarrietatik terminologia erauztean jartzen du arreta. Corpus  konparagarrien sorreraren inguruan,<a href="http://www.lrec-conf.org/proceedings/lrec2012/pdf/626_Paper.pdf">Aker et al.</a>-ek <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Co3">Co3</a> tresnaren antzeko sistema bat aurkeztu zuten: dokumentuen tituluak  aztertzen dituzte eta titulu antzekoak dituzten dokumentuak bakarrik  onartzen dira corpusean.</p>
<div id="attachment_449" style="width: 310px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/IMAG0163_2.jpg"><img class="size-medium wp-image-449 " src="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/IMAG0163_2-300x200.jpg" alt="Konbitz aurkezten" width="300" height="200" /></a><p class="wp-caption-text">Antton Gurrutxaga Konbitz proiektua aurkezten.</p></div>
<p>Beti bezala, itzulpen automatikoak presentzia handia izan zuen, baina orokorrean itzulpen automatikoko sistemek behar dituzten baliabideei buruzko lanak aurkeztu ziren. Hori bai, itzulpen automatikoko sistemak helburu dituzten hainbat proiektu europar izan ziren ikusgai, konferentzia nagusian nahiz tailerretan. Adibidez: <a href="http://www.letsmt.eu/">Let&#8217;s MT</a>, <a href="http://www.presemt.eu/">PRESEMT</a>, edo <a href="http://www.eleka.net/" target="_blank">Elekak</a> parte hartzen duen <a href="http://www.bologna-translation.eu/">Bologna</a> izenekoa.</p>
<p>Iritzien erauzketak eta sentimenduen analisiak ere leku garrantzitsua izan zuten LRECen. Horren inguruan, poster nahiz ahozko aurkezpen-saio batzuk izan ziren 3 egunetan zehar. Hainbat polaritate lexiko aurkeztu ziren hizkuntza eta domeinu ezberdinetarako. Aipagarriena agian ostiral goizeko saioa izan zen (maiatzak 25). Bertan <a href="http://www.lrec-conf.org/proceedings/lrec2012/pdf/1081_Paper.pdf">Rada Mihalceak</a> gaztelaniazko sentimendu lexiko bat osatzeko prozesua erakutsi zuen, <a href="http://www.cs.pitt.edu/mpqa/opinionfinder_1.html">Opinion Finder</a>eko lexikoa <a href="http://sentiwordnet.isti.cnr.it/">SentiWordneten</a> begiratu eta gero kontzeptu hori <a href="http://wordnet.princeton.edu/">WordNet</a>en (WN) bidez helburu-hizkuntzara itzulita. Saio berean, emaitza interesgarriak erakutsi zituen <a href="http://www.lrec-conf.org/proceedings/lrec2012/pdf/1018_Paper.pdf">Isa Maks</a>ek, corpusetatik subjektibitate lexikoak sortzeko teknikei dagokienez.</p>
<p>LREC baliabideen inguruko biltzarra izanik, ontologiek ere izan zuten bere lekua. Ontologiak aberasteko lanak aurkeztu ziren, WN edo bestelako ezagutza-base lexikaletan oinarrituak, testuetatik lortutako ezagutza berria erabiltzean baino gehiago. Interesgarriak izan ziren <a href="http://www.lrec-conf.org/proceedings/lrec2012/authors.html#Sagot_Benoit">Benoît Sagot</a> aurkeztutako lanak, WN aberasteko eta automatikoki sortutako ontologietako akatsak garbitzeko. Ildo horretan <a href="http://ixa.si.ehu.es/Ixa" target="_blank">IXA</a> taldeko <a href="http://www.lrec-conf.org/proceedings/lrec2012/pdf/319_Paper.pdf">Aitor Gonzalez</a>ek <a href="http://wndomains.fbk.eu/" target="_blank">WordNet Domains</a>eko kategoriak baliatuz <a href="http://adimen.si.ehu.es/web/MCR/" target="_blank">MCRn</a> domeinu informazioa txertatzeko metodoa aurkeztu zuen, ezadostasunak eta akatsak identifikatuz.</p>
<p>Larunbatean, biltzar nagusia amaituta, bi tailerretan parte hartu genuen. Lehena corpus konparagarrien inguruko 5<sup>th</sup> <a href="http://hnk.ffzg.hr/5bucc2012/" target="_blank">BUCC</a> tailerra izan zen (<em>“The Fifth Workshop on Building and Using Comparable Corpora”)</em>. Terminologia-erauzketaren inguruan lan asko aurkeztu ziren, bai aurkezpenetan eta baita poster-saioan ere. Arreta berezia eskaini zitzaion hitz anitzeko terminoak itzultzeari, horren erakusgarri Ljubešić, Kaji, Yapomo edo Ştefănescuren lanak. Bigarrena <a href="http://www.nactem.ac.uk/biotxtm2012/" target="_blank">BioTxtM</a> 2012 izan zen (<em>“The Third Workshop on Building and Evaluating Resources for Biomedical Text Mining”</em>). Biomedikuntzaren arloko datu-meatzaritzak garrantzi handia hartu du azken urteotan. Hizlari gonbidatutzat Jun&#8217;ichi Tsujii izan genuen (Microsoft Research Asia), arlo honetako <a href="http://www.nactem.ac.uk/genia/genia-corpus" target="_blank">GENIA</a> corpusaren anotazio linguistiko eta semantikoa aurkeztu zuena. Aurkeztutako gainerako lan gehienen ikergaiak izan ziren “gertakarien” erauzketa eta etiketatzea (<em>event extraction and annotation</em>), eta arlo honetako corpus-baliabideak sortzeko eta etiketatzeko metodologiak.</p>
<p style="text-align: center;">
<div id="attachment_454" style="width: 275px" class="wp-caption aligncenter"><a href="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/IMAG0246_moztua.jpg"><img class="size-medium wp-image-454 " src="http://komunitatea.elhuyar.org/hizkuntza/files/2012/08/IMAG0246_moztua-300x129.jpg" alt="Mezkita urdina, Istanbul." width="265" height="113" /></a><p class="wp-caption-text">Mezkita urdina</p></div>
<p>Honaino gure kronika. Beste hainbat gauza interesgarri ere ikusi genituen, laburpen honetatik kanpo geratu direnak. Informazio gehiago eskuratu nahi izanez gero, helbide honetan dituzue kongresuko artikulu guztiak:</p>
<p><a href="http://www.lrec-conf.org/proceedings/lrec2012/index.html" target="_blank">http://www.lrec-conf.org/proceedings/lrec2012/index.html</a></p>
<p>Iñaki San Vicente eta Antton Gurrutxaga.</p>
<h3>Erreferentziak</h3>
<p>[1] I. San Vicente, I. Manterola. 2012.<a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/informazioa/corpus-tresnak/PaCo2_LREC2012.pdf" target="_blank">&#8220;PaCo2: A Fully Automated tool for gathering Parallel Corpora from the Web&#8221;</a>.<em> In Proceedings of the 8th international conference on Language Resources and Evaluation, LREC&#8217;12</em>. 23-25 May, Istanbul, Turkia.</p>
<p>[2] X. Saralegi, I. Manterola, I. San Vicente. 2012.<a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/informazioa/Lexiko-terminologia-erauzketa/Pibolex_LREC2012.pdf" target="_blank">&#8220;Building a Basque-Chinese Dictionary by using English as a Pivot&#8221;</a>.<em> In Proceedings of the 8th international conference on Language Resources and Evaluation, LREC&#8217;12</em>. 23-25 May, Istanbul, Turkia.</p>
<p>[3] A. Gurrutxaga and I. Alegria. 2012. <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/informazioa/Lexiko-terminologia-erauzketa/Konbhitz_LREC2012.pdf" target="_blank">“Measuring the compositionality of NV expressions in Basque by means of distributional similarity techniques”</a><em>. In Proceedings of the Eight International Conference on Language Resources and Evaluation LREC’12</em>. 23-25 May, Istanbul, Turkia.</p>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2012/08/02/lrec-2012-kongresuaren-kronika/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ECIR 2012 biltzarraren kronika</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2012/06/26/ecir-2012-biltzarraren-kronika/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2012/06/26/ecir-2012-biltzarraren-kronika/#comments</comments>
		<pubDate>Tue, 26 Jun 2012 10:54:25 +0000</pubDate>
		<dc:creator><![CDATA[Elhuyar I+G]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[ECIR]]></category>
		<category><![CDATA[I+G]]></category>
		<category><![CDATA[I+G+B]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/?p=424</guid>
		<description><![CDATA[ECIRen aurtengo edizioa apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR Informazioen Berreskurapenaren (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere Elhuyar I+G taldea bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak [&#8230;]]]></description>
				<content:encoded><![CDATA[<p><!-- 		@page { margin: 2cm } 		P { margin-bottom: 0.21cm } 		A:link { so-language: zxx } --></p>
<p style="margin-bottom: 0cm"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> ECIRen aurtengo </span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/">edizioa</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR </span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Information_retrieval">Informazioen Berreskurapenaren</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere </span></span></span></span></span></span></span><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-unitatea">Elhuyar I+G taldea</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak egitea izan dugu helburu.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
<span id="more-424"></span> </span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">Biltzarraren saio nagusiak hiru egun hartu ditu, IRko gaur egungo ikergai nagusiak jasotzeko. Saio nagusiari Università degli Studi di Milano-ko </span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/invited_speakers.html">Paolo Boldiren</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> keynote-ak eman zion hasiera. Loturen azterketa (</span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Link_analysis"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">Link analysis</span></span></em></span></span></span></span></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">) egiteko algoritmoei buruz hitz egin zigun. Algoritmo-mota horiek pil-pilean daude IRaren munduan. Google, adibidez, bilaketen emaitzak ordenatzeko erabiltzen hasi zen. Boldik argi utzi nahi zuen Googlekoak ez zirela algoritmo-mota horien asmatzaileak, soziologian lehenagotik erabiltzen ari zirelako. Yahoo! Research-eko </span></span></span></span></span></span></span><a href="http://research.yahoo.com/Amit_Kagian">Amit Kagianek</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> kontsulta transakzionalak lantzeko metodo bat aurkeztu zuen. Metodoak interfazeak automatikoki sortzen ditu, erabiltzaileak transakzioa (adibidez, hegaldi baten erreserba) errazago egin dezan.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"> </span></span></p>
<p>L<span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">an batzuek mezu elektronikoen bilaketen gaiari heldu zioten. </span></span></span></span></span></span></span><a href="http://flavors.me/delsweil">David Elsweiler</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">-k adierazi zuen bezala, oraindik ez da existitzen posta elektronikoa baino sare sozial handiagorik. </span></span></span></span></span></span></span><a href="https://twitter.com/">Twitter</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> baliabide moduan erabiltzen zituzten lanak ere aurkeztu ziren. Adibidez, </span></span></span></span></span></span></span><a href="http://morgan.salutonline.com/index.html">Morgan Harvey</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">-k URLak dituzten tuitetatik gako-hitzak erauzteko metodo bat azaldu zigun, </span></span></span></span></span></span></span><a href="http://delicious.com/" target="_self"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: Liberation Serif,serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">Delicious</span></span></span></span></span></span></span></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"><a href="http://delicious.com/" target="_self">-ekoen</a> modukoak.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"> </span></span></span></p>
<div id="attachment_425" style="width: 410px" class="wp-caption aligncenter"><img class="size-medium wp-image-425  " title="ECIR2012" src="http://komunitatea.elhuyar.org/hizkuntza/files/2012/06/ECIR2012-300x225.jpg" alt="Stephen E. Robertson-en aurkezpena" width="400" height="300" /><p class="wp-caption-text">Stephen E. Robertson-en aurkezpena</p></div>
<p><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">Beste egile batzuek erantzunak ordenatzeko algoritmo berriak edo hobekuntzak proposatu zituzten. Hao Wu-k, adibidez, </span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">tf-idf</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> estatistikoa kalkulatzeko “</span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">and</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">” erlazioa kontuan hartzen duen aldaera bat proposatu zuen. Oso interesgarria iruditu zitzaigun -Elhuyarrek estrategikotzat duen </span></span></span></span></span></span></span><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Informazioaren-berreskurapena-eta-erauzketa-%28IR-IE%29">CLIR</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> ikerketa-ildoan kokatzen baita- Bo Li-k aurkeztutako bilaketak prozesatzeko hizkuntzen arteko eredu berria. Bestetik, </span></span></span></span></span></span></span><a href="http://www.soi.city.ac.uk/%7Eser/">Stephen E. Robertson</a><a href="http://www.soi.city.ac.uk/%7Eser/">-</a><a href="http://www.soi.city.ac.uk/%7Eser/">ek</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> (</span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Okapi_BM25">BM25</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> eredu arrakastatsuaren asmatzailea) IR sistemak ebaluatzeko </span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Information_retrieval#Mean_average_precision">MAP</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> metrika klasikoaren aldaera sendoago bat aurkeztu zuen. </span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
</span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">Aplikazioen atalean, aipatzekoak dira Claudio Lucchesek aurkeztutako ibilbide turistikoak automatikoki sortzen dituen sistema, eta </span></span></span></span></span></span></span><a href="http://times.cs.uiuc.edu/%7Esondhi1/">Parikshit Sondhi-k</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> azaldu zigun medikuntzako informazio sinesgarria eskaintzen duten webguneak automatikoki detektatzeko aplikazioa.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
Azkenik, </span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">industriaren eta ikertzaileen interesak uztartzen dituen saioan (</span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/industryday.html"><em>Industry day</em></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent"> izenekoa) nabarmena zen -eta, era berean, adierazgarria- </span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">social media</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: none repeat scroll 0% 0% transparent">-z baliatzen diren iritziak erauzteko sistemen presentzia. Gavagai, AOL, Oxyme, Websays enpresek berek garatutako sistemei buruz hitz egin zuten.</span></span></span></span></span></span></span></p>
<p style="margin-bottom: 0cm">
<p style="margin-bottom: 0cm">Xabier Saralegi.</p>
<div id="_mcePaste" style="width: 1px;height: 1px;overflow: hidden"><!-- 		@page { margin: 2cm } 		P { margin-bottom: 0.21cm } 		A:link { so-language: zxx } --></p>
<p style="margin-bottom: 0cm"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> ECIRen aurtengo </span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/">edizioa</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> apirilaren hasieran egin da Bartzelonako Pompeu Fabra Unibertsitatean. ECIR </span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Information_retrieval">Informazioen Berreskurapenaren</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> (IR) inguruko ikerketen emaitzak aurkezteko Europako biltzarrik garrantzitsuena da. Hortaz, urtean egindako lan esanguratsuen berri izateko foro ezin hobea dugu. Azkeneko urteetan bezala, aurten ere </span></span></span></span></span></span></span><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-unitatea">Elhuyar I+G taldea</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> bertan izan da. Oraingoan ez dugu ezer aurkeztu: ideia berriak hartu eta harremanak egitea izan dugu helburu.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
</span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">Biltzarraren saio nagusiak hiru egun hartu ditu, IRko gaur egungo ikergai nagusiak jasotzeko. Saio nagusiari Università degli Studi di Milano-ko </span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/invited_speakers.html">Paolo Boldiren</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> keynote-ak eman zion hasiera. Loturen azterketa (</span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Link_analysis"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: transparent">Link analysis</span></span></em></span></span></span></span></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">) egiteko algoritmoei buruz hitz egin zigun. Algoritmo-mota horiek pil-pilean daude IRaren munduan. Google, adibidez, bilaketen emaitzak ordenatzeko erabiltzen hasi zen. Boldik argi utzi nahi zuen Googlekoak ez zirela algoritmo-mota horien asmatzaileak, soziologian lehenagotik erabiltzen ari zirelako. Yahoo! Research-eko </span></span></span></span></span></span></span><a href="http://research.yahoo.com/Amit_Kagian">Amit Kagianek</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> kontsulta transakzionalak lantzeko metodo bat aurkeztu zuen. Metodoak interfazeak automatikoki sortzen ditu, erabiltzaileak transakzioa (adibidez, hegaldi baten erreserba) errazago egin dezan.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
L</span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">an batzuek mezu elektronikoen bilaketen gaiari heldu zioten. </span></span></span></span></span></span></span><a href="http://flavors.me/delsweil">David Elsweiler</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">-k adierazi zuen bezala, oraindik ez da existitzen posta elektronikoa baino sare sozial handiagorik. </span></span></span></span></span></span></span><a href="https://twitter.com/">Twitter</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> baliabide moduan erabiltzen zituzten lanak ere aurkeztu ziren. Adibidez, </span></span></span></span></span></span></span><a href="http://morgan.salutonline.com/index.html">Morgan Harvey</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">-k URLak dituzten tuitetatik gako-hitzak erauzteko metodo bat azaldu zigun, </span></span></span></span></span></span></span><a href="http://delicious.com/"><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: Liberation Serif,serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">Delicious</span></span></span></span></span></span></span></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"><a href="http://delicious.com/">-ekoen</a> modukoak.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
</span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">Beste egile batzuek erantzunak ordenatzeko algoritmo berriak edo hobekuntzak proposatu zituzten. Hao Wu-k, adibidez, </span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: transparent">tf-idf</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> estatistikoa kalkulatzeko “</span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: transparent">and</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">” erlazioa kontuan hartzen duen aldaera bat proposatu zuen. Oso interesgarria iruditu zitzaigun -Elhuyarrek estrategikotzat duen </span></span></span></span></span></span></span><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Informazioaren-berreskurapena-eta-erauzketa-%28IR-IE%29">CLIR</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> ikerketa-ildoan kokatzen baita- Bo Li-k aurkeztutako bilaketak prozesatzeko hizkuntzen arteko eredu berria. Bestetik, </span></span></span></span></span></span></span><a href="http://www.soi.city.ac.uk/%7Eser/">Robertson</a><a href="http://www.soi.city.ac.uk/%7Eser/">-</a><a href="http://www.soi.city.ac.uk/%7Eser/">ek</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> (</span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Okapi_BM25">BM25</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> eredu arrakastatsuaren asmatzailea) IR sistemak ebaluatzeko </span></span></span></span></span></span></span><a href="http://en.wikipedia.org/wiki/Information_retrieval#Mean_average_precision">MAP</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> metrika klasikoaren aldaera sendoago bat aurkeztu zuen. </span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
</span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">Aplikazioen atalean, aipatzekoak dira Claudio Lucchesek aurkeztutako ibilbide turistikoak automatikoki sortzen dituen sistema, eta </span></span></span></span></span></span></span><a href="http://times.cs.uiuc.edu/%7Esondhi1/">Parikshit Sondhi-k</a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> azaldu zigun medikuntzako informazio sinesgarria eskaintzen duten webguneak automatikoki detektatzeko aplikazioa.</span></span></span></span></span></span></span><span style="color: #000000"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><br />
Azkenik, </span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">industriaren eta ikertzaileen interesak uztartzen dituen saioan (</span></span></span></span></span></span></span><a href="http://ecir2012.upf.edu/industryday.html"><em>Industry day</em></a><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent"> izenekoa) nabarmena zen -eta, era berean, adierazgarria- </span></span></span></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><em><span style="font-weight: normal"><span style="background: transparent">social media</span></span></em></span></span></span></span><span style="color: #000000"><span style="text-decoration: none"><span style="font-family: ARial,sans-serif"><span style="font-size: x-small"><span style="font-style: normal"><span style="font-weight: normal"><span style="background: transparent">-z baliatzen diren iritziak erauzteko sistemen presentzia. Gavagai, AOL, Oxyme, Websays enpresek berek garatutako sistemei buruz hitz egin zuten.</span></span></span></span></span></span></span></p>
<p style="margin-bottom: 0cm">
</div>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2012/06/26/ecir-2012-biltzarraren-kronika/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
