<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Ber2a &#187; Terminologia</title>
	<atom:link href="http://komunitatea.elhuyar.eus/hizkuntza/category/terminologia/feed/" rel="self" type="application/rss+xml" />
	<link>http://komunitatea.elhuyar.eus/hizkuntza</link>
	<description>Elhuyar Hizkuntza Zerbitzuen bloga</description>
	<lastBuildDate>Tue, 10 Nov 2020 05:22:12 +0000</lastBuildDate>
	<language>eu</language>
		<sy:updatePeriod>hourly</sy:updatePeriod>
		<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.8.1</generator>
	<item>
		<title>Pibolex: hiztegi elebidunak pibote-tekniken bitartez sortzen</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2011/11/02/pibolex-hiztegi-elebidunak-pibote-tekniken-bitartez-sortzen/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2011/11/02/pibolex-hiztegi-elebidunak-pibote-tekniken-bitartez-sortzen/#comments</comments>
		<pubDate>Wed, 02 Nov 2011 10:32:49 +0000</pubDate>
		<dc:creator><![CDATA[Elhuyar I+G]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[Hiztegigintza]]></category>
		<category><![CDATA[Terminologia]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/?p=325</guid>
		<description><![CDATA[XXI. mendeko gizarte eleanitz honetan, hiztegi eleanitzak baliabide garrantzitsuak dira hainbat esparrutan: irakaskuntzan, hiztegigintzan, itzulpengintzan, eta, oro har, hizkuntza-teknologiak oinarri dituzten aplikazio informatiko guztietan. Zoritxarrez, hizkuntza-bikote askotarako hiztegirik ez dago. Hizkuntza txikiek hizkuntza nagusi baterako hiztegi elebiduna besterik ez dute izaten, eta maiz ezta hori ere. Hiztegi falta hori oztopo handia da hizkuntza bateko baliabideak [&#8230;]]]></description>
				<content:encoded><![CDATA[<p><!-- 		@page { margin: 2cm } 		P { margin-bottom: 0.21cm } 		A:link { so-language: zxx } --><span lang="eu">XXI. mendeko gizarte eleanitz honetan, hiztegi eleanitzak baliabide garrantzitsuak dira hainbat esparrutan: irakaskuntzan, hiztegigintzan, itzulpengintzan, eta, oro har, hizkuntza-teknologiak oinarri dituzten aplikazio informatiko guztietan. Zoritxarrez, hizkuntza-bikote askotarako hiztegirik ez dago. Hizkuntza txikiek hizkuntza nagusi baterako hiztegi elebiduna besterik ez dute izaten, eta maiz ezta hori ere. Hiztegi falta hori oztopo handia da hizkuntza bateko baliabideak garatzeko. Gure proiektuaren helburua da baliabide-urritasun horri aurre egiteko aukerak ahalbidetzea, eta, horretarako, hiztegi elebidunak modu automatikoan sortzeko teknikak ikertzen dihardugu.<span id="more-325"></span></span><span lang="eu"> </span></p>
<p>Pibotaje bidezko teknikak baliagarriak dira hiztegi elebidunak azkar eta modu automatikoan sortzeko. Teknika honetan, A-B eta B-C hizkuntzetan dauden hiztegiak elkartzen dira A-C hiztegi berri bat sortzeko, B hizkuntza zubi edo pibote gisa erabiliz. B hizkuntza hori hizkuntza handi bat izan ohi da (baliabide askokoa), adibidez, <span lang="eu"><em>euskara-ingelesa + ingelesa-alemana = euskara-alemana</em></span><span lang="eu">. Tamalez, elkarketa hori egiteko prozesua ez da oztoporik gabea, zubi hizkuntza bat erabiltzeak itzulpen okerrak ere sortzen baititu, itzulpen-baliokideen adierak beti ez direlako berdinak hizkuntzen artean (ikus adibidean ‘hegazkin’ eta ‘plano’ ). “Zarata” hori kuantifikatu dugu, eta oso handia da (%80); beraz, ezinbestekoa da garbiketa burutzea.</span></p>
<p style="text-indent: 1.27cm; margin-bottom: 0cm; line-height: 115%;" lang="eu">
<p style="text-indent: 1.27cm; margin-bottom: 0cm; line-height: 115%;" lang="eu">
<p style="margin-bottom: 0cm; text-align: center;"><span lang="eu"> </span></p>
<table>
<tbody>
<tr>
<td></td>
<td>
<p><div id="attachment_337" style="width: 391px" class="wp-caption alignnone"><img class="size-full wp-image-337 " title="PibotajeAdib" src="http://komunitatea.elhuyar.org/hizkuntza/files/2011/10/PibotajeAdib.png" alt="1. Irudia: Pibotaje adibidea" width="381" height="118" /><p class="wp-caption-text">1. Irudia: Pibotajearen adibidea.</p></div></td>
<td></td>
</tr>
</tbody>
</table>
<p><span lang="eu"><br />
Literaturan, zarata hori garbitzeko teknika ugari proposatu dira. Lan honetan, hizkuntza txikietarako hoberen moldatzen direnak aztertu ditugu. Horiek aukeratzeko irizpidea baliabideen eskuragarritasuna izan da, hori baita hizkuntza txikien arazo nagusia. Halaber, osagarritasun-maila ere kontuan hartu da. Zentzu horretan, aukeratutako bi metodoak paradigma ezberdinetan oinarritzen direnez, osagarriak dira teorian.</span><span lang="en-GB"><strong> </strong></span></p>
<div id="attachment_338" style="width: 280px" class="wp-caption alignright"><img class="size-medium wp-image-338 " title="ICAdib" src="http://komunitatea.elhuyar.org/hizkuntza/files/2011/11/ICAdib-300x93.png" alt="ICAdib" width="270" height="84" /><p class="wp-caption-text">2. Irudia: IC Metodoaren adibidea</p></div>
<p><strong>Inverse Consultation (IC): </strong><span lang="eu">Itzulpen okerren kimaketa hiztegien egituran oinarritzen da. Kalkulatzen da zenbat bide dauden elkartutako hiztegietan jatorrizko hitzetik itzulpen-hautagaietara. Zenbat eta handiagoa bide-ko</span><span lang="eu"> </span><span lang="eu">purua, orduan eta handiagoa baliokide zuzenak izateko probabilitatea (Adib.: hegazkin-avión 3 bide; aldiz, hegazkin-cepillo eta hegazkin-plano bide bat).</span><span lang="eu"><strong> </strong></span></p>
<p><strong> </strong></p>
<p><strong>Distributional Similarity (DS):</strong><span lang="eu"> Jatorrizko hitzaren esanahia ez bezalakoa duten itzulpen-hautagaiak kimatzen dira. DSren atzean dagoen ideia hau da: esanahi bera duten hitzak testuinguru oso antzekoetan agertuko dira. Beraz, hitzen testuinguruak konparatzen ditugu, eta zuzenak diren hitz-bikoteen testuinguruek antzekotasun handiena erakutsiko dute.</span></p>
<p><span lang="eu">Hasieran aipatu den bezala, hiztegiak hainbat eremutan erabil daitezke (adibidez, irakaskuntza, hiztegigintza&#8230;). Hori dela eta, agertoki bakoitzak ezaugarri jakinetako hiztegiak eskatuko ditu. Lan honetan, metodoen eraginkortasuna hiru agertoki orokorren arabera neurtu da:</span></p>
<ul>
<li>
<p style="margin-bottom: 0cm;"><em><span lang="eu">A agertokia: doitasun handiko hiztegi txikiak 	sortzeko</span></em></p>
</li>
<li>
<p style="margin-bottom: 0cm;"><em><span lang="eu">B agertokia: estaldura handiko hiztegiak sortzeko</span></em></p>
</li>
<li>
<p style="margin-bottom: 0cm;"><em><span lang="eu">D agertokia: lexiko erabiliena jasotzen duen 	hiztegiak sortzeko</span></em></p>
</li>
</ul>
<p style="margin-bottom: 0cm;" lang="eu">
<p style="margin-bottom: 0cm;"><span lang="eu">Esperimentuetan ikusi dugu IC metodoak zarata ondo garbitzen duela, baina, aldi berean, oso zorrotza dela. Hori dela eta, bikote zuzen asko baztertzen ditu. DSk, aldiz, ez du hain ondo garbitzen zarata, baina oso bikote zuzen gutxi baztertzen ditu. Horrez gain, DSk hobeto tratatzen ditu erabilera handiko hitzak. Bi metodoak konbinatzen direnean, emaitzak %10 hobetzen dira, batez beste, agertoki guztietan.</span></p>
<table>
<tbody>
<tr>
<td></td>
<td>
<p><div id="attachment_378" style="width: 310px" class="wp-caption alignnone"><img class="size-medium wp-image-378" title="Agertokiak" src="http://komunitatea.elhuyar.org/hizkuntza/files/2011/11/Agertokiak-300x268.png" alt="3. Irudia: Agertoki ezberdinak" width="300" height="268" /><p class="wp-caption-text">3. Irudia: Metodoen eraginkortasuna zenbait agertokitan</p></div></td>
<td></td>
</tr>
</tbody>
</table>
<p style="margin-bottom: 0cm;" lang="eu">
<p style="margin-bottom: 0cm;" lang="eu">
<p><span lang="eu">Gure esperimentuetan sortutako Euskara-Gaztelania hiztegiaz gain, Euskara-Alemana (22.861 sarrera, 97.739 bikote) eta Euskara-Txinera (10.124 sarrera, 144.824 bikote) hiztegiak ere sortu ditugu modu automatikoan, ingelesa zubi moduan hartuz. Hona hemen hiztegi horietako itzulpenen adibide batzuk:</span></p>
<p style="margin-bottom: 0cm;" lang="eu">
<p style="margin-bottom: 0cm;"><span lang="eu"> </span></p>
<p style="margin-bottom: 0cm;"><span lang="eu"> </span></p>
<div style="width: 100%; margin: 0pt; padding: 0pt; border: medium none;">
<div style="float: left; width: 50%;">
<table style="border: 1pt solid #000000; height: 198px;" border="0" cellspacing="0" cellpadding="7" width="203">
<colgroup>
<col width="145"></col>
</colgroup>
<tbody>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">anbiguo -&gt; </span><span style="font-family: DejaVu Sans;">暧昧</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">kai -&gt; </span><span style="font-family: DejaVu Sans;">港</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">zail -&gt; </span><span style="font-family: DejaVu Sans;">别扭</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">moneta -&gt; </span><span style="font-family: DejaVu Sans;">货币</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">erosi -&gt; </span><span style="font-family: DejaVu Sans;">买</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">krisi -&gt; </span><span style="font-family: DejaVu Sans;">危机</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">abesti -&gt; </span><span style="font-family: DejaVu Sans;">歌</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0; text-align: center;" width="145" valign="TOP"><span lang="eu">ito -&gt; </span><span style="font-family: DejaVu Sans;">淹死</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">janari -&gt; </span><span style="font-family: DejaVu Sans;">粮</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="145" valign="TOP"><span lang="eu">jostatu -&gt; </span><span style="font-family: DejaVu Sans;">戏</span></td>
</tr>
</tbody>
</table>
<p style="margin-bottom: 0cm;" lang="eu">1. taula:  Euskara-Txinera hiztegiko adibideak.</p>
</div>
<div style="float: right; width: 50%;">
<table style="border: 1pt solid #000000; height: 198px;" border="0" cellspacing="0" cellpadding="7" width="233">
<colgroup>
<col width="246"></col>
</colgroup>
<tbody>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">dantza -&gt; Tanz</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">atso -&gt; Weib</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">boligrafo -&gt; Kuli</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">burusoil -&gt; kahl</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">bigun -&gt; sanft</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">esaldi -&gt; Satz</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">dekretatu -&gt; dekretieren</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">biderkatu -&gt; malnehmen</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">heterosexual -&gt; Heterosexuelle</span></td>
</tr>
<tr>
<td style="border: 0.00pt solid #000000; padding: 0cm; text-align: center;" width="246" valign="TOP"><span lang="eu">erizain -&gt; Krankenschwester</span></td>
</tr>
</tbody>
</table>
<p style="margin-bottom: 0cm;" lang="eu">2. taula:  Euskara-Alemana hiztegiko adibideak.</p>
</div>
</div>
<p><span lang="eu"> </span></p>
<p><span lang="eu">EMNLP kongresuan argitaratutako artikulu zientifikoan topatu daiteke egindako esperimentuen eta lortutako emaitzen inguruko informazio gehiago: </span><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/informazioa/Lexiko-terminologia-erauzketa/Pibolex_EMNLP2011.pdf"><span lang="eu"><em>“Analizing Methods for Improving Precision of Pivot Based Bilingual Dictionaries”</em></span></a><span lang="eu">.</span></p>
<p><span lang="eu"> </span></p>
<p style="margin-bottom: 0cm;"><span lang="eu">Halaber, Pibolex proiektuaren barnean Euskara-Txinera bikotearekin egindako lanak eta sortutako hiztegiak gizarteratzeko asmoz, artikulu bat aurkeztu da 2012. urteko LREC kongresura.</span></p>
<p style="margin-bottom: 0cm;" lang="eu">
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2011/11/02/pibolex-hiztegi-elebidunak-pibote-tekniken-bitartez-sortzen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ItzulTerm, itzulpen-memoriei etekina ateratzeko doako web-zerbitzua jarri dugu sarean</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2009/11/23/itzulterm-itzulpen-memoriei-etekina-ateratzeko-doako-web-zerbitzua-jarri-dugu-sarean/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2009/11/23/itzulterm-itzulpen-memoriei-etekina-ateratzeko-doako-web-zerbitzua-jarri-dugu-sarean/#comments</comments>
		<pubDate>Mon, 23 Nov 2009 20:14:03 +0000</pubDate>
		<dc:creator><![CDATA[Josu Aztiria Urtaran - Elhuyar Hizkuntza eta Teknologia]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[Hiztegigintza]]></category>
		<category><![CDATA[Terminologia]]></category>
		<category><![CDATA[itzulterm]]></category>
		<category><![CDATA[terminologia-erauzketa]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/?p=176</guid>
		<description><![CDATA[ItzulTerm web-zerbitzua sareratu berri dugu, itzulpen-memoria batetik euskarazko eta gaztelerazko termino baliokideen bikoteak automatikoki erauzten dituen doako zerbitzua. Itzulpen-memoriekin lan egiten duten erabiltzaileengan dago, batik bat, pentsatua: itzultzaileak, itzulpen-zerbitzuak, terminologoak, hizkuntzalariak, euskara-teknikariak&#8230; Erabiltzaileak bidalitako itzulpen-memoriatik termino baliokideen bikoteak automatikoki erauzten dituen doako zerbitzua da ItzulTerm. Erabiltzaileak erauzketaren emaitzak lantzeko aukera du gainera, eta nahi dituen [&#8230;]]]></description>
				<content:encoded><![CDATA[<p>ItzulTerm web-zerbitzua sareratu berri dugu, itzulpen-memoria batetik euskarazko eta gaztelerazko termino baliokideen bikoteak automatikoki erauzten dituen doako zerbitzua. Itzulpen-memoriekin lan egiten duten erabiltzaileengan dago, batik bat, pentsatua: itzultzaileak, itzulpen-zerbitzuak, terminologoak, hizkuntzalariak, euskara-teknikariak&#8230;</p>
<p style="text-align: center"><a href="http://komunitatea.elhuyar.org/hizkuntza/files/2009/11/765_medium_itzulterm-pantaila.jpg"><img class="aligncenter size-full wp-image-180" title="765_medium_itzulterm-pantaila" src="http://komunitatea.elhuyar.org/hizkuntza/files/2009/11/765_medium_itzulterm-pantaila.jpg" alt="765_medium_itzulterm-pantaila" width="455" height="241" /></a></p>
<p><span id="more-176"></span><br />
Erabiltzaileak bidalitako itzulpen-memoriatik termino baliokideen bikoteak automatikoki erauzten dituen doako zerbitzua da <a href="http://itzulterm.elhuyar.org/" target="_blank">ItzulTerm</a>. Erabiltzaileak erauzketaren emaitzak lantzeko aukera du gainera, eta nahi dituen termino-bikoteak eskuratu ditzake hainbat erabileratarako: hiztegiak sortu, itzulpen-memorien sistema hobetu, itzulpen automatikoan erabili&#8230; Gainera, erauzketa automatikoaren emaitza hobetzeko eta emaitza lantzeko edizio-aukerak ere eskaintzen ditu zerbitzuak. ItzulTerm zerbitzuaren oinarrian, <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-B-unitatea" target="_blank">Elhuyar Fundazioaren I+G+B unitateak</a> garatutako <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/ElexBI" target="_blank">ELexBI</a> tresna dago. ELexBI tresnak teknika linguistikoak eta estatistikoak konbinatzen ditu termino-bikoteak automatikoki erauzteko prozesuan.</p>
<p><strong>Zerbitzuaren urrats nagusiak<br />
</strong><br />
ItzulTerm-en bitartez, erabiltzaileak bere itzulpen-memoriei etekina ateratzeko aukera izango du, hiru urratsetan: ‘Erauzketa automatikoa’, ‘Eskuzko lanketa’ eta ‘Esportazioa’. ItzulTerm-ek termino-bikoteak teknika linguistikoen eta estatistikoen bidez automatikoki erauztean datza ‘Erauzketa automatikoa’. ‘Eskuzko lanketa’n, aldiz, ItzulTerm-ek bere proposamenak lantzeko aukera eskaintzen du: baliozkotzat jotzeko edo baztertzeko, emaitzak editatzeko aukera aurreratuak&#8230; Azkenik, ‘Esportazioa’n, erabiltzaileak baliozkotzat jo dituen termino-bikoteak deskarga ditzake, neurrira egindako hiztegi elebidun bat osatzeko.</p>
<p>ItzulTerm proiektuak Eusko Jaurlaritzako Kultura Sailaren diru-laguntza jaso du 2007ko IKT deialdiaren barruan.</p>
<p>ItzulTerm tresna honako webgunean dago eskuragarri: <a href="http://itzulterm.elhuyar.org/" target="_blank">http://itzulterm.elhuyar.org</a></p>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2009/11/23/itzulterm-itzulpen-memoriei-etekina-ateratzeko-doako-web-zerbitzua-jarri-dugu-sarean/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Elhuyar Zientzia eta Teknologiaren Hiztegi Entziklopedikoa, kalean</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2009/10/28/elhuyar-zientzia-eta-teknologiaren-hiztegi-entziklopedikoa-kalean/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2009/10/28/elhuyar-zientzia-eta-teknologiaren-hiztegi-entziklopedikoa-kalean/#comments</comments>
		<pubDate>Wed, 28 Oct 2009 15:30:19 +0000</pubDate>
		<dc:creator><![CDATA[hizkuntza]]></dc:creator>
				<category><![CDATA[Hizkuntza-zerbitzuak]]></category>
		<category><![CDATA[Hiztegigintza]]></category>
		<category><![CDATA[Terminologia]]></category>
		<category><![CDATA[entziklopedia]]></category>
		<category><![CDATA[teknologia]]></category>
		<category><![CDATA[zientzia]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/2009/10/28/elhuyar-zientzia-eta-teknologiaren-hiztegi-entziklopedikoa-kalean/</guid>
		<description><![CDATA[Elhuyar zientzia eta teknologiaren hiztegi entziklopedikoa kalean da. Urte luzez aritu dira lanean Euskal Herriko 200 aditu baino gehiago proiektu honetan, Antton Gurrutxagaren zuzendaritzapean. Elhuyar Fundazioak eta Euskal Herriko Unibertsitateak elkarrekin argitaratu dugu, Euskadiko Kutxaren babesari esker, eta une honetan merkatuan dagoen mota honetako hiztegi bakarra da. Bihar, osteguna,  aurkezpen-ekitaldia izango da Chillida-Leku museoan. Hiztegi [&#8230;]]]></description>
				<content:encoded><![CDATA[<p>Elhuyar zientzia eta teknologiaren hiztegi entziklopedikoa kalean da. Urte luzez aritu dira lanean Euskal Herriko 200 aditu baino gehiago proiektu honetan, Antton Gurrutxagaren zuzendaritzapean. Elhuyar Fundazioak eta <a href="http://www.ehu.es/p200-home/eu">Euskal Herriko Unibertsitateak</a> elkarrekin argitaratu dugu, <a href="http://www.cajalaboral.es/euskera/home.asp">Euskadiko Kutxaren</a> babesari esker, eta une honetan merkatuan dagoen mota honetako hiztegi bakarra da. <strong>Bihar, osteguna,  aurkezpen-ekitaldia izango da Chillida-Leku museoan.<br />
</strong></p>
<p><img src="http://www.elhuyar.org/hizkuntza-zerbitzuak/informazioa/entziklopedia.jpg" width="194" height="238" /></p>
<p><span id="more-41"></span> Hiztegi entziklopediko mardula da, 1.800 orrialdekoa. ”<strong>200 aditu baino gehiago</strong> horrelako proiektu batetarako biltzea ohore bat izan da guretzako, eta elkarlan hau bai proiektua berarentzat eta baita egileentzat oso aberasgarria izan da”, adierazi digu Antton Gurrutxagak.</p>
<p>Duela zortzi urte hasi zen Elhuyarko talde bat Elhuyar zientzia eta teknologiaren hiztegi entziklopedikoa lantzen, helburu zehatz batekin: “<strong>Zientzia eta teknologiari buruzko oinarrizko erreferentzia-informazio fidagarri, landu eta eguneratua eskaintzea, modu zehatz, argi eta ulergarrian, eta erabiltzaile-multzo zabala gogoan izanik</strong>”. Duela lau urte, proiektuak jada bazuen forma bat, eta zientzia eta teknologiaren 50 jakintza-arlotako adituak hasi ziren batzen proiektura, hasierako helburu harekin bat eginez.</p>
<p>Egileon ustean, helburu hori lortu da: hiztegiak biltzen dituen <strong>jakintza-arlo guztietako 23.000 kontzeptuetan</strong> zehar islatzen da hori. Gaien gaurkotasunari garrantzi berezia eman zaio, eta zientziari eta teknologiari buruzko <strong>informazio orokorra behar duen ororentzat da obra interesgarria: DBHko, Batxilergoko eta Lanbide Heziketako ikasle eta irakasleak, kazetariak, gurasoak…</strong></p>
<p>Proiektu honetan lanean aritu diren adituak arlo desberdinetako kontzeptuak hautatzen, haien definizioak osatzen eta artikulu entziklopedikoak sortzen ibili dira, besteak beste. Arlo horiek guztiak sei multzo handitan biltzen ditu hiztegi entziklopedikoak: <strong>zientzia zehatzak, materiaren eta energiaren zientziak, lurraren zientziak, biziaren eta osasunaren zientziak, teknologia eta, azkenik, orokorrak</strong>. Kontzeptuak lantzeko hainbat kontsulta-iturri erabili dira, euskarazkoak zein beste hizkuntzetakoak (nagusiki, ingelesezkoak, gaztelaniazkoak eta frantsesezkoak).</p>
<p><strong>Hiztegiaren ezaugarriak: </strong></p>
<ul>
<li>23.000 kontzeptu, beren definizioekin eta dagozkien erdal terminoekin (ingelesezkoa, gaztelaniazkoa eta frantsesezkoa).</li>
<li> Erdara-euskara termino-zerrendak: ingelesa-euskara, gaztelania-euskara eta frantsesa-euskara</li>
<li> 1.500 irudi</li>
<li> 607 artikulu entziklopediko</li>
<li> Zientzia zehatzak, materiaren eta energiaren zientziak, lurraren zientziak, biziaren eta osasunaren zientziak, teknologia eta orokorrak.</li>
<li> CD-ROM euskarria liburuarekin batera</li>
</ul>
<p>Elhuyar Zientzia eta Teknologiaren Hiztegi Entziklopedikoa erosteko <a href="http://www.elhuyar.org/edizioak/EU/Elhuyar-Zientzia-eta-Teknologia-Hiztegi-Entziklopedikoa/188">Elhuyarren dendatik egin dezakezue %5eko deskontuarekin</a>. Erosi aurretik <a href="http://www.elhuyar.org/edizioak/digitala.asp?prod=zth_lagina">entziklopediaren lagina ikusi nahi baduzue hemen duzue aukera</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2009/10/28/elhuyar-zientzia-eta-teknologiaren-hiztegi-entziklopedikoa-kalean/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Corpus konparagarriak: zer dira eta zertarako erabil daitezke?</title>
		<link>http://komunitatea.elhuyar.eus/hizkuntza/2009/05/26/corpus-konparagarriak-zer-dira-eta-zertarako-erabil-daitezke/</link>
		<comments>http://komunitatea.elhuyar.eus/hizkuntza/2009/05/26/corpus-konparagarriak-zer-dira-eta-zertarako-erabil-daitezke/#comments</comments>
		<pubDate>Tue, 26 May 2009 09:36:39 +0000</pubDate>
		<dc:creator><![CDATA[hizkuntza]]></dc:creator>
				<category><![CDATA[Hizkuntza-teknologiak]]></category>
		<category><![CDATA[Hiztegigintza]]></category>
		<category><![CDATA[Itzulpengintza]]></category>
		<category><![CDATA[Terminologia]]></category>
		<category><![CDATA[corpus konparagarriak]]></category>
		<category><![CDATA[corpusak]]></category>
		<category><![CDATA[I+G+B]]></category>

		<guid isPermaLink="false">http://komunitatea.elhuyar.org/hizkuntza/2009/05/26/corpus-konparagarriak-zer-dira-eta-zertarako-erabil-daitezke/</guid>
		<description><![CDATA[Hizkuntzalaritzan eta, bereziki, hizkuntza-teknologietan, corpus konparagarriak gero eta garrantzia handiagoa hartzen ari dira azken urteotan. Artikulu honetan corpus konparagarriak zer diren, eta hizkuntzalaritzan nahiz hizkuntza-teknologietan zertarako balio dezaketen azaltzen saiatuko gara. Testu-corpusak idatzizko dokumentuen bildumak dira, eta oinarrizko baliabideak dira hizkuntza naturalaren zenbait ezaugarri aztertu ahal izateko edota hipotesiak kontrastatzeko. Hizkuntza naturalaren prozesamendua egiteko behar [&#8230;]]]></description>
				<content:encoded><![CDATA[<p align="justify"> Hizkuntzalaritzan eta, bereziki, hizkuntza-teknologietan, corpus konparagarriak gero eta garrantzia handiagoa hartzen ari dira azken urteotan. Artikulu honetan corpus konparagarriak zer diren, eta hizkuntzalaritzan nahiz hizkuntza-teknologietan zertarako balio dezaketen azaltzen saiatuko gara.</p>
<p align="justify">Testu-corpusak idatzizko dokumentuen bildumak dira, eta oinarrizko baliabideak dira hizkuntza naturalaren zenbait ezaugarri aztertu ahal izateko edota hipotesiak kontrastatzeko. Hizkuntza naturalaren prozesamendua egiteko behar den ezagutza inferitzeko ere oso garrantzitsuak dira. Hala ere, corpus-mota asko daude, eta, zereginaren arabera, batzuk aproposagoak dira besteak baino. Corpus konparagarriak, adibidez, antzeko testuez osatutako bildumak dira. Dokumentuak “antzekoak” direla esateko irizpide ezberdinak badaude ere<span id="more-15"></span> —antzekotasuna ezaugarri askoren arabera zehaztu baitaiteke—, gaia eta erregistro berdina izatea eskatu ohi zaie (adibidez, zientziari buruzko berriak). Corpus konparagarriak elebidunak baldin badira, hizkuntzen arteko fenomenoen azterketak egin ahal izango ditugu. Izan ere, corpus konparagarriek corpus paraleloen (itzulpen-memoriak) zenbait gabezia estaltzen dituzte. Batetik, itzulpenek ez dute islatzen helburu-hizkuntzaren aukera linguistiko guztien errepertorioa, beste hizkuntza bat erreferentziatzat hartuta sortutako testuak baitira, eta, ondorioz, itzulpena kutsatuta baitago jatorrizko hizkuntzaren idiosinkrasia estilistikoez. Bestetik, corpus paraleloak osatzea ez da batere lan xamurra.</p>
<p align="justify">Edonola ere, paraleloekin alderatuta, corpus konparagarriek ere zenbait arazo sortzen dituzte: A hizkuntzako elementu zehatzen itzulpenak B hizkuntzan egotea ez dago ziurtatuta, eta, egonda ere, ez dakigu corpusaren zein puntutan aurkituko ditugun. Paraleloetan, berriz, ziurtatuta daukagu edozein termino edo espresiorentzako itzulpena topatuko dugula, eta, gainera, non dagoen ere badakigu, nahiko zehatz. Hori dela eta, itzulpengintzan (itzulpen-memoriak), hiztegigintzan eta hizkuntza-teknologietan (terminologia-erauzketa, itzulpen automatikoa&#8230;) askotan erabiltzen dira, eta emaitza onak lortzen dira.</p>
<p align="justify">Halaber, corpus konparagarriak biltzea paraleloak biltzea baina errazagoa da, informazio-iturriak ugariak direlako, are gehiago Internet jaio zenetik. Hala ere, biltze-prozesua automatizatzea ez da lan hutsala, gutxieneko konparagarritasun-maila bat bermatu behar delako.</p>
<p align="justify"><strong>Corpus konparagarriak hizkuntzalarientzako baliabide gisa</strong></p>
<p align="justify">Eman dezagun kirolei buruzko artikuluak itzultzen ari garela, eta gaztelaniazko <em>“</em><em>alzarse con la victoria</em><em>”</em><em> </em>egitura itzuli behar dugula euskarara. Noski, jakin nahi dugu ea <em>“garaipenarekin altxatu”</em>, benetan, euskarak berezkoa duen esamoldea den. Demagun, orobat, kirol-albisteei buruzko corpus konparagarri bat dugula. Han <em>“garaipen”</em> eta <em>“victoria”</em> hitzen agerpenak kontsultatuko bagenitu, ikusiko genuke euskaraz ez dagoela egitura horrekin bat datorren agerpenik, eta “<em>garaipena lortu”</em> edo “<em>garaipena eskuratu”</em> egiturak direla ohikoenak.</p>
<p align="justify">Har dezagun medikuntzako corpus konparagarri elebidun bat, euskaraz eta ingelesez. Demagun euskaraz <em>“zunda nasogastriko”</em> deritzon prozedura ingelesera itzuli behar dugula. Ematen du “<em>nasogastric probe”</em> dela itzulpen zuzena. Hala ere, corpusaren ingelesezko atalean <em>“nasogastric”</em> hitza aztertuta konturatuko gara oso gutxitan erabiltzen dela <em>“probe”</em> izenarekin. Are gehiago, agerpenak aztertuta ondorioztatuko dugu ingelesez <em>“</em><em>tube</em><em>”</em> edo <em>“</em><em>intubation</em><em>”</em> izenekin lotzen dela, batez ere. Beraz, itzulpen egokiagoa litzateke <em>“nasogastric intubation”</em>.</p>
<p align="justify"><strong>Corpus konparagarriak hizkuntza-teknologietan</strong></p>
<p align="justify">Terminologia-erauzketan gero eta gehiago erabiltzen dira corpus hauek. Nahiz eta paraleloekin lortzen diren emaitzetatik (% 99ko doitasuna) urrun egon oraindik, konparagarriekin aritzeak baditu alde onak ere. Terminologia berria erauzteko egokiagoak dira; izan ere, corpus konparagarriak eskuratzeak dituen erraztasunak direla medio, bideragarriagoa da testu berriagoak lortzea. Bestalde, lehen aipatu den bezala, hizkuntza bateko testuek ez diete beste hizkuntzakoei eragiten.</p>
<p align="justify"> Bilatzaile eleaniztunetan, hainbat teknika erabiltzen dira sistemaren portaera hobetzeko. Teknika horien oinarrian corpus konparagarriak izaten dira askotan. Adibidez, termino jakin batekin semantikoki erlazionatuta dauden terminoak bilatzen dira corpusean, eta, informazio osagarri hori baliatuz, bilaketa-emaitza hobeak lortuko ditugu. Demagun <em>“jaguar”</em> bilaketa egin nahi dugula, eta animaliari buruz galdezka ari garela. Bilaketa zabalduko bagenu, <em>“jaguar animalia felido”</em> konbinazioa sortuz, bilaketaren emaitzak gure nahietara bideratuagoak egongo lirateke.</p>
<p align="justify"> Azkenik, aipatu beharra dago corpus konparagarriek ekarpen handia egiten diotela itzulpen automatikoari, itzulpen automatiko estatistikoan erabiltzen diren ereduak trebatzeko erabiltzen baitira. Sistemak corpus horien gainean ikasten du, eta gero ezagutza hori baliatzen du itzulpena egiteko. Lortutako emaitza egokiek erakusten dute corpus konparagarrien ekarpenaren baliagarritasuna.</p>
<p align="justify"> <strong> Corpus konparagarriak gure ikerketetan</strong></p>
<p align="justify"><a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/I-G-B-unitatea">Elhuyarreko I+G+B taldean</a> uste dugu euskara bezalako hizkuntza txikiei begira, eta hizkuntza-teknologien alorrean, apustu estrategikoa dela corpus konparagarrien bidea. Itzulpengintzan ere, ikusi dugun bezala, baliabide ahaltsua da. Horrenbestez, corpus konparagarriak gure jarduerari oso estu lotuta daude, eta <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/Co3">Co3</a> eta <a href="http://www.elhuyar.org/hizkuntza-zerbitzuak/EU/AzerHitz">AzerHitz</a> proiektuak dira horren adibiderik garbienak. Co3 proiektuaren helburua corpus konparagarriak era automatikoan sortzea da, Internet iturburutzat hartuta; AzerHitz proiektuan, berriz, termino ezezagunen itzulpenak bilatzen dira corpus konparagarrietan.</p>
<p align="justify">Elhuyar Fundazioko I+G+B taldea</p>
]]></content:encoded>
			<wfw:commentRss>http://komunitatea.elhuyar.eus/hizkuntza/2009/05/26/corpus-konparagarriak-zer-dira-eta-zertarako-erabil-daitezke/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
