ZT Corpusa, Zientzia eta Teknologiaren Corpusa, handitu egin da, eta kontsulta-aukera berriak eskaintzen ditu. Zientzia eta teknologiaren alorreko euskara ikertzeko garatutako hizkuntza-baliabide ahaltsua da ZT Corpusa. Elhuyar Fundazioak eta EHUko IXA Taldeak elkarlanean garatutako proiektu honen lehen emaitzak 2006aren hondarrean aurkeztu ziren jendaurrean, on-line kontsultatzeko interfazea kaleratu zenean. Baina beti hedatu eta hobetzeko asmoari jarraituz, kontsulta-aukera hedatuez eta testu gehiagoz hornitu da berriki.
2006ko abenduan aurkeztutako ZT Corpusaren bertsioa 7,6 milioi hitzez osatuta zegoen, horietatik 1,6 milioi eskuz landuak (berrikusi, zuzendu eta desanbiguatuak). Orain sareratutako bertsioan, 8,5 milioi hitz daude, horietako 1,9 milioi eskuz landuak. Testu berrien hornitzaileen artean, Elkar argitaletxea, Eusko Jaurlaritza eta Eustat aipa ditzakegu, besteak beste (hornitzaile guztiak hemen ikus daitezke eta obra guztien zerrenda hemen).
Horrez gain, aukera berriak jarri zaizkio kontsulta-interfazeari aurreratuari. Bi hitz edo gehiago kontsultatu nahi direnean, horiek edozein ordenatan bilatzeko aukera eskaintzen da orain, hau da, lehen hitza bigarrenaren aurretik, ondoren edo edonon egotea aukera daiteke, Non
kutxaren bidez.
ZT Corpusa hobetu eta hedatzeko lanak ere aurrera doaz. Batetik, testu berriak lortzen eta corpuseratzen segitzen dugu. Bestetik, on line bertsioaz gain, laster ZT Corpusa osorik eskuragarri jarri nahi da, ikerketarako doan, eta ustiaketa komertzialerako ordainduta (ELDAren bidez).
Igor Leturia
Tags: baliabideak, corpusa, corpusgintza, elda, Hizkuntza-teknologiak, I+G+B, ikerketa, ixa, teknologia, zientzia