Descripción de la tarea
Page Contents
- El objetivo de la tarea es traducir tweets entre idiomas de la peninsula ibérica: catalán (ca), euskera (eu), castellano (es), gallego (gl) y portugués (pt). Se evaluarán pares eu-es, ca-es, gl-es y pt-es.vintage daytona replica
- Habrá un corpus de desarrollo (eu-es, ca-es) y uno de test para todos los pares lenguas.
- Los corpus para los pares eu-es y ca-es se han obtenido de cuentas de Twitter que emiten de forma bilingüe. Se han alineado automáticamente y revisado manualmente. Debido a su origen, en general, los tweets son bastante formales.
- Los corpus para el resto de pares (gl-es y pt-es) se han obtenido de la traducción manual de los anteriores
- Se ofrecerán los id-s (identificadores de las cuentas) tanto en desarrollo como en test.
- Los participantes podrán trabajar con el corpus de desarrollo (corpus alineado) para preparar sus sistemas. También los recursos que puedan obtener, incluyendo el uso de la API gratuita de Twitter.fake watches
- Finalmente deberán traducir automáticamente en corto plazo el corpus de test (solo con tweets en un idioma).
- Además, cada equipo participante que envíe un sistema se compromete, si alguno de sus integrantes habla alguno de los idiomas de la tarea, a participar en una evaluación manual
Evaluación
- La tarea consiste en traducir cada tweet al idioma destino.
- Los tweets a evaluar no podrán superar la longitud máxima (140). Si la superan serán truncados.
- Los hashtags se tratarán como palabras y los URLs e Identificadores dentro del mensaje irán etiquetados: URLURL, IDIDID.
- Para cada par de idiomas habrá evaluación en los dos sentidos pero con distintos tweets (así no hace falta distribuir las traducciones)
- El rendimiento de los sistemas será evaluado mediante las medidas mas extendidas y automáticas: Bleu, NIST, TER y METEOR con una sola referencia.
- Con la información extraída de la colaboración de los grupos participantes, se hará una evaluación más cualitativa.replica presidential rolex watches for sale