cultura
N. V. | EITB Media
La Academia ha recopilado un corpus "abierto y colectivo" que se puede emplear "para el análisis lingüístico, el aprendizaje automático o la validación de hipótesis en las investigaciones lingüísticas".
Representantes de Euskaltzaindia y las instituciones que ceden sus textos, en la presentación
Euskaltzaindia ha presentado este lunes en Bilbao Euskararen Erreferentzia Corpusa (EEC). La Academia ha recopilado en este recurso textos de los últimos 25 años, cedidos por entidades privadas y públicas de todo Euskal Herria, que podrán ser utilizados "para conocer el día a día del euskera y hacer frente a los retos que nos plantean las tecnologías lingüísticas", según han explicado hoy en el acto de presentación.
EEC supone una herramienta fundamental para el análisis lingüístico, el aprendizaje automático o la validación de hipótesis en las investigaciones lingüísticas, pero también puede utilizarse como un corpus estándar o referente para fines lingüísticos, literarios o de investigación, e incluye 123 124 documentos y 154,21 millones de palabras de texto.
Casi todos los textos que incluye la obra Euskararen Erreferentzia Corpusa son eminentemente escritos (algunos sí recogen formulas preparadas para lengua oral como series, películas, guiones...). El 48 % de los textos proceden de libros, el 48 % de publicaciones periódicas y el 4 % restante de material creado específicamente para la red. Una cuarta parte de los textos son de ficción, y el resto de no ficción.
es noticia
noticias
noticias
noticias
noticias
noticias
Deporte
cultura
Lo más visitado
© EITB - 2025 - Portal de Privacidad - Aviso Legal - Política de cookies - Configuración cookies - Transparencia - Contacto - Mapa Web