12:26

cultura

Euskaltzaindia presenta Euskararen Erreferentzia Corpusa, una muestra seleccionada del euskera actual

N. V. | EITB Media

La Academia ha recopilado un corpus "abierto y colectivo" que se puede emplear "para el análisis lingüístico, el aprendizaje automático o la validación de hipótesis en las investigaciones lingüísticas".

  • Representantes de Euskaltzaindia y las instituciones que ceden sus textos, en la presentación

    Representantes de Euskaltzaindia y las instituciones que ceden sus textos, en la presentación

  • Whatsapp
  • Whatsapp
  • Enviar

Euskaltzaindia ha presentado este lunes en Bilbao Euskararen Erreferentzia Corpusa (EEC). La Academia ha recopilado en este recurso textos de los últimos 25 años, cedidos por entidades privadas y públicas de todo Euskal Herria, que podrán ser utilizados "para conocer el día a día del euskera y hacer frente a los retos que nos plantean las tecnologías lingüísticas", según han explicado hoy en el acto de presentación.  

EEC supone una herramienta fundamental para el análisis lingüístico, el aprendizaje automático o la validación de hipótesis en las investigaciones lingüísticas, pero también puede utilizarse como un corpus estándar o referente para fines lingüísticos, literarios o de investigación, e incluye 123 124 documentos y 154,21 millones de palabras de texto.

Casi todos los textos que incluye la obra Euskararen Erreferentzia Corpusa son eminentemente escritos (algunos sí recogen formulas preparadas para lengua oral como series, películas, guiones...). El 48 % de los textos proceden de libros, el 48 % de publicaciones periódicas y el 4 % restante de material creado específicamente para la red. Una cuarta parte de los textos son de ficción, y el resto de no ficción.

Comentarios

  • Lo más visitado

      Lo más visitado

      1
       
      cargando