Ir a www.cervantes.es
  Inicio > Ficha de un recurso
Contacto Mapa del sitio Imprimir Créditos
 Buscar   Buscar Ayuda de búsqueda
Hispanistas
Hispanistas
línea divisoria
Departamentos
Departamentos
línea divisoria
Asociaciones
Asociaciones
línea divisoria
Novedades
Novedades
Revistas y actas
Agenda
Recursos
Archivo bibliográfico
Empleo, becas y ayudas
Enlaces
línea divisoria
Portal editorial
Portal editorial
línea divisoria
Preguntas frecuentes
Preguntas frecuentes
línea divisoria
Ayuda
Ayuda
línea divisoria
 Recursos | Ficha

Título Desambiguador morfosintáctico del español
Procedencia Grupo de Estructuras de Datos- Univ. de Las Palmas de Gran Canaria
Página web http://www.gedlc.ulpgc.es/investigacion/desambigua/morfosintactico.htm
Materia de especialización Lingüística aplicada
Lingüística hispánica
Descripción Debido a que en español existe una considerable cantidad de palabras que pueden desempeñar diferentes funciones gramaticales, el análisis de un texto produciría una desmesurada multiplicidad de combinaciones posibles en caso de no tener en cuenta la función de cada voz en el contexto en que aparece.

El método de desambiguación reduce el tamaño de la respuesta gracias al tratamiento que hace de las estructuras sintácticas tanto locales como globales apoyándose en un analizador sintáctico automático --no usa criterios estadísticos.

Para cada palabra, el lematizador proporciona un conjunto de caracterizaciones gramaticales y léxicas, entre otras
el desambiguador asigna a cada caracterización un comportamiento funcional. El desambiguador discrimina para la categoría verbo entre cuatro opciones: infinitivo, gerundio, participio y forma verbal personal, ya que presentan diferencias de función y de posición en las estructuras sintácticas
por el mismo motivo, para la categoría pronombre, se distingue entre pronombre personal, pronombre de relativo y otro pronombre.

El universo que contempla está compuesto por más de 4 900 000 palabras (sin sumar la ampliación inherente a los prefijos y a los pronombres enclíticos), formado a partir de 151 103 formas canónicas (incluye 14 859 nombres de personas y apellidos).

Esta aplicación no propone una solución única, sino todas aquellas que aparecen aceptables al sistema. No tiene en cuenta aspectos semánticos en el análisis. En próximas versiones se irán depurando los resultados para aumentar el grado de desambiguación del sistema.

Esta versión de la aplicación, disponible para hacer pruebas en línea de manera libre y discrecional, tiene las entradas limitadas a 80 caracteres.
  Buscador de recursos
Título
Procedencia
Materia de especialización
Descripción
Anunciar recurso
Anunciar recurso
  Otros sitios Cervantes
cvc.cervantes.es
IC en el mundo
bibliotecas.cervantes.es
Diplomas
Resumen de prensa
Fundación Carolina
Becas MAEC-AECI
AECI
línea divisoria
© Instituto Cervantes | Aviso legal