Inicio | Mapa Web | Contacte
Buscar buscar
  OESI
línea divisoria
TECNOLOGÍAS LINGÜÍSTICAS
línea divisoria
SERVICIOS
DILE
Noticias
Agenda
Infoteca
línea divisoria
PROYECTOS OESI
bullet Eagles
RILE
Euromap
LIQUID
C-ORAL-ROM
línea divisoria
RECURSOS ÚTILES
bullet Solicitud de Información
línea divisoria
INSTITUTO CERVANTES
línea divisoria
 
 
 
Enlace a la página web del curso 'Internet para Todos'

Logo correspondiente al cumplimiento del Nivel AA de las Directrices de Accesibilidad para el Contenido Web 1.0 de la Asociación para la Accesibilidad Web (WAI)
 
    NOTICIAS <<Volver al índice

Imagen: Logotipo del Grupo de Estructuras de Datos y Lingüística Computacional16/12/2004
Desambiguador morfosintáctico del español

El Grupo de Estructuras de Datos y Lingüística Computacional del Departamento de Informática y Sistemas de la Universidad de Las Palmas de Gran Canaria ha desarrollado un desambiguador morfosintáctico del español basado en la estructura sintáctica de la frase u oración.

Hay una gran cantidad de palabras en español que, en función del contexto en el que aparecen, pueden desempeñar diferentes funciones gramaticales. Cuando se realiza un análisis morfológico automático de un texto en el que aparecen este tipo de palabras se produce un desmesurado número de resultados posibles, si no se tiene en cuenta la función de cada palabra en el contexto en que aparece.

La desambiguación permite asignar automáticamente a cada palabra la categoría más apropiada en un determinado contexto, eliminando la ambigüedad producto de ese alto número de resultados del análisis. De este modo, se obtiene un análisis morfosintáctico más preciso.

El desambiguador del Grupo de Estructuras de Datos y Lingüística Computacional la Universidad de Las Palmas de Gran Canaria está compuesto por un universo de más de 4.900.000 palabras (sin contar la ampliación inherente a los prefijos y a los pronombres enclíticos), formado a partir de 151.103 formas canónicas (incluye 14.859 nombres y apellidos de personas).

Puede acceder a la versión gratuita del desambiguador, que tiene una limitación de 80 caracteres, a través de la siguiente página en Internet: http://oesi.cervantes.es/proyectos/detalle.jsp?id=819

imprimir

  BUSCADOR DE NOTICIAS
 
Titular  
Fecha desde  hasta  
            dd/mm/aaaa
buscar 

 
  BOLETÍN DE NOTICIAS  
 

Reciba en su correo electrónico las noticias del sector

 
 
Dirección de correo:
suscripción 
 
 
NOTICIAS RELACIONADAS
 
  bullet Nueva versión de 'Dublin Core Services' (DCS)
  bullet POESIA: filtro de contenidos web basado en procesamiento del lenguaje natural
  bullet Diccionario de Colocaciones del Español (DiCE)
  bullet Freeling 1.1: analizador del lenguaje

 
<< Volver al índice Subir
         
línea divisoria
La Oficina del Español en la Sociedad de la Información del Instituto Cervantes es miembro institucional de las siguientes asociaciones:
SEPLN, ELRA, EAMT
 
 
El Instituto Cervantes agradece el patrocinio de:
Telefonica
SEPLNELRAEAMT Telefónica
© Instituto Cervantes, Madrid (España), 2004. Reservados todos los derechos