Hay
una gran cantidad de palabras en español que, en función del contexto
en el que aparecen, pueden desempeñar diferentes funciones
gramaticales. Cuando se realiza un análisis morfológico automático
de un texto en el que aparecen este tipo de palabras se produce un
desmesurado número de resultados posibles, si no se tiene en cuenta la
función de cada palabra en el contexto en que aparece.
La desambiguación permite asignar automáticamente a cada palabra la
categoría más apropiada en un determinado contexto, eliminando la
ambigüedad producto de ese alto número de resultados del análisis. De
este modo, se obtiene un análisis morfosintáctico más preciso. El desambiguador del Grupo de Estructuras de Datos y Lingüística Computacional la Universidad de Las Palmas de Gran Canaria está
compuesto por un universo de más de 4.900.000 palabras (sin contar la
ampliación inherente a los prefijos y a los pronombres enclíticos),
formado a partir de 151.103 formas canónicas (incluye 14.859 nombres y
apellidos de personas). Puede acceder a la versión gratuita
del desambiguador, que tiene una limitación de 80 caracteres, a través de la siguiente página en Internet: http://oesi.cervantes.es/proyectos/detalle.jsp?id=819 |