Letralia, Tierra de Letras - Edición N° 33, del 6 de octubre de 1997

Literatura en Internet


Aplicaciones del Grupo de Estructuras de Datos del Departamento de Informática y Sistemas de la ULPGC

El Grupo de Investigación en Estructuras de Datos del Departamento de Informática y Sistemas de la Universidad de Las Palmas de Gran Canaria ha desarrollado un interesante trabajo de investigación en el tratamiento de la información por medios electrónicos.

Las líneas de trabajo del equipo de la ULPGC están enfocadas al aprovechamiento de los ordenadores en el tratamiento de la información. Se ha planteado la automatización de procesos de búsqueda y recuperación de datos en bloques de texto con lenguaje natural.

Si esto le suena complicado, piense en las horas que ha perdido buscando información sobre temas muy específicos en cualquiera de los buscadores de Internet. Con procesos de búsqueda simples, ninguna computadora es capaz de interpretar correctamente la solicitud de información de un humano, por lo que los buscadores tradicionales han popularizado diversos métodos de localización, entre los que se cuentan el empleo de operadores lógicos (como "and" y "or") o la añadidura de signos de más y menos a las palabras incluidas en la cadena de búsqueda.

Los estudios que desarrolla desde 1990 el Grupo de Investigación en Estructuras de Datos del Departamento de Informática y Sistemas de la ULPGC están orientados a la optimización de métodos informáticos que permitan a una computadora interpretar el lenguaje humano, algo así como "entender" lo que el usuario escribe con lenguaje natural. Aunque por el momento no se trata de crear un buscador con características mágicas, algunos de los esfuerzos de los investigadores tienen potencialidades insospechadas.

Entre los avances del equipo se encuentran los estudios desarrollados en almacenamiento y recuperación de cadenas de caracteres mediante distancias evaluadoras de su similitud; localización de texto de acuerdo a distintos grados de profundidad sintáctica; organización de los resultados de búsquedas para su presentación posterior; tratamiento de diccionarios de diversos tipos, y problemas lingüísticos como conjugación, morfología y análisis de textos.

Las investigaciones de este equipo están reflejadas en una serie de aplicaciones experimentales que pueden ser accedidas en el Web. Un conjugador y un lematizador verbal, una aplicación para la gestión integrada de sinónimos y antónimos, una de reconocimiento y generación morfológica, una de análisis de texto, una de gestión de relaciones ideológicas y un conversor de WordPerfect a HTML son las muestras disponibles del trabajo adelantado por el equipo de la ULPGC.

Por ejemplo, el conjugador verbal se activa escribiendo un infinitivo en la caja de diálogo correspondiente, seleccionando una de diez opciones disponibles —allí veremos las formas no personales, el imperativo y el condicional, entre otras— y oprimiendo el botón dispuesto para ello. A la manera de los comunes buscadores, el conjugador mostrará un nuevo archivo HTML con los resultados: todas las conjugaciones posibles según la entrada del usuario.

Según las explicaciones del equipo, el programa utiliza "el conocimiento de una serie de reglas que siguen los diferentes modelos de conjugación verbal y la sistematización de la conjugación regular. Tiene en cuenta los verbos defectivos y aquellos con conjugación múltiple. La base de verbos alcanza un total de 13.722 infinitivos". Las fuentes del conjugador incluyen el DRAE y otros reputados diccionarios de consulta especializada.

El lematizador verbal, por su parte, solicita al usuario una forma verbal simple conjugada y produce el o los infinitivos de los que deriva, además de su categoría gramatical y la flexión que pudo producirla. Ha sido actualizado recientemente y ahora reconoce formas verbales que incluyan prefijos y pronombres enclíticos. Como el conjugador, puede ser utilizado en la página Web de la ULPGC.

Las demás aplicaciones, de las cuales se ofrecen capturas de pantalla y sucintas descripciones, son productos autónomos. La experiencia del equipo de investigadores se hace patente en estos programas, que funcionan como verdaderos expertos lingüísticos y están abriendo el camino a extraordinarias posibilidades informáticas.

Octavio Santana Suárez es el investigador principal. Le acompañan José Pérez Aguiar, Margarita Díaz Roca, Daniel González Domínguez, Juan Carlos Rodríguez Del Pino, Zenón Hernández Figueroa, Gustavo Rodríguez Rodríguez, Juan de Dios Duque Martín, Octavio Mayor González y Francisco Javier Carreras Riudavets. Para acceder a las aplicaciones del Grupo de Investigación en Estructuras de Datos, es necesario entrar a la página y seleccionar la opción "Aplicaciones desarrolladas".