Secciones
Foros Electrónica
Alguien dijo ...
Existe un principio que se resiste a toda información, que se resiste a toda investigacion, que nunca deja de mantener al hombre en una ignorancia perenne. El de desestimar lo que no se ha investigado.

Herbet Spencer(1820-1903) Filósofo, sociólogo y psicólogo británico
Contacto
ENSEÑAN GRAMATICA INGLESA A UN SOFTWARE SOFISTICADO DE TRADUCCION
 
 




  Los autores de un sistema de traducción automática de la Universidad de California del Sur, considerado uno de los mejores del mundo, están enseñando a su software algo nuevo: la gramática inglesa.



(NC&T) La mayor parte de los modernos sistemas de "traducción automática", incluso el más famoso de todos, creado por el Instituto de Ciencias de la Información (ISI), perteneciente a la Universidad de California del Sur (USC), dependen de la fuerza bruta, correlacionando inmensos cuerpos de texto pre-traducido de fuentes tales como periódicos que publican en múltiples idiomas. El software empareja de forma consistente las frases que se presentan de modo paralelo, como por ejemplo la inglesa "my brother's pants" con la española "los pantalones de mi hermano", y entonces usa estas correlaciones para ensamblar las traducciones de nuevos materiales.

Funciona, pero sólo hasta cierto punto. El especialista en traducciones automáticas del ISI Daniel Marcu explica que cuando un sistema así está entrenado con suficiente texto bilingüe pertinente, puede descomponer un idioma extranjero en frases unitarias, traduciendo cada una de ellas bastante bien al inglés, y hacer alguna re-clasificación. Sin embargo, incluso bajo estas circunstancias favorables, el resultado, claramente, todavía no es válido, ya que resulta difícil de leer y es poco satisfactorio para el uso comercial.

Así, Marcu y su colega Kevin Knight, ambos directivos del ISI, han iniciado un ambicioso proyecto, el de Modelación Avanzada del Lenguaje para Traducciones Automáticas, con el fin de mejorar el sistema que ellos crearon en el ISI, sometiendo los textos que salen de su sistema básico de traducciones a un paso superior: el procesamiento gramatical.

El paso parece simple, pero en realidad es muy difícil. Por ejemplo, no existe ningún algoritmo robusto que clasifique como gramaticalmente "correcta" o "incorrecta", o bien como "con sentido" o "sin sentido" una sucesión de palabras tecleadas por el usuario.

El problema radica, entre otras cosas, en un aspecto importante del uso humano del idioma. Los humanos tenemos una enorme habilidad para crear y unir frases e ideas en estructuras referenciales intrincadas. Desembrollar por métodos informáticos esas telarañas verbales (o, en una descripción más común, rastrear las bifurcaciones del "árbol" de conexiones) es una tarea tan desalentadora, que los programadores tomaron hace tiempo la dirección de la fuerza bruta, emparejando frases y confiando que la relación entre ellas resultara clara para los lectores.

Como las limitaciones de este enfoque resultan evidentes, los investigadores han empezado ahora a aplicar el poder de la informática para intentar configurar las reglas gramaticales. Según Knight, un paso crucial ha sido la creación en la Universidad Estatal de Pensilvania de una gran base de datos de texto en inglés cuya sintaxis ha sido descifrada a mano por especialistas.

Usando éstas y otras fuentes, los científicos en computación han empezado a desarrollar los métodos para modelar las reglas observadas. Knight piensa que este enfoque puede ser capaz de mejorar las traducciones automáticas


Lunes, 13 Marzo, 2006 - 08:00
Boletines
powered by phppowered by MySQLPOWERED BY APACHEPOWERED BY CentOS© 2004 - 2025Información Legalpoliticas de cookiesipv6 ready