Vivimos en un mundo tridimensional que a menudo vemos en dos dimensiones. Discernir cómo se yuxtaponen los objetos y superficies en una imagen bidimensional resulta natural para las personas, pero es algo que ha confundido durante mucho tiempo a los sistemas de visión computerizada.
(NC&T) Ahora, sin embargo, investigadores de la facultad de Ciencias de la Computación de la Universidad Carnegie Mellon han encontrado una manera de ayudar a los ordenadores a entender el contexto geométrico de escenas al aire libre y así comprender mejor lo que ven. El descubrimiento promete reanimar un área de investigación de la visión computerizada que había sido abandonada hace dos décadas por parecer insoluble. A la postre, este descubrimiento puede encontrar aplicación en sistemas de visión empleados para dirigir vehículos robóticos, monitorizar cámaras de seguridad y archivar fotos. Usando técnicas de aprendizaje automático, los investigadores del Instituto de Robótica de la citada universidad, Alexei Efros y Martial Hebert, junto con el estudiante de postgrado Derek Hoiem, han enseñado a unas computadoras cómo distinguir señales visuales que diferencian entre superficies verticales y horizontales en fotografías de escenas al aire libre. Incluso han desarrollado un programa que permite al ordenador generar automáticamente reconstrucciones tridimensionales de escenas a partir una sola imagen. Tener sentido de la geometría tridimensional ayuda a los ordenadores a identificar objetos, tales como autos y peatones, en tomas callejeras. Identificar superficies verticales y horizontales, así como la orientación de dichas superficies, proporciona buena parte de la información necesaria para entender el contexto geométrico de una vista completa. Sólo cerca de un tres por ciento de las superficies en una foto típica están en ángulo. Usando 300 imágenes tomadas de una búsqueda en Google, Hoiem mostró a una computadora numerosos ejemplos de superficies verticales y horizontales, permitiendo a un programa de aprendizaje automático desarrollar asociaciones estadísticas entre ciertas formas, matices y otras características típicas de cada orientación. El programa también se aprovechó de las restricciones del mundo real: los cielos son azules, los horizontes son horizontales, y la mayoría de los objetos yacen sobre la tierra; en nuestro mundo, las cosas no "flotan libremente". |
|