Investigadores de las universidades de Washington y Cornell (EEUU) y de Microsoft Research diseñaron un sistema para rastrear y descargar las fotografÃas que han colgado los turistas en el sitio de imágenes Flickr.com. El buscador estaba programado para coger sólo las etiquetadas con las palabras Roma o Rome. Consiguieron 150.000 tomadas por miles de turistas con cámaras de decenas de marcas y modelos, a diferentes horas y con pericia desigual.
Para dar orden a este enorme puzzle de imágenes usaron una serie de algoritmos matemáticos con los que manipularon la información EXIF de cada fotografÃa. Esta incluye un conjunto de datos que, a modo de ADN de la imagen, recogen detalles como la marca y modelo de la cámara, dimensiones de la fotografÃa, fecha y hora de la exposición, distancia focal, etc. El objetivo era encontrar las más parecidas entre sà en función de su fotometrÃa y combinarlas hasta crear un esqueleto de los paisajes más caracterÃsticos de la ciudad, como la BasÃlica de San Pedro, el Panteón o la Fontana de Trevi. Como reconoce el profesor de informática de la Universidad de Washington y coautor del trabajo, Sameer Agarwal, "lo que querÃamos era avanzar en la reconstrucción de grandes colecciones de imágenes de Internet organizadas según su parecido".
Los investigadores se encontraron con un dilema. "Si una localización se haya escasamente representada en la base de datos, más difÃcil será hallar fotos contiguas o similares con las que construir un modelo 3D", explica Agarwal. Pero, "si hay demasiadas del mismo sitio, subirán las necesidades de computación", aclara. Lo que hizo el equipo, que cuenta con la financiación de la Fundación Nacional de Ciencias de EEUU, fue modificar su programa para que el sistema dejara de buscar imágenes de un lugar concreto tras superar un umbral mÃnimo.
Este programa es una versión mejorada de Photo Tourism, una tecnologÃa que licenciaron a Microsoft hace tres años para que la compañÃa lanzara su herramienta Photosynth. Con ambas se pueden crear vistas panorámicas, pero la ambición de los investigadores es recrear una ciudad entera. Para destripar las fotografÃas, el sistema empezó por pasarlas a escala de grises. Aunque el sistema intentó que los pares de imágenes parecidas estuvieran en el mismo disco duro, el tráfico entre los 496 ordenadores fue continuo hasta tener una enorme matriz con los datos esenciales de las 150.00 imágenes agrupadas por similitud.
En la actualidad ya existen sistemas de vistas panorámicas como Google Earth o Virtual Earth de Microsoft, pero ambos usan colecciones sistemáticas de fotografÃas aéreas o a pie de calle. El proceso para recrear Roma es diferente. Además de que las imágenes no están organizadas, este proyecto desintegra las fotografÃas para recombinarlas, y no pegando una junto a la otra.
El siguiente paso fue extraer de la matriz generada las coordenadas y el pÃxel de color de cada punto. Con ellos se puede hacer un render o imagen partiendo de un modelo. El efecto de la profundidad 3D se consiguió aplicando la estructura a partir del movimiento, un sistema que calcula geometrÃa 3D a partir del movimiento 2D. La recreación es aún una ciudad a medio hacer, pero los impulsores del proyecto confÃan en que con más imágenes y ordenadores para procesarlas se pueda algún dÃa volar sobre una Roma virtual completa.
Noticia publicada en Público (España)