Un consorcio europeo de nueve socios procedentes de la universidad y la industria está desarrollando una arquitectura distribuida a gran escala de revisión paritaria que hará posible la búsqueda de contenidos audiovisuales utilizando el paradigma de consulta por medio de ejemplos..
En este paradigma, se utiliza una pieza musical como una consulta y el resultado es una lista con otras composiciones musicales clasificadas según la similitud de contenidos.
Con el nombre de SAPIR, Recuperación de Información Paritaria por medio de contenidos audiovisuales, el proyecto, financiado por el Sexto Programa Marco (6PM) con 3,8 millones de euros, comprende la construcción de una comunidad de información a gran escala que hará más accesible los contenidos multimedia.
«Los motores de búsqueda populares de hoy en día funcionan dentro de fronteras definidas», explicó Yosi Mass, director del proyecto SAPIR en el laboratorio de Investigación IBM, en Haifa, Israel.
«El objetivo de SAPIR es crear una red gigante de revisión paritaria, donde los usuarios sean pares que producen contenidos audiovisuales utilizando múltiples dispositivos y proveedores de servicios que son son super-pares que mantienen índices y aportan capacidades de búsqueda», añadió.
En su calidad de motor de búsqueda de contenidos audiovisuales, SAPIR explorará nuevas formas de analizar, indexar, y recuperar grandes cantidades de discursos, imágenes, vídeo y música que actualmente invaden nuestro universo digital.
«Al definir nuevos estándares en los métodos de búsqueda, SAPIR incorporará tecnologías como el reconocimiento de voz, el tratamiento de imágenes, algoritmos de indexación, mecanismos sofisticados de clasificación y búsquedas reales en contenidos audiovisuales. La búsqueda por ejemplos más que las consultadas basadas en textos permitirá que los usuarios digan en voz alto una palabra y que el motor busque un modelo de habla similar. Otro escenario supondría que cualquiera puede introducir una imagen de un saxofón y el motor busca figuras similares, declaró el Sr. Mass.
El resultado final será un espacio distribuido de pares que incluya la búsqueda por contenidos o ejemplos en vez de utilizar los métodos actuales, que se limitan a palabras clave y segmentos de texto.
«SAPIR dará solución a algunos de los desafíos más apasionantes de hoy en día, comenzando con la escala de información que se aborda. El espacio de búsqueda creado por inmensas cantidades de archivos existentes de video y multimedia excede en gran medida el área de búsqueda de los principales motores de hoy en día. La popularidad de los nuevos sitios web con contenidos de video es un claro indicativo de la necesidad vital de hoy en día de contar con una herramienta de búsqueda de multimedia. La cantidad masiva de datos no se puede gestionar ya con el modelo actual de indexación lento y centralizado de todos los contenidos que se pueden buscar, añadió el Sr. Mass.
El consorcio de SAPIR incluye a expertos de la industria y la academia, que aportan cada uno sus pericias en el área de los dispositivos multimodales, la recuperación de información, la indexación, la distribución entre pares, y el análisis audiovisual y la creación de redes sociales.
«Actualmente, una de las claves para que los usuarios tengan experiencia en la búsqueda integral consiste en eliminar las restricciones de hoy en día de los motores de búsqueda basados en textos y la limitación de los espacios dedicados a las búsquedas», concluye el Sr. Mass.
En realidad, el proyecto SAPIR es uno de los numerosos esfuezos europeos orientados a desarrollar la nueva generación de motores de búsqueda que compitan con el motor de búsqueda más popular del mundo Google, y su rival principal Yahoo.
El proyecto francés, «Quaero», derivado de la palabra latina «Yo busco», se creó en 2005 con el objetivo de dar a los europeos un medio de búsqueda más localizado para los contenidos multimedia. Mientras tanto, el poryecto alemán «Theseus», que debe su nombre al mitológico rey de Atenas que logró escapar del laberinto del Minotauro, aporta otro enfoque centrado en las búsquedas basadas en textos.
Tanto si el moto de búsqueda ganador sea americano o europeo, centrado en la búsqueda de textos o en contenidos multimedia, la carrera para la supremacia en este campo de la innovación podría convertirse en una de las demostraciones más interesantes de la década de la tecnología de la información y la comunicación. |
|