Aviso: para depositar documentos, por favor, inicia sesión e identifícate con tu cuenta de correo institucional de la UCM con el botón MI CUENTA UCM. No emplees la opción AUTENTICACIÓN CON CONTRASEÑA
 

Aceleración HW de algoritmos de disparidad binocular

Loading...
Thumbnail Image

Official URL

Full text at PDC

Publication date

2012

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Citations
Google Scholar

Citation

Abstract

Dentro de la visión por computador, el campo de la visión estereoscópica es un campo muy amplio y muy estudiado en los últimos años. En este campo se estudia la aproximación de manera el una escena tridimensional a partir de dos o más imágenes bidimensionales. Tal y como ocurre en los seres vivos, los ojos están desplazados a una cierta distancia, las cámaras también se deben separar cierto espacio. La computadora debe analizar las imágenes y determinar qué pixel de una corresponde a qué pixel de otra. La distancia entre ellos se conoce como disparidad, y es medida en píxeles. A partir de la disparidad se puede obtener la profundidad de ese punto en la escena tridimensional. Actualmente existen multitud de algoritmos, unos aproximan la escena mejor que otros, pero la mayoría tiene un problema crucial: no llegan a computar la imagen tridimensional en tiempo real y si llegan suele ser a costa de una pérdida en la calidad de la imagen nal o utilizando procesadores del segmento más alto. Nuestro proyecto esta orientado a buscar una solución a este problema paralelizando por hardware el cómputo de las funciones más pesadas (en términos de tiempo) de un algoritmo estereoscópico que proporcione imágenes tridimensionales de calidad. Para ello, utilizaremos la potencia de proceso de las GPUs (unidades de procesamiento gráco) a través de la interfaz de programación que proporciona OpenCL (Open Computing Language). [ABSTRACT] Inside computer vision, stereoscopic vision is a very wide eld and it has been deeply studied in the last years. The main objetive in this eld is to approach, in a faithful way, a 3D scene from two or more 2D images. As it happens with living beings, in which the eyes are placed at a certain distance, cameras must be also placed keeping some space. The computer has to analyze both images and determine which pixel from the rst, matches a pixel in the second image. The distance between those pixels is called disparity, and it's measured in pixels. Based on the disparity of a pixel and knowing the geometry of the cameras, the depth of that pixel, in the 3D scene, can be computed. Nowadays, there are lots of stereo algorithms, some approaches are better than others, but most have the same problem: they can't compute the 3D scene in real time and, if they do, they do it at the price of lower quality or, by computing with top processors. Our project tries to nd a solution to this problem parallelizing by hardware the computation of the heavier functions (speaking in time) of an stereo algorithm which estimates a 3D scene with good quality. To this end, we will use the computational power of the GPUs (Graphics Processing Units) through the API provided by OpenCL (Open Computing Language).

Research Projects

Organizational Units

Journal Issue

Description

Proyecto de Sistemas Informáticos (Facultad de Informática, Curso 2011-2012)

UCM subjects

Unesco subjects

Keywords