¿Qué son las cámaras de detección de profundidad? Cuántos tipos de cámaras de detección de profundidad

Las cámaras 2D tradicionales solo ven un mundo plano y bidimensional. Pueden reconocer la forma y el color de los objetos, pero no pueden entender su posición, tamaño o distancia en el espacio. Esto limita las capacidades de muchas aplicaciones avanzadas de robótica y automatización. La aparición de cámaras de detección de profundidad ha cambiado esto. Le dan a las máquinas una nueva capacidad de percepción "tridimensional", lo que permite a los sistemas comprender el espacio similar al de los humanos, abriendo un vasto espacio de aplicación para la visión integrada y las soluciones de percepción 3D.

Como consultor especializado en módulos de cámara, este artículo proporcionará un análisis en profundidad de la tecnología de cámara de detección de profundidad, sus tipos principales y sus aplicaciones en robótica, logística y AR/VR. Exploraremos las características de cada tecnología para ayudar a los ingenieros a comprender cómo funcionan las cámaras de detección de profundidad y tomar la decisión más informada para sus proyectos.

¿Qué es una cámara de detección de profundidad y por qué la necesitamos?

A cámara de detección de profundidad, también a menudo denominado cámara 3D, es una cámara que puede capturar información de profundidad para cada píxel de una escena. Emite no solo una imagen RGB tradicional sino también un mapa de profundidad o datos de nubes de puntos. Cada valor de píxel en un mapa de profundidad representa la distancia entre ese punto y la cámara.

Se necesitan cámaras 3D porque las imágenes 2D no pueden resolver un problema central en la visión: ambigüedad espacial. Una cámara 2D no puede distinguir entre un objeto pequeño de cerca y un objeto grande lejos. Además, las variaciones de iluminación, las sombras y las oclusiones pueden hacer que los sistemas de visión 2D fallen. Por ejemplo, un objeto en la sombra puede confundirse con otro objeto o simplemente no detectarse.

What Is A Depth-Sensing Camera

Las cámaras de profundidad abordan perfectamente este problema al proporcionar información de distancia precisa. Proporcionan a las máquinas información geométrica que no se ve afectada por la iluminación, el color y la textura. Esta capacidad de percepción basada en forma 3D permite a las máquinas comprender e interactuar con el mundo real, sentar las bases para la realización de soluciones de percepción 3D de visión integrada.

De todas las tecnologías de detección de profundidad disponibles en la actualidad, las tres más populares y comúnmente utilizadas son:
1. Luz estructurada
2. Tiempo de vuelo
2.1 Tiempo directo de vuelo (DTOF)
2.1.1 lidar
2.2 Tiempo indirecto de vuelo (ITOF)
3. Visión estéreo

A continuación, echemos un vistazo más de cerca a cómo funciona cada una de estas tecnologías de detección de profundidad.

Tres tecnologías convencionales para cámaras de profundidad

Para comprender cómo funcionan las cámaras de detección de profundidad, es importante tener una comprensión profunda de los tipos centrales de tecnología de cámara de profundidad detrás de ellas. Actualmente, hay tres tecnologías principales de cámara de profundidad convencional.

1. Cámara de luz estructurada

Una cámara de luz estructurada es una tecnología de imagen activa. Utiliza un proyector infrarrojo de alta potencia para proyectar un patrón de luz conocido, como un patrón específico que consiste en miles de puntos, en una escena. Luego usa una o más cámaras para capturar la distorsión de este patrón en la superficie de un objeto. Al calcular esta distorsión, la cámara puede inferir la forma y la distancia 3D del objeto.

Esta tecnología proporciona datos de profundidad de alta resolución altamente precisos y de alta resolución, especialmente en rangos cercanos. Su capacidad de medición submilimétrica sobresale en aplicaciones que requieren una medición precisa de los detalles del objeto. Sin embargo, la luz proyectada puede verse afectada por la luz ambiental (especialmente la luz solar fuerte), lo que afecta la precisión de la medición. Además, cuando se usan múltiples cámaras de luz estructuradas en el mismo espacio, sus patrones de proyección pueden interferir entre sí.

2. Cámara de tiempo de vuelo

Las cámaras de tiempo de vuelo, basadas en el principio de la velocidad constante de la luz, emiten luz infrarroja y miden el tiempo que tarda el pulso de luz en reflejarse en el sensor de la cámara. Según esta diferencia de tiempo, la distancia entre el objeto y la cámara se puede calcular con precisión. Este proceso se realiza típicamente en paralelo en cada píxel, lo que permite la captura de profundidad de alta tasa de marco.

Dependiendo del método utilizado para determinar la distancia, TOF se clasifica en dos tipos: tiempo de vuelo directo (DTOF) e tiempo de vuelo indirecto (ITOF).

2.1. Tiempo de vuelo directo (DTOF)

DTOF mide directamente el tiempo de vuelo de un pulso de luz desde la emisión hasta el regreso. Utiliza un sensor dedicado para detectar con precisión el tiempo de llegada de los fotones individuales. Este método de medición directa permite distancias de medición más largas y mayor precisión.

2.1.1.lidar

LiDAR (radar láser) es un tipo de tecnología DTOF. Por lo general, usa un escáner láser para emitir el punto de luz láser por punto en una escena y recibir luz reflejada para generar una nube de puntos de alta precisión. El largo rango de detección de Lidar y la fuerte resistencia a la luz ambiental lo hacen ideal para conducir autónomo y mapeo de alta precisión para robots.

LiDAR

2.2. Indirecto de tiempo de vuelo (ITOF)

ITOF no mide el tiempo directamente. En cambio, transmite una onda de luz modulada continua y mide la diferencia de fase entre la luz reflejada y emitida. Esta diferencia de fase es proporcional al tiempo de vuelo de la luz. Los sistemas ITOF son generalmente más compactos, consumen menos potencia y logran velocidades de cuadros más altas. Son adecuados para aplicaciones interiores de corto alcance, como el reconocimiento de gestos y la autenticación facial.

3. Cámara de visión estéreo

Una cámara de visión estéreo imita la visión binocular humana. Utiliza dos cámaras, montadas a una distancia de línea de base fija, para capturar simultáneamente la misma escena. Utilizando algoritmos complejos, el sistema encuentra los puntos correspondientes en las dos imágenes y, utilizando principios de triangulación, calcula la posición de cada punto en el espacio tridimensional, generando un mapa de disparidad.

Esta tecnología pasiva no requiere una fuente de luz adicional, por lo que es adecuada para uso al aire libre y entornos con amplia luz natural. Proporciona mapas de profundidad de alta resolución que no se ven afectados por el material del objeto. Sin embargo, la visión estéreo es computacionalmente intensiva y requiere un procesador poderoso para realizar la coincidencia de imágenes. También lucha en áreas sin textura (como paredes blancas o superficies de color sólido) porque el algoritmo no puede encontrar puntos de coincidencia.

Propiedad	Luz estructurada	Visión estéreo	Lidar	dtof	ITOF
Principio	Distorsión del patrón proyectado	Comparación de imágenes de cámara dual	Tiempo de vuelo de la luz reflejada	Tiempo de vuelo de la luz reflejada	Cambio de fase del pulso de luz modulado
Complejidad del software	Alto	Alto	BAJO	BAJO	Medio
Costo	Alto	BAJO	Variable	Bajo	Medio
Exactitud	A nivel de micrómetro	A nivel de centímetro	Dependiente del rango	Milímetro a centímetro	Milímetro a centímetro
Rango operativo	Corto	~ 6 metros	Altamente escalable	Escalable	Escalable
Rendimiento de poca luz	Bien	Débil	Bien	Bien	Bien
Rendimiento al aire libre	Débil	Bien	Bien	Moderado	Moderado
Velocidad de escaneo	Lento	Medio	Lento	Rápido	Muy rápido
Compacidad	Medio	Bajo	Bajo	Alto	Medio
Consumo de energía	Alto	Bajo a escalable	Alto a escalable	Medio	Escalable a medio

¿Cuáles son los escenarios principales de la aplicación de las cámaras de profundidad?

La tecnología de cámara 3D se ha mudado del laboratorio al uso comercial, y sus diversas capacidades están revolucionando varias industrias.

1. Robótica y automatización

Las cámaras de profundidad para la robótica sirven como los "órganos de percepción espacial" de los robots. En las líneas de producción automatizadas, los robots deben identificar y comprender con precisión las piezas de trabajo apiladas aleatoriamente las cámaras . 3 D pueden generar datos de nubes de puntos altamente precisos, lo que ayuda a los robots a comprender la pose y la posición tridimensionales de los objetos, lo que permite una absorción, clasificación y ensamblaje precisas, mejorando significativamente la eficiencia de producción y la flexibilidad.

Robotics And Automation

2. Realidad aumentada (AR) y realidad virtual (VR)

Los dispositivos AR/VR requieren una conciencia ambiental en tiempo real para integrar a la perfección los objetos virtuales en el mundo real. Las cámaras de profundidad pueden realizar un escaneo tridimensional de la habitación del usuario y generar un mapa de profundidad preciso. Esto permite que los objetos virtuales se coloquen con precisión en una mesa o ocultos detrás de objetos reales, mejorando significativamente la experiencia inmersiva e interactiva del usuario.

3. Logística y gestión de almacén

El almacenamiento automatizado, la medición del volumen del paquete y la paletización son los requisitos centrales en la industria de la logística.Cámaras 3DPuede medir rápidamente el volumen y el peso de los paquetes para optimizar la carga de camiones. En los almacenes automatizados, pueden guiar a los robots para elegir con precisión y colocar artículos de los estantes y realizar recuentos de inventario, lo que permite una gestión eficiente de almacenes.

4. Atención médica y biometría

En el campo de la salud, las cámaras 3D se pueden usar para la medición del cuerpo sin contacto, el análisis de postura y la planificación quirúrgica. A través del escaneo 3D, las cámaras de profundidad pueden generar modelos humanos para prótesis personalizadas y ortóticas. En biometría, pueden identificar una geometría facial única para proporcionar una autenticación más segura y evitar la suplantación de fotos o videos.

Resumen

Las cámaras de detección de profundidad representan un avance tecnológico significativo en el campo de visión integrada. Ya sea luz estructurada, tiempo de vuelo o visión binocular, cada tecnología ofrece soluciones únicas para la percepción 3D. Comprender los principios y características de estos tipos de cámara de profundidad y seleccionarlos con precisión en función del escenario de aplicación (como cámaras de profundidad para la robótica) es esencial para cada ingeniero de visión artificial. Las cámaras de profundidad potencian a las máquinas con la capacidad de percibir el mundo tridimensional y están impulsando una transformación profunda de la automatización a la inteligencia.

MuchVision le ayuda a seleccionar una cámara de profundidad

¿Estás luchando por elegir la cámara de profundidad adecuada para tu proyecto?Póngase en contacto con nuestro equipo de expertos hoyPara consultoría de soluciones de visión integrada y de percepción 3D, ayudándole a construir el mejor sistema de visión artificial para su aplicación.