Cámaras TOF en comparación con otra cámara de profundidad 3D: ¿Cómo elegir?

Nowadays, whether it is face recognition, intelligent robots or autonomous driving, they all rely on the depth perception of the surrounding environment. To this end, a series of advanced 3D depth perception technologies have emerged, including mainstream ones such as ToF cameras, structured light cameras, stereo vision cameras and LiDAR. So, I believe everyone has had such a question when choosing a Cámara de profundidad 3D: ¿Qué cámara 3D satisface mis necesidades? ¿TOF u otras cámaras de profundidad 3D?

Entonces, en este artículo, comprenderemos profundamente las características y diferencias entre TOF y otras cámaras de profundidad 3D, y por qué TOF es más popular que otras cámaras de profundidad 3D .

¿Qué es la percepción de profundidad 3D? El mapeo de profundidad 3D, también llamado detección de profundidad o mapeo 3D, crea una imagen de un espacio tridimensional o objeto objetivo midiendo la distancia entre el sensor y cada punto en el entorno circundante . La tecnología implica proyectar luz en el objeto del obturador y capturar la luz reflejada con una cámara o sensor .}

Luego, al analizar el tiempo o el patrón de las reflexiones, la distancia entre la cámara y las diferentes partes de la escena se calcula para crear un mapa de profundidad . El mapa de profundidad es esencialmente una representación digital de cuán lejos está cada parte de la escena desde la perspectiva del sensor .

3D depth camera module

Se debe precisamente a esta característica de las cámaras de profundidad 3D que ha desempeñado un papel inconmensurable en múltiples industrias . Entonces, antes de comparar TOF y otras tecnologías de mapas 3D, echemos un vistazo a sus características una por una .

En artículos anteriores, hemos aprendido que el tiempo de vuelo es simplemente el tiempo que tarda la luz en alcanzar un objeto, reflexionar y regresar al sensor . a través de esta medida, una cámara TOF puede determinar la distancia de varios objetos en la escena desde sí mismo . Los componentes principales de una cámara TOF incluyen el sensor TOF y el modulador del sensor, que capturan la luz reflejada luz y la luz de reflexión y la luz de reflexión y la luz de los datos de la cámara. proceso .

Por lo general, utilizan fuentes de luz como VCSEL o LED que emiten luz en el espectro de infrarrojo cercano (NIR) . Además, el sensor de profundidad procesa estos datos sin procesar, filtrando el ruido y otras inexactitudes para proporcionar información clara de profundidad .

El principio de funcionamiento de una cámara TOF es como un "Ransfinder de eco de luz" . emite un pulso de luz conocido (generalmente luz infrarroja), y luego mide con precisión el tiempo que toma para que el pulso de la luz se refleje por el objeto . basado en la velocidad de que la velocidad de la luz está constante, la distancia de la luz se puede calcular la profundidad, allí, la información de la profundidad, allí, para que se genere la profundidad de la profundidad, el punto de la profundidad de la profundidad, allí, para que se genere la profundidad de la profundidad, el punto de la profundidad de la profundidad, el punto de la profundidad, el principio, el punto de la profundidad, el punto de la profundidad, el punto de la profundidad, el punto de la profundidad, los puntos de la profundidad de la distancia. escena .

Sus ventajas son un fuerte rendimiento en tiempo real y la capacidad de obtener rápidamente mapas de profundidad; tamaño compacto y consumo de energía relativamente bajo; baja dependencia de la textura superficial del objeto objetivo, y puede funcionar incluso en superficies de textura débil .

Para obtener más detalles sobre las cámaras TOF, lea:Sensor TOF: principio de funcionamiento y análisis de componentes centrales.

La visión estéreo imita la forma en que funciona el ojo humano, y la disparidad estéreo se refiere a la diferencia en la posición de la imagen de un objeto visto por los ojos izquierdo y derecho . Utiliza dos (o más) cámaras para capturar simultáneamente las imágenes de la misma escena desde las perspectivas ligeramente diferentes . El sistema utiliza el principal de la triangulación a la profundidad de una escena de una escena ligeramente diferente. Las dos imágenes, es decir, la diferencia en la posición relativa del objeto en las dos imágenes, combinadas con los parámetros geométricos de la cámara (como la distancia de línea de base) . son necesarios para esto:

Base:Esta es la distancia entre las dos cámaras (aproximadamente 50–75 mm - distancia del alumno) .
Resolución:Proporcional a la profundidad . Cuanto más se buscan píxeles, mayor será el número de niveles de disparidad (pero la carga computacional también es más alta) .

La longitud focal es proporcional a la profundidad de campo . más corta es la distancia focal, más lejos puede ver, pero el campo de visión también se reducirá . a cuanto mayor sea la distancia focal, más cercana la profundidad de campo y mayor es el campo de visión .} Las cámaras de visión estereo se basan en esta tecnología {.}}}}

Las ventajas de esta tecnología son que es un costo relativamente bajo, especialmente cuando no se requiere una fuente de luz activa; puede capturar imágenes de color e información de profundidad .

La tecnología de luz estructurada proyecta patrones de luz conocidos, como puntos, rayas o patrones codificados, en una escena, y luego usa una cámara para capturar la distorsión de estos patrones en la superficie de un objeto debido a los cambios de profundidad . analizando estas distorsiones y utilizando el principal de la triangulación, el sistema puede calcular con precisión la forma tridimensional y la profundidad de la información del objeto {{2 {2} {2}

Las cámaras de luz estructuradas también se basan en esta tecnología, utilizando patrones proyectados especialmente diseñados para mejorar la capacidad de la cámara para identificar y medir los cambios en la superficie que ilumina . procesando cambios en la distorsión de los patrones para calcular la distancia desde la cámara a cada punto en la superficie del objeto, se crea un mapa 3D del objeto .

how Structured Light Imaging

Esto puede proporcionar una precisión de profundidad muy alta a corta distancia (generalmente dentro de 1 metro), especialmente adecuado para aplicaciones con detalles ricos, como escaneo 3D, reconocimiento de gestos, etc. .

LiDAR works in a similar way to ToF, and also determines distance by emitting laser beams and measuring their flight time. But unlike ToF cameras, which usually capture the depth of an area, LiDAR systems usually emit discrete laser beams and scan them to build an extremely detailed, high-resolution point cloud map. Depending on the type, LiDAR can be divided into mechanical (with piezas giratorias) y estado sólido .

Las ventajas de esto son las largas distancias de detección, hasta cientos de metros; Precisión extremadamente alta, especialmente adecuada para la percepción ambiental a gran escala y el mapeo de alta precisión; y excelente rendimiento en una fuerte luz al aire libre .

Cada cámara de tecnología de imágenes 3D tiene sus propias ventajas y desventajas . a continuación, usamos un gráfico para comparar la diferencia entre las cámaras TOF y otras cámaras de visión estéreo 3D .

Dimensión de funciones	TOF Camera (tiempo de vuelo)	Luz estructurada	Visión estéreo	Lidar
Principio de trabajo	Mide el tiempo de ida y vuelta de los pulsos de luz	Proyectos de patrón conocido, analiza la distorsión para calcular la profundidad	Configuración dual o de múltiples cámaras, calcula la profundidad a través de la disparidad	Escaneos y emiten vigas láser, mide el tiempo de vuelo
Exactitud	Milímetro a nivel de centímetro	Nivel de micrómetro a milímetro (excelente a corta distancia)	Nivel de centímetro (altamente afectado por la textura, la distancia)	Nivel de milímetro a centímetro (alta precisión a largas distancias)
Distancia de detección/rango	Rango medio a corto (varios metros a decenas de metros)	Rango corto (típicamente dentro de 1 metro)	Rango medio a corto (afectado por la línea de base)	Largo alcance (decenas a cientos de metros)
Adaptabilidad de la luz ambiental	Iluminación activa, cierta anti-interferencia; El rendimiento se degrada con una fuerte luz directa	Iluminación activa, patrones fácilmente "lavados" por la luz solar fuerte	Pasivo, se basa en gran medida en la luz y la textura ambientales; pobre rendimiento con poca luz	Iluminación activa, fuerte resistencia a la luz ambiental
Rendimiento al aire libre	El desafío es la interferencia infrarroja de la luz solar; Requiere procesamiento adicional	Propenso a la interferencia de la luz solar	Se basa en la luz natural; La falta de textura es un problema	Por lo general, realiza el mejor aire libre
Complejidad computacional	Salta directamente la profundidad, relativamente baja	Requiere análisis de deformación del patrón, complejidad media	Requiere coincidencia de características complejas, alta complejidad	Gran volumen de datos, pero el procesamiento de la nube de puntos es relativamente directo
Tamaño y complejidad	Por lo general, la mayoría de las piezas mecánicas	Incluye proyector y cámara, tamaño moderado	Dos cámaras, tamaño moderado	Por lo general, más grandes, algunos con piezas giratorias mecánicas
Costo	Relativamente rentable	Medio	Más bajo (si usa cámaras existentes)	Generalmente más alto
Aplicaciones típicas	Detección de AR/profundidad móvil, evitación de obstáculos del robot, reconocimiento de gestos, monitoreo en el automóvil	Desbloqueo de reconocimiento facial, medición de precisión, inspección industrial	Navegación de robot, evitación de obstáculos de drones, AR/VR (en escenas texturizadas)	Conducción autónoma, mapeo de alta precisión, ciudades inteligentes

La tabla anterior nos da una comprensión preliminar de las diferencias entre las cámaras TOF y otras cámaras de profundidad 3D . Entonces, ¿por qué las cámaras TOF son una mejor opción para la medición 3D? Hemos resumido los siguientes factores:

Mayor precisión de la imagen:Debido a la dependencia de la iluminación precisa de la fuente de luz, las cámaras TOF proporcionan una mejor salida de calidad de imagen .
Complejidad de software reducido:Las cámaras TOF proporcionan datos de profundidad directamente desde el módulo, evitando situaciones complejas, como ejecutar algoritmos de coincidencia de profundidad en la plataforma host .
Escalabilidad de mayor profundidad:Las cámaras TOF tienen un rango de profundidad escalable con el número de VCSEL utilizados para la iluminación .
Mejor rendimiento de poca luz:Las cámaras TOF funcionan mejor en condiciones de poca luz debido a fuentes de luz activas y confiables .
Tamaño compacto:Debido a que el sensor y la iluminación se pueden colocar juntos, las cámaras TOF tienen un factor de forma más compacto .

Mobile AR (realidad aumentada)/efecto de profundidad de foto:Los teléfonos móviles deben ser delgados, ligeros, de baja potencia y capaces de capturar información de profundidad en tiempo real . Las cámaras TOF son ideales debido a su pequeño tamaño, buen rendimiento en tiempo real y baja dependencia de la textura .
Reconocimiento de gestos/posicionamiento espacial en auriculares VR/AR:El seguimiento de gestos de gestos en tiempo real y la percepción del entorno interior también se requieren . Las cámaras TOF pueden proporcionar datos de profundidad de baja latencia, que son muy adecuadas para tales aplicaciones interactivas .
Monitoreo del controlador/Reconocimiento de gestos:Por lo general, se usa en el automóvil para distancias cortas, con requisitos para el rendimiento en tiempo real, el tamaño y el costo . Las cámaras TOF son una solución muy adecuada .
Reconocimiento/clasificación de objetos:Identifique la forma, el tamaño y la posición de los objetos para que los robots puedan agarrarlos y clasificarlos . Las cámaras TOF pueden proporcionar rápidamente información de contorno tridimensional de objetos .

The use of Lidar in intelligent driving

Para obtener más información sobre el papel de los módulos de cámara en aplicaciones específicas, lea:

¿Qué es un módulo de cámara de enfoque automático? ¿Cómo funciona?

¿Qué es un módulo de cámara con poca luz? entender en profundidad

Para obtener más información sobre los sistemas de visión artificial, lea:

Visión incrustada vs . Visión artificial: comprender las diferencias clave

Enfrentados con una variedad de tecnologías de detección de profundidad 3D, debemos entender cómo elegir la que se adapte a las necesidades de nuestro proyecto . Aquí hay algunas consideraciones clave:

Requisitos de aplicación claros:Este es el primer y más crítico paso .
Requisitos de precisión:¿Su aplicación requiere a nivel de milímetro, nivel de centímetro o menor precisión?
Distancia de detección:¿Necesita detectar una distancia cercana (decenas de centímetros), distancia de mediana (varios metros) o larga distancia (decenas de metros o más)?
Condiciones ambientales:¿Trabajará su sistema en interiores, al aire libre, con una luz fuerte, con poca luz o en completa oscuridad?
Requisitos en tiempo real:¿Qué tan rápido deben actualizarse los datos?
Características del objeto objetivo:¿El objetivo es transparente, reflectante, rico en textura o suave y sin textura?
Salida de datos:¿Necesita un mapa de profundidad, nube de puntos u otro formato?
Considere las limitaciones del presupuesto y el tamaño:El costo y el tamaño físico son a menudo factores que no se pueden ignorar en proyectos reales . Algunas soluciones de alta precisión y larga distancia pueden ser costosas y voluminosas .
Evaluar la complejidad del procesamiento de datos y la dificultad de desarrollo:Algunas tecnologías pueden generar cantidades masivas de datos, que requieren recursos informáticos más potentes y algoritmos más complejos para procesar .
Prueba y verificación:Prueba y verificación prototipo en sus escenarios de aplicación reales tanto como sea posible es la mejor manera de evaluar el rendimiento y la viabilidad de la tecnología .

Al elegir un módulo de cámara, el tipo de interfaz, el proveedor, los requisitos de personalización, etc. . también son importantes . por favor lea:

¿El factor para elegir la interfaz correcta para un sistema de visión integrada?

Cómo elegir el módulo de cámara ideal para su sistema de visión: una guía paso a paso

Módulos de cámara estándar vs . módulos de cámara personalizados: cómo elegir el ajuste correcto

¿Qué son los módulos de cámara OEM? Comprensión de las soluciones personalizadas para fabricantes de productos

Las ventajas de elegir módulos de cámara personalizados para el desarrollo de productos

En el campo de la percepción de profundidad 3D, ninguna tecnología única es una panacea . cámaras TOF, luz estructurada, visión estéreo y LiDAR, cada una tiene ventajas técnicas únicas y escenarios aplicables . TOF brilla en aplicaciones de corto y medio de alcance con su tiempo real y compacto; La luz estructurada es inigualable con precisión de corto alcance; Stereo Vision proporciona soluciones flexibles con su rentabilidad y características pasivas; y LiDAR domina en entornos al aire libre complejos con su larga distancia y alta precisión . Tenemos que tomar decisiones basadas en las necesidades reales del proyecto .

Por supuesto, si tiene problemas para encontrar una cámara de imagen 3D adecuada,Póngase en contacto con nosotros .MuchVision tiene más de diez años de experiencia en el campo de la visión integrada y ha fabricado muchos módulos de cámara de alto rendimiento, incluidos módulos para cámaras de medición 3D . Creo que con nuestro equipo profesional de ingenieros, podemosEncuentra la solución adecuada para ti.

P1: ¿TOF y LiDAR son lo mismo?
A1:No exactamente . tof (tiempo de vuelo) es un principio de medición de distancia, y lidar (láser radar) es un sistema que aplica el principio tof {{1 1}} Todos los lidars usan los principios de TOF para medir la distancia, pero los sensores de tof y las cámaras tof generalmente se refieren a soluciones más compactas y más bajas, a menudo se usan en escenarios de distancia Shorter de la distancia Shorter. se refiere a sistemas que emiten y escanean vigas láser y construyen nubes de alta densidad para lograr mediciones de alta precisión a largas distancias (como para la conducción autónoma) . Puede comprender que LiDAR es una aplicación de alta gama de los principios TOF en sistemas más complejos y más grandes .

P2: ¿Qué sensor de profundidad 3D es el más preciso?
A2:Depende de la distancia . a distancias muy cercanas (decenas de centímetros a 1 metro), la luz estructurada generalmente proporciona la precisión de profundidad más alta, hasta micras o incluso niveles de submilímetro . a distancias medianas y cortas (varios metros a tensos de metros), las cámaras TOF pueden proporcionar datos de profundidad de tiempo real en el centímetro de centímetro a un centímetro a un centímetro a un centímetro de centímetro (5}}}}}} Distancias (decenas a cientos de metros), Lidar puede mantener una excelente precisión de milímetro a centímetro y obtener nubes de puntos de alta densidad .

P3: ¿Cuál es mejor para uso en exteriores, luz estructurada o TOF?
A3:En general, las cámaras TOF funcionan mejor que la luz estructurada en una luz al aire libre fuerte . La tecnología de luz estructurada se basa en patrones proyectados, que se pueden "lavar fácilmente" o sumergirse por la luz ambiental en una fuerte luz solar, lo que resulta en un reconocimiento inexacto . Aunque las cámaras de TOF también se ven afectadas por el componente infarido de Sunlight, son relativamente más solares. Optimización . lidar funciona mejor al aire libre porque generalmente usa láseres de mayor potencia y tecnología de filtrado más avanzada .