Machine Vision con tecnologie 3D

Le tecnologie 3D vengono utilizzate quando è necessario analizzare le caratteristiche geometriche dell’oggetto. I pixel delle immagini acquisite con tali tecnologie sono tridimensionali poiché comprendono anche l’informazione di profondità (z) oltre alle coordinate spaziali (x e y).

Grazie alle tecnologie 3D è possibile stimare la forma e la posizione 3D reale dell’oggetto nello spazio.
Tutte le applicazioni di visione artificiale possono trovare vantaggio nell’analisi della terza dimensione dell’oggetto.

Le tecnologie 3D si differenziano in:

  • Tecnologie a scansione: l’oggetto viene acquisito scansionando l’oggetto in movimento oppure muovendo la telecamera. La mappa di superficie tridimensionale si ottiene quindi per composizione, profilo dopo profilo, grazie al software che estrae l’informazione di altezza dall’elaborazione delle immagini.
  • Tecnologie con immagine istantanea: viene acquisita e utilizzata una singola immagine dell’intero oggetto per ricostruire la struttura 3D. Tali tecniche non richiedono alcun movimento dell’oggetto o della telecamera.

Sistemi di visione 3D con Triangolazione Laser

Un laser proietta una linea luminosa sulla scena inquadrata dalla telecamera, in modo tale che le immagini acquisite contengano le linee date dall’intersezione tra il piano del laser e le superfici degli oggetti.

Conoscendo l’equazione del piano del laser e la posizione della telecamera, attraverso un procedimento di triangolazione, si ottengono le informazioni necessarie per stabilire le coordinate spaziali (x,y) e la quota (z) dei punti P appartenenti alla linea proiettata sulla superficie dell’oggetto.

Effettuando una scansione dell’oggetto, quindi acquisendo più immagini della linea laser che si muove sulla superficie dell’oggetto, è possibile ricostruire la struttura 3D dell’oggetto scansionato.

Sono possibili diverse configurazioni per effettuare la triangolazione laser.

È possibile scansionare l’oggetto in movimento con il laser fermo in una posizione fissa oppure far muovere il laser sulla superficie dell’oggetto fermo.

A seconda delle caratteristiche superficiali degli oggetti è possibile posizionare la coppia telecamera-laser secondo 3 configurazioni differenti:

Le coordinate spaziali e le quote dei punti estratti saranno espressi in pixel. Per convertirle in millimetri occorrerà effettuare una procedura di calibrazione.

I principali vantaggi di questa tecnica sono:

  • sostanziale indipendenza dai colori degli oggetti;
  • indipendenza dalla struttura superficiale dell'oggetto (texture);
  • le immagini ottenute sono “dense”, cioè si ottengono le informazioni tridimensionali di tutta la superficie degli oggetti;
  • risoluzione e precisione adeguata alle applicazioni di guida robot anche per grandi aree di lavoro.

Questi vantaggi rendono la scansione laser uno dei metodi preferiti per ottenere immagini tridimensionali in ambito industriale.

Il nostro sistema di visione guida robot per il prelievo di pezzi alla rinfusa in cassetta effettua la ricostruzione tridimensionale degli oggetti utilizzando una tecnica 3D a scansione laser.

Luce strutturata per sistemi di visione 3D

La luce strutturata è una proiezione di un pattern di luce (piano, griglia, ecc..) su una superficie, quindi non una luce uniforme. Una o più telecamere osservano le deformazioni del pattern sulla superficie e sfruttando le informazioni geometriche della luce si estraggono le informazioni geometriche dalla scena illuminata.

La nostra azienda ha sviluppato un sistema di ispezione automatizza per la ricerca del cordone di saldatura che sfrutta la tecnica della luce strutturata per la ricostruzione 3D.

Vantaggi:

  • Precisione molto alta;
  • Ottima per oggetti statici: componenti meccanici ed elettronici;
  • 3D ricco e dettagliato: la mappa dei punti 3D ricavata da questa tecnica è ad alta densità;

Svantaggi:

  • Non adatta se oggetti sono in movimento ad alta velocità;
  • Sensibile alla luce ambiente;
  • Problemi su superfici lucide o trasparenti;
  • Proiezione limitata dalla geometria: angoli di osservazione troppo stretti deformano eccessivamente il pattern;

Stereo Vision nei sistemi di visione artificiale

La visione stereoscopica (stereo vision) è una tecnologia che usa due o più telecamere da punti di vista diversi per catturare la stessa scena, simulando la visione binoculare umana.

Vengono acquisite immagini allo stesso istante della stessa scena e viene trovata la corrispondenza tra i punti di interesse delle diverse immagini. Calcolando la disparità tra le due immagini (cioè la differenza di posizione tra i punti) è possibile trovare la profondità di ciascun punto.

Viene quindi costruita una nuvola di punti 3D della scena inquadrata dalle telecamere.

Nel sistema di visione industriale per la sugnatura automatica dei prosciutti viene utilizzata la tecnologia stereo vision per la ricostruzione tridimensionale completa della superficie del prodotto, anche in presenza di forme irregolari e texture complesse.

Sensori di visione Time-of-Flight (TOF)

I sensori Time-of-Flight acquisiscono informazioni 3D misurando il tempo impiegato dalla luce emessa (di solito LED o laser modulati) per raggiungere l’oggetto e tornare al sensore. Ogni pixel del sensore misura un ritardo di fase o un tempo di ritorno, generando una mappa di profondità in tempo reale.
I sistemi ToF sono particolarmente adatti a contesti dinamici, grazie alla capacità di ricostruire scene 3D complete in un singolo scatto, permettendo una percezione volumetrica immediata.

Photometric Stereo in ambito Machine Vision

Con la tecnica del photometric stereo si ricostruisce la struttura tridimensionale di un oggetto acquisendo più immagini con la stessa camera ma sotto differenti angoli di illuminazione. Analizzando come la superficie riflette la luce nelle diverse condizioni di illuminazione, è possibile ricostruire la struttura 3D dell’oggetto.

Questa tecnica è particolarmente adatta per rilevare piccoli difetti come graffi, piccole incisioni o bolle difficilmente visibili con altre tecniche.

Non nasce come tecnica metrologica assoluta per ottenere precise misure, ma come tecnica per rivelare forma e difetti con sensibilità estrema.

È possibile applicare questa tecnica sia con sensori di visione matriciali che con sensori di visione lineari.
Campi di applicazione:

  • Pneumatici e gomme: incisioni, bolle, difetti di stampo, micro-crepe, rilievi del battistrada, scritte in rilievo sul fianco
  • Metalli: graffi, ammaccature, ondulazione, segni di lavorazione

Sistemi di visione per ricostruzione tridimensionale basata sul deep learning

Il deep learning in ambito machine vision è l’insieme di tecniche basate su reti neurali che permettono ai sistemi di visione di riconoscere difetti, oggetti, pattern e caratteristiche complesse in modo automatico, adattivo e altamente accurato, superando i limiti degli algoritmi tradizionali.

Nel caso dei sistemi di visione 3D si utilizzano reti neurali per stimare la profondità o una nuvola di punti partendo da immagini RGB o IR, senza hardware 3D dedicato.

A differenza delle tecniche tradizionali non sono necessari laser, proiezioni di pattern, sensori TOF e può funzionare anche utilizzando una sola immagine acquisita da una singola telecamera.

Le reti neurali imitano il comportamento dell’occhio umano che ricostruisce la profondità usando indizi visivi come ombre, texture, contorni, riflessi, imparando quindi la relazione tra immagine 2D e profondità 3D.

Richiedi informazioni: preventivo gratuito con studio di fattibilità sui campioni