Safe&Healthy: la nostra formula basata sull’Intelligent Video Analytics
Durante la recente pandemia, come uomini e donne, siamo stati tutti chiamati a confrontarci con nuove domande che imponevano una seria riflessione. Anche all’interno di beanTech ci siamo interrogati sui nuovi scenari che si prospettano per il futuro prossimo e abbiamo cercato di capire come potevamo supportare i nostri clienti, aiutandoli ad affrontare la ripresa delle loro attività nelle migliori condizioni di sicurezza.
Una risposta pronta e immediata è subito stata intrapresa dalla business unit IT Infrastructures che si è adoperata per offrire soluzioni di consulenza, formazione e fornitura di hw e sw per abilitare lo smart working. Parallelamente, il Team AI di beanTech ha suggerito un utilizzo alternativo del proprio know-how puntando ad un obiettivo etico e applicando al tema “Sicurezza” alcune soluzioni e tecnologie validate in ambito Quality Control.
beanTech sta quindi sviluppando un framework “Safe&Healthy“: si tratta di una architettura modulare per Intelligent Video Analytics, basata su tecnologie di AI e MV e applicabile anche su telecamere già esistenti, che supporta le aziende nel promuovere una sana cultura della Sicurezza in Impianto, garantendo la salute delle persone presenti e aiutando a verificare il rispetto delle norme di sicurezza.
Alcuni degli obiettivi considerati sono stati i seguenti:
- verifica della distanza tra le persone;
- verifica della distanza di rispetto da linee produttive e macchinari in funzione;
- verifica dell’uso dei DPI;
- verifica di accessi in zone vietate;
- controllo di zone remote o non presidiate.
Dal punto di visto tecnico, la soluzione si articola attraverso i seguenti moduli:
- Calibrazione ambientale
Utilizzando, in linea di principio, una singola telecamera che inquadra la scena con prospettiva, è necessario ricostruire la scena attraverso un procedura ben nota in letteratura, la stima della matrice di omografia. In pratica, è sufficiente considerare quattro punti noti (meglio se di più) nella scena inquadrata e le loro rispettive distanze per poter ricostruire in modo accurato la scena con vista ortogonale (a volo d’uccello).
Come si nota nel video di fabbrica, sono stati posti alcuni riferimenti (paletti bicolori) che sono stati utilizzando nella fase di calibrazione.
- Detection
Si analizzano i frame del video utilizzando una rete convoluzionale di object detection (MobileNet SSD) per individuare le persone presenti nella scena; per irrobustire la ricerca, i risultati sono stati validati utilizzando il classico algoritmo di NMS per evitare false rilevazioni mentre, per alleggerire il carico computazionale, sono state anche sfruttate alcune tecniche di tracking.
Dopo aver individuato le persone presenti nella scena, è possibile applicare l’analitica desiderata:
- “Distanze sociali” – Si considera il Bounding Box delle persone, e si considera la mezzeria del lato inferiore quale punto di contatto con il piano di calibrazione. A questo punto è sufficiente applicare la proiezione prospettica per ottenere il punto corrispondente nella visione a volo d’uccello. In questo modo si possono calcolare le distanza tra le diverse persone presenti nella scena.
- Analitica “Zone pericolose” – Sfruttando eventuali annotazioni definite in fase di configurazione (luoghi non presidiati, macchinari pericolosi, …) viene verificata la presenza di persone in tali aree e la loro distanza da zone considerate a rischio.
- Analitica “DPI” – Dove la risoluzione lo consenta o dove siano disponibili telecamere PTZ, è possibile dettagliare su particolari quali il volto delle persone per verificare la presenza di DPI obbligatori come ad esempio elmetti o mascherine.
- “Distanze sociali” – Si considera il Bounding Box delle persone, e si considera la mezzeria del lato inferiore quale punto di contatto con il piano di calibrazione. A questo punto è sufficiente applicare la proiezione prospettica per ottenere il punto corrispondente nella visione a volo d’uccello. In questo modo si possono calcolare le distanza tra le diverse persone presenti nella scena.
- Analitica “Zone pericolose” – Sfruttando eventuali annotazioni definite in fase di configurazione (luoghi non presidiati, macchinari pericolosi, …) viene verificate la presenza di persone in tali aree e la loro distanza da zone considerate a rischio.
- Analitica “DPI” – Dove la risoluzione lo consenta, o dove siano disponibili telecamere PTZ, è possibile dettagliare su particolari quali il volto delle persone per verificare la presenza di DPI obbligatori come ad esempio elmetti o mascherine.
*I video “Safe&Healty: PETS 2009 – test 01/02/03” mostrano alcuni risultati ottenuti sul dataset pubblico PETS2009.