Video analisi: diffidate dalle imitazioni!
Transcript
Video analisi: diffidate dalle imitazioni!
32 domotica e sicurezza aggiorniamoci aprile 2014 n. 4 Gianluca Algeri Direttore generale FGS Brescia (San Zeno Naviglio, BS) Video analisi: diffidate dalle imitazioni! La video analisi è una tecnologia che ad oggi sta progredendo velocemente ed è in grado di fornire soluzioni di enorme valore. È un importante driver nel mercato della videosorveglianza ma è necessario, per il bene del settore, avere una chiara consapevolezza di quali possano essere, nel dettaglio, le sue caratteristiche e le sue potenzialità. Fantascienza cinematografica, audaci produttori di sicurezza e un mercato troppo spregiudicato continuano a creare confusione e a illudere gli utenti finali, dando origine a improbabili aspettative che, nella maggior parte dei casi, vengono puntualmente deluse. In quanti possono affermare di conoscere la differenza tra videoanalisi e motion detection? Quali sono le caratteristiche alla base delle due tecnologie? Cosa si può realmente arrivare ad ottenere, oggi, tramite l’utilizzo di un sistema di video analisi? Motion detection: rilevare ciò che si muove Il motion detection è una tecnologia che nasce con l’obiettivo di fare compressione di flussi video, non comprensione di ambiente. Il suo meccanismo di base si fonda generalmente sul confronto di pixel in immagini consecutive e/o con un’immagine considerata di sfondo di riferimento; solo i pixel modificati nell’immagine visualizzata, rispetto alla precedente, vengono trasmessi, mentre per gli altri è sufficiente inviare l’indicazione che non sono variati, con la conseguente riduzione dei dati da riportare e senza il rischio di perdere la qualità dell’informazione. È quindi corretto dire che il motion detection rileva un cambiamento nel momento in cui una persona fa il suo ingresso in una scena, perché in essa cambiano i pixel relativi all’immagine che funge da sfondo. Ma quando ci si trova in ambienti esterni, con pioggia, neve, vento, alberi, fontane, riflessi di luce e piccoli animali, tutti i movimenti insignificanti e non desiderati vengono inevitabilmente rilevati dal motion detection, che si limita a riconoscere le sole differenze a livello di pixel provocando centinaia di falsi allarmi. Manca uno standard di valutazione Possiamo paragonare l’evoluzione della video analisi a quella dei computer della metà degli anni 80: il loro valore funzionale, al tempo, era enorme rispetto alle tecnologie esistenti, ma naturalmente da essi non ci si poteva, né ci si doveva, aspettare prestazioni e funzionalità paragonabili a quelle dei pc odierni. La differenza è invece, per rimanere nella metafora, che nel mercato della video analisi c’è chi vende il ‘commodore64’ Video analisi: rilevare i movimenti anomali La video analisi si basa su un approccio scientifico completamente diverso da quello del motion detection, perché l’obiettivo a cui aspira è molto più complesso: comprendere il contenuto dinamico di una scena. Infatti non basta sapere se un pixel è cambiato per capire il contenuto di una scena, ma occorre studiare frame per frame come è cambiato e quali sono stati la sua dinamica e il suo comportamento nel tempo. La video analisi esamina in modo costante il comportamento di ogni singolo pixel e individua modelli matematici dinamici in grado di approssimare, fotogramma per fotogramma, quel dato comportamento. Non ha importanza, dunque, rilevare ciò che si muove, ma rilevare ciò che si muove in modo anomalo rispetto all’abituale comportamento atteso. Si tratta di funzioni matematiche molto articolate, in grado di approssimare anche le dinamiche più complesse, proprio come quelle presenti in ambienti esterni. Si parla quindi di algoritmi basati su Self Learning Background Modelling, ovvero metodi in grado di osservare e imparare in continuo, frame per frame, il comportamento della scena e di adattarsi dinamicamente al suo variare, percependo le alterazioni anomale. Simone De Titta, Amministratore delegato Technoaware “La video analisi può apportare un valore aggiunto rilevante al mondo retail tramite, ad esempio, l’analisi dei flussi e dei comportamenti dei clienti (business intelligence), per intraprendere idonee iniziative di marketing e aumentare l’efficacia VIDEO ANALISI 2 Immagine di una hot zone: visualizzazione su immagine e su mappa grafica delle aree con maggior presenza di persone in un determinato intervallo di tempo [email protected] 32 07/04/14 14:02 33 aprile 2014 n. 4 VIDEO ANALISI 1 Il modulo Vtrack Intrusion consente di segnalare in tempo reale l’intrusione all’interno di aree virtuali o l’attraversamento di linee o perimetri virtuali Analisi video nel retail CONTEGGIO • Flusso di persone che entrano ed escono • Tempi di permanenza • Presenze presso totem, scaffali, vetrine (dwell time) • Livelli di affollamento (cassa, vetrina, punto promozionale, negozio) RILEVAZIONI • Livello di riempimento di scaffali o box espositivi (con espositori fissi) • Livello di utilizzo di carrelli e cestini (con unico punto di raccolta) • Passaggio di persone o carrelli per l’uscita senza acquisti • Situazioni di sovraffollamento critico • Eventi di possibile panico e disordine • Furti di beni ben visibili che cosa si può fare PROTEZIONE • Intrusione di persone non autorizzate durante le ore di chiusura • Aree sensibili (magazzini, impianti e centraline di controllo, negozi, aree di gestione, casseforti) • Erogatori automatici, atm e casse automatiche PREVENZIONE • Sovraffollamento, attraverso il conteggio del flusso di persone in ingresso e uscita • Intrusione, effrazione, atti vandalici, furti, attraverso la rilevazione di persone per un tempo anomalo presso ingressi, aree sensibili, parcheggi, scaffali REPORT • Storico dei flussi di persone e dei dati in determinati intervalli di tempo • Su immagine o mappa, presenza e disposizione delle persone in un intervallo di tempo (hot zones o heatmaps) BIOMETRIA • Stima di sesso, età e stato d’animo delle persone in transito attraverso metodi di biometria facciale: necessaria la collaborazione del soggetto e ottime condizioni di illuminazione, riflessi, ombre. delle promozioni, o, ancora, attraverso la raccolta dei dati relativi al flusso dei consumatori, la verifica del rapporto tra le presenze e le vendite, l’impatto di una campagna promozionale o il miglior posizionamento di un prodotto all’interno del negozio. Può inoltre determinare l’ottimizzazione delle attività di vendita, grazie all’aumento dell’efficienza del personale e delle strutture, oltre che una riduzione dei costi di gestione e come il più evoluto mainframe di ultima generazione. A peggiorare la situazione, inoltre, c’è il fatto che manca uno standard riconosciuto per la misura delle prestazioni di un modulo di videoanalisi: ognuno può scrivere quel che vuole. Non esistendo una scala di valutazione, quindi, diventa difficile posizionare la bontà di un prodotto e si corre il rischio di trovarsi di fronte a numeri completamente inventati e percentuali di prestazioni che non rispettano la validità del sistema, che portano a confondere la realtà con la fantasia, il motion detection, che semplicemente è uno tra le decine di algoritmi base che [email protected] 33 una diminuzione significativa delle perdite; questo migliorando, ad esempio, la dislocazione del personale, gli orari di apertura e chiusura dei negozi e la gestione dell’apertura e chiusura delle casse. Non è infine trascurabile il fattore sicurezza: la video analisi garantisce una migliore protezione dei dipendenti e delle strutture da effrazioni, furti, atti vandalici, aggressioni, manomissione di apparati e anche dal sovraffollamento”. costituiscono il robusto modulo di video analisi, con la video analisi stessa, la quale può assumere un enorme valore, soprattutto se applicata nei giusti contesti. Quando fidarsi e a chi credere? Come riconoscere, quindi, chi spaccia il motion detection per video analisi? La prima regola è quella di diffidare da chi millanta fantascienza; è quindi necessario leggere in modo scrupoloso e attento le varie caratteristiche dei prodotti; infine, è sempre bene affidarsi a chi può dimostrare di disporre, avendo investito anni di ricerca nel campo dell’intelligenza di ambiente, della necessaria che cosa si può fare con difficoltà AFFOLLAMENTO • Stima del numero di persone presenti in un’area affollata con percentuale di errore bassa: necessaria alta qualità delle inquadrature e delle condizioni generiche di illuminazione, riflessi, ombre. • Stima del percorso delle persone dove si trovano più di 0,1-0,2 persone/mq, a meno che non si disponga di inquadrature specifiche VOLUMI • Conteggio di persone in transito con carrelli, passeggini o cestelli voluminosi: non vi sono ancora metodi efficaci in grado di classificare tali soggetti, se non per l’area che occupano nell’immagine che cosa non si può fare RILEVAZIONI • Persone con arma in mano • Persone che si infilano in tasca un prodotto • Persone con particolari oggetti o accessori indosso • La taglia di una persona • Colore e tipo di vestiti di una persona • Riconoscimento di un cliente da un dipendente • Stima del contenuto di un carrello competenza e di una conoscenza approfondita della materia. Mai dimenticarsi di queste tre regole! Le funzioni matematiche che vengono utilizzate nella vera video analisi sono molto più complesse rispetto a una semplice disuguaglianza di immagini. 6-8 flussi in risoluzione CIF a 10-12 frame per secondo con un processore da 2,8-3 GHz: questo è l’onere computazionale corretto di un buon algoritmo di vera video analisi. Diffidate sempre da chi propone algoritmi rapidissimi in grado di processare decine di flussi ad alta risoluzione con poca CPU, così come da chi dichiara di essere molto più veloce: evidentemente fa pochi conti e non mette in campo la vera video analisi. (articolo a cura di Laura Turrini) 07/04/14 14:02