Video analisi: diffidate dalle imitazioni!

Transcript

Video analisi: diffidate dalle imitazioni!
32
domotica e sicurezza
aggiorniamoci
aprile 2014 n. 4
Gianluca Algeri
Direttore generale FGS Brescia (San Zeno Naviglio, BS)
Video analisi:
diffidate dalle imitazioni!
La video analisi è una tecnologia
che ad oggi sta progredendo
velocemente ed è in grado di fornire
soluzioni di enorme valore. È un
importante driver nel mercato della
videosorveglianza ma è necessario,
per il bene del settore, avere una
chiara consapevolezza di quali
possano essere, nel dettaglio, le sue
caratteristiche e le sue potenzialità.
Fantascienza cinematografica,
audaci produttori di sicurezza e
un mercato troppo spregiudicato
continuano a creare confusione e a
illudere gli utenti finali, dando origine
a improbabili aspettative che, nella
maggior parte dei casi, vengono
puntualmente deluse.
In quanti possono affermare
di conoscere la differenza tra
videoanalisi e motion detection?
Quali sono le caratteristiche alla base
delle due tecnologie? Cosa si può
realmente arrivare ad ottenere, oggi,
tramite l’utilizzo di un sistema di
video analisi?
Motion detection:
rilevare ciò che si muove
Il motion detection è una tecnologia che nasce
con l’obiettivo di fare compressione di flussi video,
non comprensione di ambiente. Il suo meccanismo
di base si fonda generalmente sul confronto di
pixel in immagini consecutive e/o con un’immagine
considerata di sfondo di riferimento; solo i pixel
modificati nell’immagine visualizzata, rispetto
alla precedente, vengono trasmessi, mentre per
gli altri è sufficiente inviare l’indicazione che non
sono variati, con la conseguente riduzione dei
dati da riportare e senza il rischio di perdere la
qualità dell’informazione. È quindi corretto dire
che il motion detection rileva un cambiamento nel
momento in cui una persona fa il suo ingresso in
una scena, perché in essa cambiano i pixel relativi
all’immagine che funge da sfondo. Ma quando ci si
trova in ambienti esterni, con pioggia, neve, vento,
alberi, fontane, riflessi di luce e piccoli animali, tutti
i movimenti insignificanti e non desiderati vengono
inevitabilmente rilevati dal motion detection, che
si limita a riconoscere le sole differenze a livello di
pixel provocando centinaia di falsi allarmi.
Manca uno standard di valutazione
Possiamo paragonare l’evoluzione
della video analisi a quella dei
computer della metà degli anni 80:
il loro valore funzionale, al tempo,
era enorme rispetto alle tecnologie
esistenti, ma naturalmente da essi non
ci si poteva, né ci si doveva, aspettare
prestazioni e funzionalità paragonabili
a quelle dei pc odierni. La differenza
è invece, per rimanere nella metafora,
che nel mercato della video analisi
c’è chi vende il ‘commodore64’
Video analisi:
rilevare i movimenti anomali
La video analisi si basa su un approccio scientifico
completamente diverso da quello del motion detection,
perché l’obiettivo a cui aspira è molto più complesso:
comprendere il contenuto dinamico di una scena. Infatti
non basta sapere se un pixel è cambiato per capire il
contenuto di una scena, ma occorre studiare frame per
frame come è cambiato e quali sono stati la sua dinamica
e il suo comportamento nel tempo. La video analisi
esamina in modo costante il comportamento di ogni
singolo pixel e individua modelli matematici dinamici in
grado di approssimare, fotogramma per fotogramma,
quel dato comportamento. Non ha importanza, dunque,
rilevare ciò che si muove, ma rilevare ciò che si muove
in modo anomalo rispetto all’abituale comportamento
atteso. Si tratta di funzioni matematiche molto articolate,
in grado di approssimare anche le dinamiche più
complesse, proprio come quelle presenti in ambienti
esterni. Si parla quindi di algoritmi basati su Self
Learning Background Modelling, ovvero metodi in grado
di osservare e imparare in continuo, frame per frame, il
comportamento della scena e di adattarsi dinamicamente
al suo variare, percependo le alterazioni anomale.
Simone De Titta,
Amministratore
delegato Technoaware
“La video analisi può
apportare un valore aggiunto
rilevante al mondo retail
tramite, ad esempio, l’analisi dei flussi e
dei comportamenti dei clienti (business
intelligence), per intraprendere idonee
iniziative di marketing e aumentare l’efficacia
VIDEO ANALISI 2
Immagine di una hot zone:
visualizzazione su immagine
e su mappa grafica delle
aree con maggior presenza
di persone in un determinato
intervallo di tempo
[email protected] 32
07/04/14 14:02
33
aprile 2014 n. 4
VIDEO ANALISI 1
Il modulo Vtrack Intrusion
consente di segnalare in tempo
reale l’intrusione all’interno di
aree virtuali o l’attraversamento
di linee o perimetri virtuali
Analisi video nel retail
CONTEGGIO
• Flusso di persone che entrano ed escono
• Tempi di permanenza
• Presenze presso totem, scaffali, vetrine (dwell time)
• Livelli di affollamento (cassa, vetrina, punto
promozionale, negozio)
RILEVAZIONI
• Livello di riempimento di scaffali o box espositivi (con
espositori fissi)
• Livello di utilizzo di carrelli e cestini (con unico punto di
raccolta)
• Passaggio di persone o carrelli per l’uscita senza acquisti
• Situazioni di sovraffollamento critico
• Eventi di possibile panico e disordine
• Furti di beni ben visibili
che cosa
si può fare
PROTEZIONE
• Intrusione di persone non autorizzate durante le ore di
chiusura
• Aree sensibili (magazzini, impianti e centraline di
controllo, negozi, aree di gestione, casseforti)
• Erogatori automatici, atm e casse automatiche
PREVENZIONE
• Sovraffollamento, attraverso il conteggio del flusso di
persone in ingresso e uscita
• Intrusione, effrazione, atti vandalici, furti, attraverso
la rilevazione di persone per un tempo anomalo presso
ingressi, aree sensibili, parcheggi, scaffali
REPORT
• Storico dei flussi di persone e dei dati in determinati
intervalli di tempo
• Su immagine o mappa, presenza e disposizione delle
persone in un intervallo di tempo (hot zones o heatmaps)
BIOMETRIA
• Stima di sesso, età e stato d’animo delle persone
in transito attraverso metodi di biometria facciale:
necessaria la collaborazione del soggetto e ottime
condizioni di illuminazione, riflessi, ombre.
delle promozioni, o, ancora, attraverso
la raccolta dei dati relativi al flusso dei
consumatori, la verifica del rapporto tra
le presenze e le vendite, l’impatto di una
campagna promozionale o il miglior
posizionamento di un prodotto all’interno
del negozio. Può inoltre determinare
l’ottimizzazione delle attività di vendita,
grazie all’aumento dell’efficienza del
personale e delle strutture, oltre che
una riduzione dei costi di gestione e
come il più evoluto mainframe di
ultima generazione. A peggiorare la
situazione, inoltre, c’è il fatto che
manca uno standard riconosciuto
per la misura delle prestazioni di un
modulo di videoanalisi: ognuno può
scrivere quel che vuole.
Non esistendo una scala di
valutazione, quindi, diventa difficile
posizionare la bontà di un prodotto
e si corre il rischio di trovarsi di
fronte a numeri completamente
inventati e percentuali di prestazioni
che non rispettano la validità del
sistema, che portano a confondere
la realtà con la fantasia, il motion
detection, che semplicemente è uno
tra le decine di algoritmi base che
[email protected] 33
una diminuzione significativa delle
perdite; questo migliorando, ad esempio,
la dislocazione del personale, gli orari
di apertura e chiusura dei negozi e la
gestione dell’apertura e chiusura delle
casse. Non è infine trascurabile il fattore
sicurezza: la video analisi garantisce una
migliore protezione dei dipendenti e delle
strutture da effrazioni, furti, atti vandalici,
aggressioni, manomissione di apparati e
anche dal sovraffollamento”.
costituiscono il robusto modulo di
video analisi, con la video analisi
stessa, la quale può assumere
un enorme valore, soprattutto se
applicata nei giusti contesti.
Quando fidarsi e a chi credere?
Come riconoscere, quindi, chi spaccia
il motion detection per video analisi?
La prima regola è quella di diffidare
da chi millanta fantascienza; è quindi
necessario leggere in modo scrupoloso
e attento le varie caratteristiche
dei prodotti; infine, è sempre bene
affidarsi a chi può dimostrare di
disporre, avendo investito anni di
ricerca nel campo dell’intelligenza
di ambiente, della necessaria
che cosa
si può fare
con difficoltà
AFFOLLAMENTO
• Stima del numero di persone presenti in un’area affollata
con percentuale di errore bassa: necessaria alta qualità
delle inquadrature e delle condizioni generiche di
illuminazione, riflessi, ombre.
• Stima del percorso delle persone dove si trovano più
di 0,1-0,2 persone/mq, a meno che non si disponga di
inquadrature specifiche
VOLUMI
• Conteggio di persone in transito con carrelli, passeggini
o cestelli voluminosi: non vi sono ancora metodi efficaci
in grado di classificare tali soggetti, se non per l’area che
occupano nell’immagine
che cosa
non si può fare
RILEVAZIONI
• Persone con arma in mano
• Persone che si infilano in tasca un prodotto
• Persone con particolari oggetti o accessori indosso
• La taglia di una persona
• Colore e tipo di vestiti di una persona
• Riconoscimento di un cliente da un dipendente
• Stima del contenuto di un carrello
competenza e di una conoscenza
approfondita della materia. Mai
dimenticarsi di queste tre regole! Le
funzioni matematiche che vengono
utilizzate nella vera video analisi sono
molto più complesse rispetto a una
semplice disuguaglianza di immagini.
6-8 flussi in risoluzione CIF a 10-12
frame per secondo con un processore
da 2,8-3 GHz: questo è l’onere
computazionale corretto di un buon
algoritmo di vera video analisi. Diffidate
sempre da chi propone algoritmi
rapidissimi in grado di processare
decine di flussi ad alta risoluzione
con poca CPU, così come da chi
dichiara di essere molto più veloce:
evidentemente fa pochi conti e non
mette in campo la vera video analisi.
(articolo a cura di Laura Turrini)
07/04/14 14:02