Scarica esempio

Transcript

Scarica esempio
pieroit.org – data science on demand
Segmentazione della clientela
Segmentazione dei clienti – demo
Il presente report è ottenuto da un open dataset di esempio riguardante i clienti di un supermercato.
La Segmentazione permette di raggruppare una serie di osservazioni in categorie, puramente a partire dai dati
disponibili. Il metodo deriva dal machine learning e permette un approccio scientifico al marketing e al decisionmaking.
Nella prima parte del report vedremo come sono distribuite le variabili più importanti del dataset, nella seconda i
risultati della Segmentazione.
1 - Distribuzione delle singole variabili
Le variabili prese in considerazione per la generazione dei segmenti sono:
•
gender (sesso): Nel dataset originario M vs. F, la variabile è qui vettorizzata in modo da occupare una sola
dimensione nel modello con range [0,1]. 0 = femmina, 1 = maschio. La distribuzione non mostra prevalenza di
una delle due categorie.
pieroit.org – data science on demand
Segmentazione della clientela
•
houseowner (casa di proprietà): Nel dataset originario Y vs N, la variabile è qui vettorizzata in modo da
occupare una sola dimensione nel modello con range [0,1]. 0 = non possiede casa, 1 = possiede casa. Il 60%
dei clienti possiede una casa.
•
marital_status (stato civile): Nel dataset originario M vs S, la variabile è qui vettorizzata in modo da occupare
una sola dimensione nel modello con range [0,1]. 0 = non sposato, 1 = sposato. La distribuzione non mostra
prevalenza di una delle due categorie.
pieroit.org – data science on demand
Segmentazione della clientela
•
country (nazione di provenienza): I valori sono USA, Mexico e Canada. Il dataset contiene perlopiù clienti
americani, accompagnati da un 30% percentuale di Messicani e Canadesi.
•
sales (acquisto): Nel dataset originario è il valore in dollari della spesa complessiva effettuata dal cliente. La
variabile è stata discretizzata in due valori (purchase vs. no purchase) per distinguere gli utenti occasionali
(entrati poche volte nel supermercato) da quelli regolari, i secondi essendo più profittevoli. La maggior parte
dele spese ricade sotto la somma dei 300$ (nota logaritmo sull'asse dell y).
pieroit.org – data science on demand
Segmentazione della clientela
2 - Segmenti individuati
1 – Marito affermato non americano. Il cliente appartenente a questo segmento è maschio, sposato e molto
probabilmente possiede casa. La caratteristica che più distingue questo segmento dal resto è il non essere americano. Il
segmento più simile per sesso, casa e stato civile è il 4, con la differenza che in quel caso si tratta di americani che non
hanno fatto acquisti.
2 – Coppie sposate americane. Il secondo segmento è composto di soggetti americani sposati, di ambo i sessi e
che possono possedere o meno una casa.
3 – Scapolo americano. Il terzo segmento è composto da soggetti americani maschi e non sposati.
pieroit.org – data science on demand
Segmentazione della clientela
4 – Marito affermato americano. Segmento molto simile al primo per sesso, casa di prorpietà e stato civile. Le
due differenze stanno nel fatto che in questo caso si tratta prevalentemente di soggetto americano che non ha effettuato
acquisti.
Consulenza
•
Differenziare il marketing e i podotti secondo 3 filoni, corrispondenti rispettivamente ai segmenti 1, 2, 3:
1.
Fuori dagli USA il target è maschio, è sposato e possiede casa. Lo stesso profilo anagrafico non è
profittevole in USA (vedi segmento 4).
2.
Coppie sposate americane, senza assumere che abbiano già comprato casa.
3.
Maschio single americano, senza assumere che abbia comprato casa.