sas per la ricerca dei migliori clienti

Transcript

sas per la ricerca dei migliori clienti
SAS PER LA RICERCA DEI MIGLIORI CLIENTI.
La progettazione di uno Scoring System per il Direct Marketing
Flavio Addolorato*, Giovanni Bonati**, Guido Cuzzocrea***, Alberto Saccardi***
Abstract: lo Scoring System è un insieme integrato di procedure volte alla costruzione di un modello che
mette in relazione le caratteristiche di un insieme di individui (la lista dei potenziali clienti) con una variabile obiettivo. Tale variabile rappresenta l'adesione ad una proposta commerciale, mentre le variabili
esplicative sono legate al comportamento passato degli individui nei confronti di analoghe iniziative e alle
loro caratteristiche anagrafiche. L'obiettivo del progetto consiste nell'assegnazione di un punteggio numerico (score) ad ogni anagrafica del file. Tale punteggio è direttamente collegato alla probabilità che ogni
individuo risponda all'azione commerciale. In questo modo è possibile ordinare i potenziali clienti in base
allo score e selezionare quelli a cui è associata una probabilità di adesione più elevata. Verranno illustrate
la metodologia di base, lo sviluppo in SAS, con particolare riferimento all'utilizzo della PROC CATMOD, i
risultati ottenuti. In questa trattazione faremo riferimento al caso specifico della promozione di vendite
tramite catalogo non specializzato, ma l'applicabilità dello Scoring System è chiaramente molto più ampia.
Paper presentato al convegno SUGItalia ’93,
Triestre, ottobre 1993
Il lavoro qui presentato nasce da una collaborazione fra il Centro di Calcolo dell'Università Bocconi e
la Direzione Marketing della Postalmarket. Presso
il CdC dell'Un. Bocconi si è organizzato un gruppo
di lavoro con competenze statistiche, informatiche
e di marketing per studiare la progettazione con
SAS di uno Scoring System per il Direct Marketing.
La Postalmarket, appartenente al gruppo tedesco
OTTO VERSAND, è l'azienda leader in Italia nella
vendita per corrispondenza, con un fatturato nel '92
di circa 484 miliardi e 1154 addetti. Si propone al
mercato con due diverse testate, Postalmarket e
BASE, distribuendo semestralmente una tiratura di
oltre 2.500.000 cataloghi, grazie alla quale serve più
di 1.500.000 famiglie italiane. Fra le aziende
italiane è forse quella che più intensamente utilizza
tecniche di comunicazione diretta.
1.1 Introduzione.
La comunicazione diretta è una tecnica di marketing
che mira ad instaurare un rapporto interattivo e
quanto più possibile personalizzato fra il propositore di beni e/o servizi e il possibile cliente. Questo
approccio al mercato, tipico del Direct Marketing, si
contrappone alla comunicazione di massa per la
promozione di prodotti commerciali. Naturalmente
questa contrapposizione non è assoluta e alle due
forme di comunicazione vengono assegnati obiettivi
e ruoli diversi: a quella di massa il ruolo strategico
della promozione dell'immagine, mentre in specifi*
**
***
che realtà aziendali la ricerca del contatto col cliente
viene affidata a tecniche di comunicazione diretta.
In tale contesto la comunicazione diretta rappresenta
uno strumento flessibile che permette, ove
correttamente supportato, di controllare l'allocazione ottimale degli investimenti commerciali, garantendo risultati non altrimenti conseguibili.
1.2 La Vendita Per Corrispondenza
Il principale settore di applicazione delle tecniche di
Direct Marketing è quello delle vendite per corrispondenza (d'ora in poi VPC). La maggior parte dei
prodotti e dei servizi possono essere venduti per posta. Praticamente non esistono limiti. In rapporto
alle tradizionali forme di commercio al dettaglio, la
VPC costituisce un mondo a parte, con leggi, tecniche ed esigenze particolari. Si può ormai parlare di
un insieme di competenze specifiche del settore che
si basa su moderni strumenti di marketing e avanzate strutture organizzative.
La VPC è andata sempre più differenziandosi sia
nell'oggetto commerciale che nel modo di proporlo
al mercato, ma possiamo ricondurne i molteplici
aspetti a tre forme fondamentali:
a) vendite tramite catalogo ad assortimento
multiplo. Viene offerta una vasta gamma di prodotti
di diversi settori merceologici, con un assortimento
analogo a quello offerto dai grandi magazzini.
b) vendite mediante catalogo specializzato.
Le imprese che operano con questa forma offrono
un'insieme di prodotti merceologicamente ben
delimitato e appositamente costituito. In questo contesto si collocano, fra l'altro, le offerte di prodotti
editoriali che permettono alle case editrici in-
Banca Commerciale Italiana (Ufficio Studi) - Università Bocconi (Centro di Calcolo)
RCS Editori (Sistemi Informativi di Marketing Diretto) - Università Bocconi (Centro di Calcolo)
Università Bocconi (Istituto di Metodi Quantitativi - Centro di Calcolo)
teressanti sinergie per la disponibilità di un prodotto
facilmente e fortemente differenziabile e l'opportunità di un mercato ben caratterizzato costituito dai
propri abbonati.
c) vendite one-shot. In questa categoria si
possono far rientrare non solo offerte "chiavi in
mano" di uno o più prodotti a tema, ma anche di
abbonamenti a periodici o a club di lettori, di associazione a enti con finalità più o meno benefiche, di
raccolta di fondi, di acquisto di prodotti finanziari o
di adesione a fondi di investimento.
1.3 Il catalogo
Un'azienda che propone un assortimento despecializzato, come Postalmarket, ha contemporaneamente
motore e asse portante nel catalogo. Esso sostituisce
il negozio in tutte le sue espressioni, rappresenta
l'immagine dell'azienda ed è destinato a restare nelle
case dei clienti per alcuni mesi. Si aggiunga che un
catalogo del genere è composto da più di 700
pagine, viene tirato in milioni di copie e rappresenta
uno dei costi principali dell'impresa. Ogni pagina,
ogni fotografia, ogni didascalia viene realizzata con
la massima cura e tenendo conto del ritorno in
termini di ordini. I problemi da affrontare
cominciano sin dalla fase di impostazione e sono
complicati dal fatto che questa avviene almeno un
anno prima dalla spedizione. Una volta realizzato, il
catalogo deve giungere nelle mani dei potenziali
clienti. La politica più diffusa consiste nell'inviarlo
gratuitamente, prima di tutto ai clienti più affezionati, quelli che hanno effettuato degli ordini recentemente, poi agli altri e anche a chi cliente non è
mai stato, sempre cercando di far si che la resa
marginale prevista sia tale da coprire almeno i costi
di stampa e di spedizione. Una volta giunto in una
famiglia il catalogo viene accompagnato da un'attentamente studiata serie di messaggi, ora per ricordare un settore di particolare interesse in quel
periodo, ora per sottolineare o proporre un vantaggio commerciale o un'azione di saldo. Proprio in
corrispondenza del primo di questi rilanci si ottiene
il volume di vendita più significativo. Il numero e la
frequenza dei mail è oggetto di attento studio, sia
per la scelta dei periodi più favorevoli che per evitare di irritare i destinatari con un'eccessiva ripetizione di offerte. La risposta a queste iniziative è
comunque molto differenziata e dipende sia
dall'adeguatezza del prodotto o del servizio offerto,
sia ovviamente dalle caratteristiche del target.
1.4 La segmentazione
Compito primario dei responsabili di marketing in
questi anni è proprio quello di personalizzare prodotti e servizi per un pubblico specifico, cercando di
vedere il consumatore come un individuo con cui
stabilire un legame duraturo, "demassificando" le
azioni di marketing. Questo lavoro propone un metodo di segmentazione "fine" per ottimizzare il tasso
di risposta in tali situazioni. Segmentare, in questo
caso, significa poter scegliere solo alcune categorie
di persone dalle liste proprie o acquisite, in modo
che la loro probabilità di acquisto sia superiore a
quella media dell'intera lista. L'impatto di
quest'operazione per una società come Postalmarket,
che deve scegliere 2.500.000 destinatari in un archivio di 17.000.000 di anagrafiche, determina l'andamento dell'intero esercizio. La dimensione del
beneficio ottenibile con la segmentazione dipende
da due fattori: la quantità e la qualità delle informazioni individualmente disponibili e la capacità
discriminante della tecnica utilizzata per svolgere
l'analisi.
2.1 La conoscenza del consumatore: il file
clienti e prospect.
L'abbattimento del costo delle risorse di calcolo per
la gestione di grandi masse di dati e lo sviluppo di
strumenti operativi di analisi di dati qualitativi
hanno condotto a risultati talmente interessanti nel
campo degli atteggiamenti da giustificare ampiamente investimenti in direzione di una migliore conoscenza del consumatore. L'informazione è la
chiave di volta di tutto il processo di Direct
Marketing. Questa modalità di vendita permette
l'apertura di un colloquio a distanza con l'utente e la
lontananza costituisce una barriera non solo fisica,
ma anche psicologica fra le parti in gioco. Tale
barriera può essere in parte abbattuta se si dispone
di elementi conoscitivi sull'interlocutore e su come
ha reagito ai precedenti contatti. La gestione di
queste informazioni deve assolvere a tre funzioni
fondamentali:
indirizzabilità del messaggio;
personalizzazione del messaggio; interpretazione
degli atteggiamenti e previsione dei comportamenti.
Ci occuperemo della terza funzione e vedremo come
sia possibile utilizzare l'informazione non solo a
scopi descrittivi ma, con maggior vantaggio, a fini
predittivi di atteggiamenti futuri per ottimizzare le
risposte di mercato.
2.1.1 Informazioni di riconoscimento.
Sono essenzialmente contenute nell'anagrafica di
ogni individuo. Per questo tipo di dati esistono
complessi sistemi di procedure per individuare,
all'interno di stringhe non strutturate, tutti gli elementi caratteristici di un indirizzo, di verificarne la
correttezza e la congruenza con i codici di avviamento postale, di identificare omonimie e doppioni,
di correlare individui appartenenti allo stesso nucleo
familiare.
L'inserimento dell'anagrafica nel
database aziendale si conclude con l'attribuzione di
uno o più codici numerici.
2.1.2 Informazioni descrittive.
Queste informazioni servono a definire la fisionomia dell'individuo. Alcune sono direttamente desumibili dall'indirizzo, altre vengono raccolte per
mezzo di questionari o acquisite da aziende esterne
specializzate in "list brokering" o che semplicemente acquisiscono questi dati per altri fini
(garanzie di elettrodomestici, associazioni a club,
abbonamenti, concorsi, registro dei protesti, ...).
2.1.3 Informazioni aziendali.
Riguardano tutti gli eventi rilevati direttamente
dall'operatore economico e relativi specificatamente
all'attività dell'individuo come cliente, più o meno
attivo, dell'azienda. Sono i dati a più elevata dinamicità e quelli più connessi all'attività aziendale,
quindi non sorprenderà la cura con cui vengono
raccolti dalle imprese operanti nel settore, anche
quando non hanno importanza strettamente amministrativa. Dati sui tempi e le modalità di acquisizione dell'anagrafica, sulle preferenze rispetto ai
diversi tipi di sconto o di omaggio, sulle modalità di
pagamento, sulle merceologie e sui servizi preferiti,
oltre naturalmente all'analitica registrazione dei
valori acquisiti, pagati e da pagare rappresentano un
magma imponente e in costante movimento che solo
una corretta ed efficiente organizzazione
informativa ed informatica è in grado di controllare.
2.2 Segmentazione con RFM
L'ottimizzazione delle risposte passa attraverso
l'individuazione, all'interno del target, di sottoinsiemi omogenei di consumatori per i quali è possibile determinare la potenzialità media di consumo.
L'ordinamento successivo dei sottoinsiemi per
potenzialità decrescenti ci consente di isolare le fasce più redditizie sulle quali calare la comunicazione diretta. Un metodo semplice di segmentazione
è quello che fa uso delle informazioni sulla recenza,
sulla frequenza e sul valor medio degli acquisti. Il
metodo noto con il nome di RFM (recenza,
frequenza, monetarietà), è stato largamente
impiegato dalle aziende di VPC e, forse proprio
grazie alla sua semplicità, continua a dimostrarsi di
grande efficacia.
Nel nostro caso l'azienda operava con i soli criteri
di recenza e frequenza, segmentando il proprio file
clienti in 17 categorie corrispondenti ad altrettante
combinazioni di acquisto/non acquisto negli ultimi 6
cataloghi. L'esperienza aziendale ha dimostrato che
i rendimenti più elevati nell'immediato futuro sono
dati da coloro che hanno effettuato almeno un
acquisto nell'ultimo semestre: le categorie dalla 1
alla 11, i cosiddetti clienti "buoni". Gli appartenenti
alle restanti categorie più coloro che clienti non sono mai stati non potranno che essere definiti
"cattivi".
3 SCORING SYSTEM INTEGRATO
3.1 Che cos'è e a cosa serve
Lo Scoring System consiste in un insieme di procedure volte alla costruzione di un modello che metta
in relazione le caratteristiche di un insieme di individui (i possibili destinatari catalogo della testata
Postalmarket) con una variabile obiettivo. La
variabile obiettivo rappresenta l'adesione o meno ad
una proposta commerciale (in questo caso acquista,
non acquista nel corso del catalogo), mentre le
variabili esplicative provengono dai patrimoni
informativi descritti ai punti 2.1.2 e 2.1.3: si tratta
delle caratteristiche (anagrafiche) dei potenziali
clienti e dei comportamenti passati di questi nei
confronti della testata Postalmarket.
In termini predittivi, l'implementazione del modello
permette di assegnare un punteggio (score) ad ogni
anagrafica del file, in base all'appartenenza a segmenti omogenei rispetto alle variabili esplicative.
Tale punteggio esprime la probabilità che il generico individuo appartenente ad un segmento effettui
atti d'acquisto connessi al catalogo in via di spedizione. Ciascun segmento è caratterizzato da una diversa propensione all'acquisto e l'efficacia del modello può essere misurata in termini di capacità discriminante rispetto alla propensione media: fissato
il numero di cataloghi da spedire sarà possibile selezionare la corrispondente fascia di destinatari
"significativamente migliore" rispetto alla media.
In questo contesto, lo Scoring System è un sistema
predittivo che parte dal presupposto che gruppi di
individui con determinate caratteristiche e comportamenti passati manterranno costante il proprio atteggiamento (acquista/non acquista) nell'immediato
futuro.
3.2 Come si realizza
Lo Scoring System si compone di moduli di varia
natura: organizzativi, procedurali, di analisi e di
calcolo. Ogni modulo contempla report che permettono di valutare la qualità dell'elaborazione eseguita
e la struttura dei fenomeni emergenti..
Nella fig. 1 vengono presentate la macro struttura
del flusso del sistema e le procedure SAS utilizzate
in ciascuna fase.
Analizziamo in sintesi il contenuto di ciascun modulo.
SCORING SYSTEM
Individuazione del target omogeneo su
cui condurre lo studio. Definizione del
fenomeno
da
spiegare
e
organizzazione della base dati del
target.
Data Step
3.2.1
Targetting
Data Step
3.2.2
Sampling
Scelta del disegno e della numerosità
campionaria.
Estrazione
del
campione.
3.2.3
Prescreening
Selezione delle varabili statisticamente
connesse col fenomeno da spiegare.
3.2.4
Screening
Costruzione delle macro variabili che
determinano
la
griglia
di
segmentazione.
Proc Catmod
3.2.5
Scoring
SAS/Graf
3.2.6
Validazione
Verifica
teorica
del
potere
disrciminante e della robustezza dello
scoring.
3.2.7
Implement azione
Calcolo e attribuzione del punteggio di
score normalizzato al file target
Proc Freq
Proc Freq
Proc Stepdisc
Data Step
Proc Freq
Proc Catmod
Scelta del modello e stima dei
parametri, in base ai criteri di
parsimonia, robustezza e capacità
discriminante.
Proc Univariate
Data Step
3.2.1 Targetting
Lo Scoring System risulta efficace all'interno di un
target omogeneo. Se infatti esiste una variabile di
fondo molto discriminante e prevalente sulle altre, i
comportamenti saranno spiegati prevalentemente da
questa sola caratteristica, rendendo ininfluenti le
altre variabili ed inconsistente lo studio. Nel caso
specifico della Postalmarket si è deciso di applicare
lo Scoring a quelle anagrafiche del file definite
"cattive". Le anagrafiche definite "buone", in base ai
criteri tradizionali di recenza frequenza, manifestano infatti una propensione all'acquisto nettamente
superiore alla media e sicuramente profittevole.
Inoltre il numero di informazioni associate al
segmento "cattivi" è minimo e ciò rende ancor più
necessaria la presenza di un sistema integrativo per
supportare la scelta dei destinatari di catalogo.
Tenendo presente le precedenti considerazioni
schematizziamo i passi successivi del modulo
Targetting, facendo particolare riferimento al caso
Postalmarket:
1.
2.
3.
definire l'obiettivo commerciale dell'operazione
=> Invio catalogo ai potenziali clienti con
maggior propensione all'acquisto;
individuare il target omogeneo specifico => Le
anagrafiche appartenenti al segmento "cattivi"
del file;
analizzare la struttura dell'archivio dei potenziali clienti definendo le variabili da considerare esplicative (caratteristiche anagrafiche e
comportamenti passati) e la variabile da spiegare (acquista/non acquista).
Il risultato del modulo è il FILE TARGET, completo di variabili esplicative e variabile da spiegare, per
l'insieme di individui che si è deciso di segmentare.
3.2.2 Sampling
In questa fase si esegue un campionamento del file
target per costruire una base di studio sufficientemente rappresentativa dell'universo di riferimento,
ma adeguatamente contenuta per razionalizzare
tempi e costi di analisi. Nel caso di Postalmarket,
l'esigenza di effettuare lo Scoring su un target
omogeneo può ulteriormente incrementare il costo
di gestione di ciascun elemento del campione: la
pressione commerciale effettuata attraverso omaggi,
sconti e altro deve essere uguale per tutti e, per non
perdere in termini di resa, pari al livello massimo.
Al di là di tutte queste considerazioni la scelta della
numerosità campionaria dipende dal numero di
segmenti omogenei determinati in base allo Scoring
e dalla distribuzione delle anagrafiche al loro interno: visto in questi termini il modello si propone di
stimare il parametro di una popolazione bernoulliana in ciascun segmento. Semplici considerazioni
sul livello di Standard Error desiderato consentirebbero quindi di stabilire l'ampiezza del campione.
Tuttavia ciò significherebbe conoscere a priori i risultati del modello. A tale proposito è stata effettuata un'analisi preliminare, con l'implementazione
di un prototipo di modello su un campione pilota
che ha fornito indicazioni non solo sulla numerosità
totale, ma anche sulle modalità di stratificazione del
campione effettivo.
Il campione di ampiezza 50.000, estratto nel nostro
caso, va ben oltre le migliori aspettative del più esigente statistico. Il disegno è stratificato in modo
proporzionale sulle variabili: AREA NIELSEN,
AMPIEZZA di CENTRO (<=10.000 abitanti, da
10.000
a
100.000
abitanti,
>100.000),
CATEGORIA (determinata in base alla recenza/frequenza). Queste variabili, già disponibili sul
file, sono anche risultate significativamente connesse al comportamento acquista/non acquista (PROC
FREQ di SAS/STAT e relative statistiche Chi-quadrato). All'interno della griglia di 255 strati così ottenuta è stata effettuata un'estrazione casuale, con
passo pari ad 1/27.
Il modello finale ha generato 67 aree di resa teorica
con una numerosità media campionaria di 750 anagrafiche ed un livello di Standard Error relativo
ampiamente soddisfacente.
3.2.3 Prescreening
All'interno di questo modulo viene eseguita una
prima selezione delle variabili che risultano statisticamente connesse al comportamento di acquisto nel
corso del catalogo. I criteri utilizzati per la selezione
dipendono dalla natura delle variabili, qualitative
(sesso, regione di appartenenza,...) o quantitative
(numero di ordini, valore dell'ordinato,...). Per le
prime si costruiscono le tabelle di contingenza con
la variabile obiettivo e si considerano indicatori
costruiti sulla base della statistica Chi-quadrato. La
procedura SAS utilizzata è la PROC FREQ con
l'opzione MEASURES. La fase di prescreening per
variabili esplicative di natura quantitativa viene
eseguita con la PROC STEPDISC. Data una
variabile da spiegare ed un insieme di variabili
quantitative, tale procedura individua quelle che
congiuntamente hanno più elevato potere discriminante.
Vengono quindi escluse dall'analisi le variabili non
rilevanti per lo Scoring.
3.2.4 Screening
L'obiettivo dello Screening è quello di costruire le
variabili da inserire nel modello di segmentazione
finale. I criteri seguiti sono quelli della parsimonia,
robustezza e capacità discriminante.
Sulla base delle caratteristiche selezionate nella fase
precedente vengono eseguite delle aggregazioni tra
le modalità di una stessa variabile e fusioni tra variabili con significato logico similare, connesse subordinatamente alla dicotomica obiettivo. Le variabili in gioco sono per lo più categoriche e perciò,
ai fini della valutazione della connessione vengono
utilizzati modelli log-lineari (PROC CATMOD).
Aggregazione e fusione vengono invece effettuate
in maniera semiautomatica con delle macro sviluppate in SAS.
Nel caso dello Scoring System implementato per il
catalogo autunno/inverno 1993 si è giunti alla costruzione di due macrovariabili, una che riassume il
comportamento passato del potenziale cliente, l'altra
di natura territoriale.
esplicative sono non siginficative, ossia modelli ad
effetti principali. Questi risultano di maggior
robustezza e più immediata interpretabilità.
La PROC CATMOD (CATegorical MODel) di
SAS/STAT permette la stima lineare di modelli per
l'analisi di dati categoriali rappresentabili con tavole
di contingenza. In particolare si ha la possibilità di
stimare i parametri di un modello LOGIT,
disponendo di numerose misure statistiche per
valutarne la bontà. Per quanto riguarda la validità
del modello nel suo complesso gli indicatori da
considerare sono i Chi-Square Test (Wald Test) per
ogni effetto introdotto ed il Likelihood Ratio Test.
L'elevata numerosità campionaria e la correttezza
dell'ipotesi di multinomialità della popolazione ci ha
consentito di ottenere la stima dei coefficienti con il
metodo della massima verosimiglianza e di
valutarne la significatività ancora con le statistiche
di Wald. Un'approfondita analisi grafica e statistica
dei residui completa la fase di scelta del modello.
In base alla griglia finale di segmentazione, il modello assegna le probabilità teoriche di acquisto alle
anagrafiche del campione.
3.2.6 Validazione
In termini operativi, prima di estendere i risultati
dello Scoring al file Target, si esegue una valutazione dei risultati attesi utilizzando i dati campionari.
La segmentazione sul campione ha generato 67
classi con resa che va da un minimo del 13.0% ad
un massimo del 58.2%, con valori del primo, secondo e terzo quartile rispettivamente di 20.4%,
26.0% e 31.5%. Il miglior 25% del campione ha una
resa media teorica pari a 39.5%, il peggior 25% pari
a 17.7%, rispetto ad una resa media complessiva del
26.5%.
SCORE categorie 12-17
100%
90%
80%
Perc. Clienti
70%
Perc. Non Clienti
50%
40%
30%
20%
10%
260
240
220
200
180
160
140
120
100
80
60
40
0%
20
Questo modulo rappresenta il nocciolo dell'intero
sistema. L'obiettivo è determinare il modello che
meglio rappresenta la relazione tra la variabile acquista/non_acquista e le macrovariabili selezionate
in fase di Screening. La natura dicotomica della
variabile dipendente e la finalità di prevedere la
probabilità di acquisto per ciascun elemento del file
ci ha indotto ad utilizzare un modello della classe
LOGIT. Il processo di aggregazione e fusione
messo in atto nella fase di Screening consente di
ottenere modelli in cui le interazioni tra variabili
60%
0
3.2.5 Scoring
Figura 2
Le successive valutazioni sono state effettuate in
termini di score. Per score si intende un punteggio
numerico ottenuto da una trasformazione monotona
della resa teorica. In particolare, un'ulteriore
valutazione dei risultati attesi la si ottiene
D istribuzione delle classi di Score_6 all' interno delle Categorie
6 0 .0 0 %
Score_6
5 0 .0 0 %
1
4 0 .0 0 %
Resa
suddividendo il campione nei due sottoinsiemi degli
acquirenti/non acquirenti nel catalogo corrente e
confrontando le due distribuzioni dello score. Nella
fig. 2 vengono presentati gli scatter plot relativi alle
percentuali progressive di acquirenti e non
acquirenti, in corrispondenza di ciascun livello di
score.
2
3
3 0 .0 0 %
4
5
2 0 .0 0 %
6
1 0 .0 0 %
0 .0 0 %
Divergenza score ordinamento crescente
13
f(x)
0.016
12
14
Acquista
Non acquista
0.014
15
17
16
C ategorie
Figura 5
Nelle fig. 5 e 6 sono presentate rispettivamente le
distribuzioni della variabile SCORE_6 per
CATEGORIA e viceversa: come si nota all'interno
di ogni categoria è possibile individuare segmenti di
popolazione caratterizzati da rese notevolmente
diverse, a testimonianza del potere discriminante
dello Scoring.
0.012
0.01
0.008
0.006
0.004
0.002
0
0
50
100
Figura 3
150
200
250
Confronto ottimizzazione ' classi di score' < --> ' categorie'
50.00%
Score _6
45.00%
Catega
13
6 0 .0 0 %
12
14
5 0 .0 0 %
C at egorie
15
4 0 .0 0 %
Resa
Maggiore è la distanza tra le due curve, più efficace
è lo Scoring in termini di capacità discriminante.
Analoghe considerazioni possono essere fatte analizzando la fig. 3. In questo caso vengono messe a
confronto le distribuzioni della variabile score
nell'ipotesi di normalità, verificata empiricamente
con la PROC UNIVARIATE, opzione PROBN e
NORMAL.
L'ultima e determinante fase di validazione dei risultati attesi pone a confronto lo Scoring System
con il criterio tradizionale della recenza frequenza.
A questo proposito abbiamo creato una variabile di
segmentazione in base allo Scoring (SCORE_6) con
numero di modalità pari a quello delle
CATEGORIE dei "cattivi" e di uguale numerosità.
Resa cumulata
D istribuzione delle Categorie all' interno delle classi di Score_6
X = SCORE
16
17
3 0 .0 0 %
2 0 .0 0 %
1 0 .0 0 %
0 .0 0 %
1
2
3
4
5
6
C lassi di Score_6
Figura 6
3.2.7 Implementazione dello Scoring System
Giunti a questa fase, ritenuti soddisfacenti i test
teorici e le verifiche empiriche, lo score
(normalizzato su un intervallo da 0 a 255) diventa
parte del file clienti, pronto per essere utilizzato in
fase di estrazione delle anagrafiche per future iniziative commerciali analoghe a quella che ne ha
permesso la sintesi. Una volta stabilizzato il processo, sarà conveniente utilizzarne più di uno, tenendone sotto controllo l'efficacia nel tempo.
40.00%
CONCLUSIONI
35.00%
30.00%
25.00%
13
Figura 4
12
14
15
17
16
Segmentazione omogenea
Nella fig. 4, ordinata la popolazione campionaria in
funzione della resa, è possibile osservare come lo
Scoring garantisca una resa progressiva media
sempre superiore. Poichè si tratta di valori
progressivi, in corrispondenza dell'ultimo segmento
le due rese coincidono per definizione.
Per il semestre autunno/inverno 1993 la Direzione
Marketing di Postalmarket ha deciso di selezionare i
destinatari di catalogo sia in base al criterio tradizionale che allo Scoring, per confrontare l'efficacia
delle due tecniche di segmentazione. I risultati che
stiamo osservando sono ampiamente soddisfacenti e
ci confermano la validità dello Scoring System
quale strumento per la ricerca dei migliori clienti. Il
risultato economico dell'operazione a fine semestre
fornirà all'azienda precise indicazioni sul possibile
vantaggio comparato in termini monetari.
L'intero progetto, dalle fasi preliminari, alla realizzazione del modello e successiva validazione dei risultati è stato realizzato in ambiente SAS, sfruttandone la struttura modulare e le potenzialità di analisi
statistica.
Bibliografia
Addolorato, F. (1987). Il settore delle vendite per corrispondenza. SDA Bocconi. Milano.
Agresti, A. (1990). Categorical Data Analysis, John Wiley & Sons, New York
Bouroche, J.M. e Saporta, G. (1980). L'analyse des données, C.L.U. Editrice, Napoli.
Bonati, G. (1991), La comunicazione diretta, Giornale di marketing, Giugno, 1991.
Bonati, G. (1993), Tecniche di ottimizzazione della comunicazine diretta. Prossima pubblicazione.
Coppi R. e Bolasco S. (Editors) (1989). Multiway data analysis, Elsevier Science Publishers B.V. (NorthHolland).
Corbetta, P. (1992). Metodi di analisi multivariata per le scienze sociali, Bologna, Il Mulino, 1992
Cramer, J.S. (1991). The logit model for economist, Edward Arnold a div. of Hodder & Stoughton,
London, 1991
Fienberg, S.E. (1983). The Analysis of Cross-Classified Categorical Data, The MIT press (Massachusetts).
Jobson, J.D. (1992). Applied Multivariate Data Analysis, Springer-Verlag New York.
Lauro, N.C. e Siciliano, R. (1989). Exploratory methods and modelling for contingency tables analysis: an
integrated approach. Statistica applicata, Vol.1 n.1, 5-32.
SAS Institute Inc., SAS/STAT User's Guide, Version 6, Fourth Edition, Cary, NC: SAS Institute Inc., 1989.
Siciliano, R. (1991). Reduced-Rank Models for dependence analysis of contingency tables, International
Workshop on Multidimensional Data Analysis, Meeting of Dutch & Italian Schools, October 2-5,
1991, Anacapri, Italy.
Tabachnick B.G., Fidell L.S. (1989). Using Multivariate Statistics, Harper & Row, Publishers, New York.