sas per la ricerca dei migliori clienti
Transcript
sas per la ricerca dei migliori clienti
SAS PER LA RICERCA DEI MIGLIORI CLIENTI. La progettazione di uno Scoring System per il Direct Marketing Flavio Addolorato*, Giovanni Bonati**, Guido Cuzzocrea***, Alberto Saccardi*** Abstract: lo Scoring System è un insieme integrato di procedure volte alla costruzione di un modello che mette in relazione le caratteristiche di un insieme di individui (la lista dei potenziali clienti) con una variabile obiettivo. Tale variabile rappresenta l'adesione ad una proposta commerciale, mentre le variabili esplicative sono legate al comportamento passato degli individui nei confronti di analoghe iniziative e alle loro caratteristiche anagrafiche. L'obiettivo del progetto consiste nell'assegnazione di un punteggio numerico (score) ad ogni anagrafica del file. Tale punteggio è direttamente collegato alla probabilità che ogni individuo risponda all'azione commerciale. In questo modo è possibile ordinare i potenziali clienti in base allo score e selezionare quelli a cui è associata una probabilità di adesione più elevata. Verranno illustrate la metodologia di base, lo sviluppo in SAS, con particolare riferimento all'utilizzo della PROC CATMOD, i risultati ottenuti. In questa trattazione faremo riferimento al caso specifico della promozione di vendite tramite catalogo non specializzato, ma l'applicabilità dello Scoring System è chiaramente molto più ampia. Paper presentato al convegno SUGItalia ’93, Triestre, ottobre 1993 Il lavoro qui presentato nasce da una collaborazione fra il Centro di Calcolo dell'Università Bocconi e la Direzione Marketing della Postalmarket. Presso il CdC dell'Un. Bocconi si è organizzato un gruppo di lavoro con competenze statistiche, informatiche e di marketing per studiare la progettazione con SAS di uno Scoring System per il Direct Marketing. La Postalmarket, appartenente al gruppo tedesco OTTO VERSAND, è l'azienda leader in Italia nella vendita per corrispondenza, con un fatturato nel '92 di circa 484 miliardi e 1154 addetti. Si propone al mercato con due diverse testate, Postalmarket e BASE, distribuendo semestralmente una tiratura di oltre 2.500.000 cataloghi, grazie alla quale serve più di 1.500.000 famiglie italiane. Fra le aziende italiane è forse quella che più intensamente utilizza tecniche di comunicazione diretta. 1.1 Introduzione. La comunicazione diretta è una tecnica di marketing che mira ad instaurare un rapporto interattivo e quanto più possibile personalizzato fra il propositore di beni e/o servizi e il possibile cliente. Questo approccio al mercato, tipico del Direct Marketing, si contrappone alla comunicazione di massa per la promozione di prodotti commerciali. Naturalmente questa contrapposizione non è assoluta e alle due forme di comunicazione vengono assegnati obiettivi e ruoli diversi: a quella di massa il ruolo strategico della promozione dell'immagine, mentre in specifi* ** *** che realtà aziendali la ricerca del contatto col cliente viene affidata a tecniche di comunicazione diretta. In tale contesto la comunicazione diretta rappresenta uno strumento flessibile che permette, ove correttamente supportato, di controllare l'allocazione ottimale degli investimenti commerciali, garantendo risultati non altrimenti conseguibili. 1.2 La Vendita Per Corrispondenza Il principale settore di applicazione delle tecniche di Direct Marketing è quello delle vendite per corrispondenza (d'ora in poi VPC). La maggior parte dei prodotti e dei servizi possono essere venduti per posta. Praticamente non esistono limiti. In rapporto alle tradizionali forme di commercio al dettaglio, la VPC costituisce un mondo a parte, con leggi, tecniche ed esigenze particolari. Si può ormai parlare di un insieme di competenze specifiche del settore che si basa su moderni strumenti di marketing e avanzate strutture organizzative. La VPC è andata sempre più differenziandosi sia nell'oggetto commerciale che nel modo di proporlo al mercato, ma possiamo ricondurne i molteplici aspetti a tre forme fondamentali: a) vendite tramite catalogo ad assortimento multiplo. Viene offerta una vasta gamma di prodotti di diversi settori merceologici, con un assortimento analogo a quello offerto dai grandi magazzini. b) vendite mediante catalogo specializzato. Le imprese che operano con questa forma offrono un'insieme di prodotti merceologicamente ben delimitato e appositamente costituito. In questo contesto si collocano, fra l'altro, le offerte di prodotti editoriali che permettono alle case editrici in- Banca Commerciale Italiana (Ufficio Studi) - Università Bocconi (Centro di Calcolo) RCS Editori (Sistemi Informativi di Marketing Diretto) - Università Bocconi (Centro di Calcolo) Università Bocconi (Istituto di Metodi Quantitativi - Centro di Calcolo) teressanti sinergie per la disponibilità di un prodotto facilmente e fortemente differenziabile e l'opportunità di un mercato ben caratterizzato costituito dai propri abbonati. c) vendite one-shot. In questa categoria si possono far rientrare non solo offerte "chiavi in mano" di uno o più prodotti a tema, ma anche di abbonamenti a periodici o a club di lettori, di associazione a enti con finalità più o meno benefiche, di raccolta di fondi, di acquisto di prodotti finanziari o di adesione a fondi di investimento. 1.3 Il catalogo Un'azienda che propone un assortimento despecializzato, come Postalmarket, ha contemporaneamente motore e asse portante nel catalogo. Esso sostituisce il negozio in tutte le sue espressioni, rappresenta l'immagine dell'azienda ed è destinato a restare nelle case dei clienti per alcuni mesi. Si aggiunga che un catalogo del genere è composto da più di 700 pagine, viene tirato in milioni di copie e rappresenta uno dei costi principali dell'impresa. Ogni pagina, ogni fotografia, ogni didascalia viene realizzata con la massima cura e tenendo conto del ritorno in termini di ordini. I problemi da affrontare cominciano sin dalla fase di impostazione e sono complicati dal fatto che questa avviene almeno un anno prima dalla spedizione. Una volta realizzato, il catalogo deve giungere nelle mani dei potenziali clienti. La politica più diffusa consiste nell'inviarlo gratuitamente, prima di tutto ai clienti più affezionati, quelli che hanno effettuato degli ordini recentemente, poi agli altri e anche a chi cliente non è mai stato, sempre cercando di far si che la resa marginale prevista sia tale da coprire almeno i costi di stampa e di spedizione. Una volta giunto in una famiglia il catalogo viene accompagnato da un'attentamente studiata serie di messaggi, ora per ricordare un settore di particolare interesse in quel periodo, ora per sottolineare o proporre un vantaggio commerciale o un'azione di saldo. Proprio in corrispondenza del primo di questi rilanci si ottiene il volume di vendita più significativo. Il numero e la frequenza dei mail è oggetto di attento studio, sia per la scelta dei periodi più favorevoli che per evitare di irritare i destinatari con un'eccessiva ripetizione di offerte. La risposta a queste iniziative è comunque molto differenziata e dipende sia dall'adeguatezza del prodotto o del servizio offerto, sia ovviamente dalle caratteristiche del target. 1.4 La segmentazione Compito primario dei responsabili di marketing in questi anni è proprio quello di personalizzare prodotti e servizi per un pubblico specifico, cercando di vedere il consumatore come un individuo con cui stabilire un legame duraturo, "demassificando" le azioni di marketing. Questo lavoro propone un metodo di segmentazione "fine" per ottimizzare il tasso di risposta in tali situazioni. Segmentare, in questo caso, significa poter scegliere solo alcune categorie di persone dalle liste proprie o acquisite, in modo che la loro probabilità di acquisto sia superiore a quella media dell'intera lista. L'impatto di quest'operazione per una società come Postalmarket, che deve scegliere 2.500.000 destinatari in un archivio di 17.000.000 di anagrafiche, determina l'andamento dell'intero esercizio. La dimensione del beneficio ottenibile con la segmentazione dipende da due fattori: la quantità e la qualità delle informazioni individualmente disponibili e la capacità discriminante della tecnica utilizzata per svolgere l'analisi. 2.1 La conoscenza del consumatore: il file clienti e prospect. L'abbattimento del costo delle risorse di calcolo per la gestione di grandi masse di dati e lo sviluppo di strumenti operativi di analisi di dati qualitativi hanno condotto a risultati talmente interessanti nel campo degli atteggiamenti da giustificare ampiamente investimenti in direzione di una migliore conoscenza del consumatore. L'informazione è la chiave di volta di tutto il processo di Direct Marketing. Questa modalità di vendita permette l'apertura di un colloquio a distanza con l'utente e la lontananza costituisce una barriera non solo fisica, ma anche psicologica fra le parti in gioco. Tale barriera può essere in parte abbattuta se si dispone di elementi conoscitivi sull'interlocutore e su come ha reagito ai precedenti contatti. La gestione di queste informazioni deve assolvere a tre funzioni fondamentali: indirizzabilità del messaggio; personalizzazione del messaggio; interpretazione degli atteggiamenti e previsione dei comportamenti. Ci occuperemo della terza funzione e vedremo come sia possibile utilizzare l'informazione non solo a scopi descrittivi ma, con maggior vantaggio, a fini predittivi di atteggiamenti futuri per ottimizzare le risposte di mercato. 2.1.1 Informazioni di riconoscimento. Sono essenzialmente contenute nell'anagrafica di ogni individuo. Per questo tipo di dati esistono complessi sistemi di procedure per individuare, all'interno di stringhe non strutturate, tutti gli elementi caratteristici di un indirizzo, di verificarne la correttezza e la congruenza con i codici di avviamento postale, di identificare omonimie e doppioni, di correlare individui appartenenti allo stesso nucleo familiare. L'inserimento dell'anagrafica nel database aziendale si conclude con l'attribuzione di uno o più codici numerici. 2.1.2 Informazioni descrittive. Queste informazioni servono a definire la fisionomia dell'individuo. Alcune sono direttamente desumibili dall'indirizzo, altre vengono raccolte per mezzo di questionari o acquisite da aziende esterne specializzate in "list brokering" o che semplicemente acquisiscono questi dati per altri fini (garanzie di elettrodomestici, associazioni a club, abbonamenti, concorsi, registro dei protesti, ...). 2.1.3 Informazioni aziendali. Riguardano tutti gli eventi rilevati direttamente dall'operatore economico e relativi specificatamente all'attività dell'individuo come cliente, più o meno attivo, dell'azienda. Sono i dati a più elevata dinamicità e quelli più connessi all'attività aziendale, quindi non sorprenderà la cura con cui vengono raccolti dalle imprese operanti nel settore, anche quando non hanno importanza strettamente amministrativa. Dati sui tempi e le modalità di acquisizione dell'anagrafica, sulle preferenze rispetto ai diversi tipi di sconto o di omaggio, sulle modalità di pagamento, sulle merceologie e sui servizi preferiti, oltre naturalmente all'analitica registrazione dei valori acquisiti, pagati e da pagare rappresentano un magma imponente e in costante movimento che solo una corretta ed efficiente organizzazione informativa ed informatica è in grado di controllare. 2.2 Segmentazione con RFM L'ottimizzazione delle risposte passa attraverso l'individuazione, all'interno del target, di sottoinsiemi omogenei di consumatori per i quali è possibile determinare la potenzialità media di consumo. L'ordinamento successivo dei sottoinsiemi per potenzialità decrescenti ci consente di isolare le fasce più redditizie sulle quali calare la comunicazione diretta. Un metodo semplice di segmentazione è quello che fa uso delle informazioni sulla recenza, sulla frequenza e sul valor medio degli acquisti. Il metodo noto con il nome di RFM (recenza, frequenza, monetarietà), è stato largamente impiegato dalle aziende di VPC e, forse proprio grazie alla sua semplicità, continua a dimostrarsi di grande efficacia. Nel nostro caso l'azienda operava con i soli criteri di recenza e frequenza, segmentando il proprio file clienti in 17 categorie corrispondenti ad altrettante combinazioni di acquisto/non acquisto negli ultimi 6 cataloghi. L'esperienza aziendale ha dimostrato che i rendimenti più elevati nell'immediato futuro sono dati da coloro che hanno effettuato almeno un acquisto nell'ultimo semestre: le categorie dalla 1 alla 11, i cosiddetti clienti "buoni". Gli appartenenti alle restanti categorie più coloro che clienti non sono mai stati non potranno che essere definiti "cattivi". 3 SCORING SYSTEM INTEGRATO 3.1 Che cos'è e a cosa serve Lo Scoring System consiste in un insieme di procedure volte alla costruzione di un modello che metta in relazione le caratteristiche di un insieme di individui (i possibili destinatari catalogo della testata Postalmarket) con una variabile obiettivo. La variabile obiettivo rappresenta l'adesione o meno ad una proposta commerciale (in questo caso acquista, non acquista nel corso del catalogo), mentre le variabili esplicative provengono dai patrimoni informativi descritti ai punti 2.1.2 e 2.1.3: si tratta delle caratteristiche (anagrafiche) dei potenziali clienti e dei comportamenti passati di questi nei confronti della testata Postalmarket. In termini predittivi, l'implementazione del modello permette di assegnare un punteggio (score) ad ogni anagrafica del file, in base all'appartenenza a segmenti omogenei rispetto alle variabili esplicative. Tale punteggio esprime la probabilità che il generico individuo appartenente ad un segmento effettui atti d'acquisto connessi al catalogo in via di spedizione. Ciascun segmento è caratterizzato da una diversa propensione all'acquisto e l'efficacia del modello può essere misurata in termini di capacità discriminante rispetto alla propensione media: fissato il numero di cataloghi da spedire sarà possibile selezionare la corrispondente fascia di destinatari "significativamente migliore" rispetto alla media. In questo contesto, lo Scoring System è un sistema predittivo che parte dal presupposto che gruppi di individui con determinate caratteristiche e comportamenti passati manterranno costante il proprio atteggiamento (acquista/non acquista) nell'immediato futuro. 3.2 Come si realizza Lo Scoring System si compone di moduli di varia natura: organizzativi, procedurali, di analisi e di calcolo. Ogni modulo contempla report che permettono di valutare la qualità dell'elaborazione eseguita e la struttura dei fenomeni emergenti.. Nella fig. 1 vengono presentate la macro struttura del flusso del sistema e le procedure SAS utilizzate in ciascuna fase. Analizziamo in sintesi il contenuto di ciascun modulo. SCORING SYSTEM Individuazione del target omogeneo su cui condurre lo studio. Definizione del fenomeno da spiegare e organizzazione della base dati del target. Data Step 3.2.1 Targetting Data Step 3.2.2 Sampling Scelta del disegno e della numerosità campionaria. Estrazione del campione. 3.2.3 Prescreening Selezione delle varabili statisticamente connesse col fenomeno da spiegare. 3.2.4 Screening Costruzione delle macro variabili che determinano la griglia di segmentazione. Proc Catmod 3.2.5 Scoring SAS/Graf 3.2.6 Validazione Verifica teorica del potere disrciminante e della robustezza dello scoring. 3.2.7 Implement azione Calcolo e attribuzione del punteggio di score normalizzato al file target Proc Freq Proc Freq Proc Stepdisc Data Step Proc Freq Proc Catmod Scelta del modello e stima dei parametri, in base ai criteri di parsimonia, robustezza e capacità discriminante. Proc Univariate Data Step 3.2.1 Targetting Lo Scoring System risulta efficace all'interno di un target omogeneo. Se infatti esiste una variabile di fondo molto discriminante e prevalente sulle altre, i comportamenti saranno spiegati prevalentemente da questa sola caratteristica, rendendo ininfluenti le altre variabili ed inconsistente lo studio. Nel caso specifico della Postalmarket si è deciso di applicare lo Scoring a quelle anagrafiche del file definite "cattive". Le anagrafiche definite "buone", in base ai criteri tradizionali di recenza frequenza, manifestano infatti una propensione all'acquisto nettamente superiore alla media e sicuramente profittevole. Inoltre il numero di informazioni associate al segmento "cattivi" è minimo e ciò rende ancor più necessaria la presenza di un sistema integrativo per supportare la scelta dei destinatari di catalogo. Tenendo presente le precedenti considerazioni schematizziamo i passi successivi del modulo Targetting, facendo particolare riferimento al caso Postalmarket: 1. 2. 3. definire l'obiettivo commerciale dell'operazione => Invio catalogo ai potenziali clienti con maggior propensione all'acquisto; individuare il target omogeneo specifico => Le anagrafiche appartenenti al segmento "cattivi" del file; analizzare la struttura dell'archivio dei potenziali clienti definendo le variabili da considerare esplicative (caratteristiche anagrafiche e comportamenti passati) e la variabile da spiegare (acquista/non acquista). Il risultato del modulo è il FILE TARGET, completo di variabili esplicative e variabile da spiegare, per l'insieme di individui che si è deciso di segmentare. 3.2.2 Sampling In questa fase si esegue un campionamento del file target per costruire una base di studio sufficientemente rappresentativa dell'universo di riferimento, ma adeguatamente contenuta per razionalizzare tempi e costi di analisi. Nel caso di Postalmarket, l'esigenza di effettuare lo Scoring su un target omogeneo può ulteriormente incrementare il costo di gestione di ciascun elemento del campione: la pressione commerciale effettuata attraverso omaggi, sconti e altro deve essere uguale per tutti e, per non perdere in termini di resa, pari al livello massimo. Al di là di tutte queste considerazioni la scelta della numerosità campionaria dipende dal numero di segmenti omogenei determinati in base allo Scoring e dalla distribuzione delle anagrafiche al loro interno: visto in questi termini il modello si propone di stimare il parametro di una popolazione bernoulliana in ciascun segmento. Semplici considerazioni sul livello di Standard Error desiderato consentirebbero quindi di stabilire l'ampiezza del campione. Tuttavia ciò significherebbe conoscere a priori i risultati del modello. A tale proposito è stata effettuata un'analisi preliminare, con l'implementazione di un prototipo di modello su un campione pilota che ha fornito indicazioni non solo sulla numerosità totale, ma anche sulle modalità di stratificazione del campione effettivo. Il campione di ampiezza 50.000, estratto nel nostro caso, va ben oltre le migliori aspettative del più esigente statistico. Il disegno è stratificato in modo proporzionale sulle variabili: AREA NIELSEN, AMPIEZZA di CENTRO (<=10.000 abitanti, da 10.000 a 100.000 abitanti, >100.000), CATEGORIA (determinata in base alla recenza/frequenza). Queste variabili, già disponibili sul file, sono anche risultate significativamente connesse al comportamento acquista/non acquista (PROC FREQ di SAS/STAT e relative statistiche Chi-quadrato). All'interno della griglia di 255 strati così ottenuta è stata effettuata un'estrazione casuale, con passo pari ad 1/27. Il modello finale ha generato 67 aree di resa teorica con una numerosità media campionaria di 750 anagrafiche ed un livello di Standard Error relativo ampiamente soddisfacente. 3.2.3 Prescreening All'interno di questo modulo viene eseguita una prima selezione delle variabili che risultano statisticamente connesse al comportamento di acquisto nel corso del catalogo. I criteri utilizzati per la selezione dipendono dalla natura delle variabili, qualitative (sesso, regione di appartenenza,...) o quantitative (numero di ordini, valore dell'ordinato,...). Per le prime si costruiscono le tabelle di contingenza con la variabile obiettivo e si considerano indicatori costruiti sulla base della statistica Chi-quadrato. La procedura SAS utilizzata è la PROC FREQ con l'opzione MEASURES. La fase di prescreening per variabili esplicative di natura quantitativa viene eseguita con la PROC STEPDISC. Data una variabile da spiegare ed un insieme di variabili quantitative, tale procedura individua quelle che congiuntamente hanno più elevato potere discriminante. Vengono quindi escluse dall'analisi le variabili non rilevanti per lo Scoring. 3.2.4 Screening L'obiettivo dello Screening è quello di costruire le variabili da inserire nel modello di segmentazione finale. I criteri seguiti sono quelli della parsimonia, robustezza e capacità discriminante. Sulla base delle caratteristiche selezionate nella fase precedente vengono eseguite delle aggregazioni tra le modalità di una stessa variabile e fusioni tra variabili con significato logico similare, connesse subordinatamente alla dicotomica obiettivo. Le variabili in gioco sono per lo più categoriche e perciò, ai fini della valutazione della connessione vengono utilizzati modelli log-lineari (PROC CATMOD). Aggregazione e fusione vengono invece effettuate in maniera semiautomatica con delle macro sviluppate in SAS. Nel caso dello Scoring System implementato per il catalogo autunno/inverno 1993 si è giunti alla costruzione di due macrovariabili, una che riassume il comportamento passato del potenziale cliente, l'altra di natura territoriale. esplicative sono non siginficative, ossia modelli ad effetti principali. Questi risultano di maggior robustezza e più immediata interpretabilità. La PROC CATMOD (CATegorical MODel) di SAS/STAT permette la stima lineare di modelli per l'analisi di dati categoriali rappresentabili con tavole di contingenza. In particolare si ha la possibilità di stimare i parametri di un modello LOGIT, disponendo di numerose misure statistiche per valutarne la bontà. Per quanto riguarda la validità del modello nel suo complesso gli indicatori da considerare sono i Chi-Square Test (Wald Test) per ogni effetto introdotto ed il Likelihood Ratio Test. L'elevata numerosità campionaria e la correttezza dell'ipotesi di multinomialità della popolazione ci ha consentito di ottenere la stima dei coefficienti con il metodo della massima verosimiglianza e di valutarne la significatività ancora con le statistiche di Wald. Un'approfondita analisi grafica e statistica dei residui completa la fase di scelta del modello. In base alla griglia finale di segmentazione, il modello assegna le probabilità teoriche di acquisto alle anagrafiche del campione. 3.2.6 Validazione In termini operativi, prima di estendere i risultati dello Scoring al file Target, si esegue una valutazione dei risultati attesi utilizzando i dati campionari. La segmentazione sul campione ha generato 67 classi con resa che va da un minimo del 13.0% ad un massimo del 58.2%, con valori del primo, secondo e terzo quartile rispettivamente di 20.4%, 26.0% e 31.5%. Il miglior 25% del campione ha una resa media teorica pari a 39.5%, il peggior 25% pari a 17.7%, rispetto ad una resa media complessiva del 26.5%. SCORE categorie 12-17 100% 90% 80% Perc. Clienti 70% Perc. Non Clienti 50% 40% 30% 20% 10% 260 240 220 200 180 160 140 120 100 80 60 40 0% 20 Questo modulo rappresenta il nocciolo dell'intero sistema. L'obiettivo è determinare il modello che meglio rappresenta la relazione tra la variabile acquista/non_acquista e le macrovariabili selezionate in fase di Screening. La natura dicotomica della variabile dipendente e la finalità di prevedere la probabilità di acquisto per ciascun elemento del file ci ha indotto ad utilizzare un modello della classe LOGIT. Il processo di aggregazione e fusione messo in atto nella fase di Screening consente di ottenere modelli in cui le interazioni tra variabili 60% 0 3.2.5 Scoring Figura 2 Le successive valutazioni sono state effettuate in termini di score. Per score si intende un punteggio numerico ottenuto da una trasformazione monotona della resa teorica. In particolare, un'ulteriore valutazione dei risultati attesi la si ottiene D istribuzione delle classi di Score_6 all' interno delle Categorie 6 0 .0 0 % Score_6 5 0 .0 0 % 1 4 0 .0 0 % Resa suddividendo il campione nei due sottoinsiemi degli acquirenti/non acquirenti nel catalogo corrente e confrontando le due distribuzioni dello score. Nella fig. 2 vengono presentati gli scatter plot relativi alle percentuali progressive di acquirenti e non acquirenti, in corrispondenza di ciascun livello di score. 2 3 3 0 .0 0 % 4 5 2 0 .0 0 % 6 1 0 .0 0 % 0 .0 0 % Divergenza score ordinamento crescente 13 f(x) 0.016 12 14 Acquista Non acquista 0.014 15 17 16 C ategorie Figura 5 Nelle fig. 5 e 6 sono presentate rispettivamente le distribuzioni della variabile SCORE_6 per CATEGORIA e viceversa: come si nota all'interno di ogni categoria è possibile individuare segmenti di popolazione caratterizzati da rese notevolmente diverse, a testimonianza del potere discriminante dello Scoring. 0.012 0.01 0.008 0.006 0.004 0.002 0 0 50 100 Figura 3 150 200 250 Confronto ottimizzazione ' classi di score' < --> ' categorie' 50.00% Score _6 45.00% Catega 13 6 0 .0 0 % 12 14 5 0 .0 0 % C at egorie 15 4 0 .0 0 % Resa Maggiore è la distanza tra le due curve, più efficace è lo Scoring in termini di capacità discriminante. Analoghe considerazioni possono essere fatte analizzando la fig. 3. In questo caso vengono messe a confronto le distribuzioni della variabile score nell'ipotesi di normalità, verificata empiricamente con la PROC UNIVARIATE, opzione PROBN e NORMAL. L'ultima e determinante fase di validazione dei risultati attesi pone a confronto lo Scoring System con il criterio tradizionale della recenza frequenza. A questo proposito abbiamo creato una variabile di segmentazione in base allo Scoring (SCORE_6) con numero di modalità pari a quello delle CATEGORIE dei "cattivi" e di uguale numerosità. Resa cumulata D istribuzione delle Categorie all' interno delle classi di Score_6 X = SCORE 16 17 3 0 .0 0 % 2 0 .0 0 % 1 0 .0 0 % 0 .0 0 % 1 2 3 4 5 6 C lassi di Score_6 Figura 6 3.2.7 Implementazione dello Scoring System Giunti a questa fase, ritenuti soddisfacenti i test teorici e le verifiche empiriche, lo score (normalizzato su un intervallo da 0 a 255) diventa parte del file clienti, pronto per essere utilizzato in fase di estrazione delle anagrafiche per future iniziative commerciali analoghe a quella che ne ha permesso la sintesi. Una volta stabilizzato il processo, sarà conveniente utilizzarne più di uno, tenendone sotto controllo l'efficacia nel tempo. 40.00% CONCLUSIONI 35.00% 30.00% 25.00% 13 Figura 4 12 14 15 17 16 Segmentazione omogenea Nella fig. 4, ordinata la popolazione campionaria in funzione della resa, è possibile osservare come lo Scoring garantisca una resa progressiva media sempre superiore. Poichè si tratta di valori progressivi, in corrispondenza dell'ultimo segmento le due rese coincidono per definizione. Per il semestre autunno/inverno 1993 la Direzione Marketing di Postalmarket ha deciso di selezionare i destinatari di catalogo sia in base al criterio tradizionale che allo Scoring, per confrontare l'efficacia delle due tecniche di segmentazione. I risultati che stiamo osservando sono ampiamente soddisfacenti e ci confermano la validità dello Scoring System quale strumento per la ricerca dei migliori clienti. Il risultato economico dell'operazione a fine semestre fornirà all'azienda precise indicazioni sul possibile vantaggio comparato in termini monetari. L'intero progetto, dalle fasi preliminari, alla realizzazione del modello e successiva validazione dei risultati è stato realizzato in ambiente SAS, sfruttandone la struttura modulare e le potenzialità di analisi statistica. Bibliografia Addolorato, F. (1987). Il settore delle vendite per corrispondenza. SDA Bocconi. Milano. Agresti, A. (1990). Categorical Data Analysis, John Wiley & Sons, New York Bouroche, J.M. e Saporta, G. (1980). L'analyse des données, C.L.U. Editrice, Napoli. Bonati, G. (1991), La comunicazione diretta, Giornale di marketing, Giugno, 1991. Bonati, G. (1993), Tecniche di ottimizzazione della comunicazine diretta. Prossima pubblicazione. Coppi R. e Bolasco S. (Editors) (1989). Multiway data analysis, Elsevier Science Publishers B.V. (NorthHolland). Corbetta, P. (1992). Metodi di analisi multivariata per le scienze sociali, Bologna, Il Mulino, 1992 Cramer, J.S. (1991). The logit model for economist, Edward Arnold a div. of Hodder & Stoughton, London, 1991 Fienberg, S.E. (1983). The Analysis of Cross-Classified Categorical Data, The MIT press (Massachusetts). Jobson, J.D. (1992). Applied Multivariate Data Analysis, Springer-Verlag New York. Lauro, N.C. e Siciliano, R. (1989). Exploratory methods and modelling for contingency tables analysis: an integrated approach. Statistica applicata, Vol.1 n.1, 5-32. SAS Institute Inc., SAS/STAT User's Guide, Version 6, Fourth Edition, Cary, NC: SAS Institute Inc., 1989. Siciliano, R. (1991). Reduced-Rank Models for dependence analysis of contingency tables, International Workshop on Multidimensional Data Analysis, Meeting of Dutch & Italian Schools, October 2-5, 1991, Anacapri, Italy. Tabachnick B.G., Fidell L.S. (1989). Using Multivariate Statistics, Harper & Row, Publishers, New York.