statistica e democrazia
Transcript
statistica e democrazia
TECNICHE DI SEGMENTAZIONE PER LA PREVISIONE DELLA REDDITIVITÀ DEI CLIENTI Guido Cuzzocrea, Alberto Saccardi *** CIDER Univ. Bocconi - NUNATAC Servizio Analisi di Marketing *** CDE - Gruppo Mondadori . vincitore SUGItalia ’95, Firenze 25-27 Ottobre 1995 winner SEUGI ’96, Hamburg 11-14 Giugno 1996 Abstract Le reti neuronali non sono uno strumento universale, utilizzabile senza competenze specifiche, per ottenere la migliore e più rapida soluzione ai problemi più complessi: questa opinione non rappresenta una novità, così come non è una novità affermare che esistono spesso analogie tra determinate architetture di rete e modelli statistici. Tutto ciò è tanto più vero quanto più ci si allontana dall’ambito ingegneristico in cui le reti neuronali sono state sviluppate. Ma allora, pensando ad applicazioni di marketing, quando è opportuno considerare una rete neuronale? Quali sono, dal punto di vista operativo, i passi da compiere per progettare e realizzare una rete che fornisca risposte soddisfacenti? Come possiamo avvalerci di conoscenze e strumenti statistici tradizionali per impostare correttamente l’analisi, selezionare le variabili esplicative, comprenderne le relazioni e, infine, valutare il margine di errore dei risultati forniti da una rete? In collaborazione con il Servizio Analisi di Marketing di CDE - Gruppo Mondadori siamo andati alla ricerca di risposte concrete, affrontando un problema di segmentazione e classificazione dei comportamenti di un file clienti, con gli strumenti messi a disposizione da SAS System, software per la costruzione di soluzioni di Business Intelligence. Introduzione La CDE - gruppo MONDADORI da anni opera nel settore della vendita per corrispondenza di prodotti editoriali. Attualmente si pone sul mercato con tre Club del libro: il ‘Club degli Editori’, nato più di trenta anni fa, che si rivolge ad un target molto vasto e poco caratterizzato; ‘Il Circolo’, il club più prestigioso, che promuove un genere di lettura altamente qualificato; il ‘Club per Voi’, che si rivolge ad un target più contenuto di lettori non tanto attenti alla novità, ma che considerano il prezzo come fattore premiante. Il reclutamento dei soci avviene tramite l’adesione ad un’offerta che, per poter catturare anche l’attenzione di quegli individui restii ad acquistare per posta, deve essere molto promozionale. Tale adesione non permette di distinguere il socio interessato solo all’appetibilità del lancio promozionale, dal socio veramente interessato alla lettura. Infatti solo quest’ultimo, con molta probabilità, continuerà ad ordinare dai cataloghi che gli verranno spediti mensilmente. L’obiettivo dell’analisi è prevedere nel minor tempo possibile il comportamento del cliente e, conseguentemente, valutarne la redditività prospettica. Indicazioni corrette di questo tipo consentirebbero d’investire sul target desiderato di soci, oltre a fornire chiavi di lettura per applicare strategie di marketing differenziate. In sintesi lo studio si propone di incrementare la redditività aziendale. L’introduzione in CDE di SAS SYSTEM, avvenuta nel 1994, ha rappresentato una svolta di notevole rilevanza, valorizzando le più avanzate tecniche statistiche. Nel 1995 vengono approcciate le reti neuronali per la previsione della redditività dei soci de ‘Il Circolo’. 1. Il funzionamento dei Club del libro La CDE offre al socio 13 cataloghi all’anno, di 34 pagine ognuno, con circa 100 titoli tra cui almeno 10 novità ed il libro mese, un’opera di rilievo individuata da esperti editoriali. Tutti i libri presenti in catalogo vengono brevemente introdotti e commentati per facilitare la scelta, inoltre sono scontati del 20% e più rispetto alle edizioni presenti in libreria. L’unico impegno richiesto al socio è di acquistare almeno tre libri all’anno per non essere sospeso; tuttavia può disdire l’associazione al club in ogni momento. 2. La banca dati Le informazioni a disposizione per svolgere l’analisi sono di diverso tipo. Occorre distinguere le variabili legate alla semplice anagrafica di un individuo, da quelle che si raccolgono dal momento della sua adesione ad un club. 1 Tra le prime vi sono variabili sociodemografiche, quali l’area geografica, il c.a.p. e il sesso; variabili riguardanti la provenienza dell’anagrafica come l’appartenenza ad una o più liste compilate oltre alle informazioni relative agli abbonamenti ai periodici Mondadori. Tra le seconde, il canale di reclutamento (direct mail, stampa, member-get-member); le variabili commerciali (ordini, rifiuti, pagamenti, resi, sconti, omaggi); i generi di lettura ed infine l’elasticità rispetto alle promozioni. Il lavoro è stato svolto considerando l’insieme informativo riguardante i soci de ‘Il Circolo’. Fig. 1 LA BANCA DATI Liste di provenienza Abbonamenti a testate Anagrafica Soci Anagrafica Prodotti Proposte rifiutate Adesioni passive Ordini In particolare, la redditività consolidata di clienti dopo i primi otto cataloghi di vita è la variabile obiettivo dello studio. Tale variabile è di natura continua. La finalità del progetto è prevedere l’appartenenza di un socio ad alcune classi di redditività consolidata. Quindi, a livello di analisi, la redditività è stata introdotta sia come variabile quantitativa continua, sia come variabile categorica. Infatti, dal punto di vista degli algoritmi di rete, si può lavorare direttamente sulle classi individuate oppure effettuare la previsione sul continuo per poi valutare il margine di errore rispetto alle classi di riferimento. In particolare, riguardo la categorizzazione della redditività consolidata, si sono costruite quattro modalità in base a valutazioni di natura economica. 2.3 Le variabili esplicative Ai fini dell’utilizzo delle reti neuronali in ambiente SAS si è dovuto organizzare la base dati iniziale in modo da avere un record per unità statistica, oltre a trasformare le variabili di natura categorica in insiemi di variabili booleane. 3. La realizzazione del progetto 2.1 Il campione Il problema della segmentazione e classificazione dei clienti impone di analizzare coorti di soci omogenee rispetto all’anzianità raggiunta, ove per anzianità si intende il numero di cataloghi in calendario dopo il primo ricevuto. Si sono quindi considerate le coorti che hanno aderito a ‘Il Circolo’ nell’intervallo temporale 1 Gennaio 1994 - 30 Giugno 1994 e che hanno compiuto otto periodi di anzianità entro il 31 Marzo 1995. In questo modo al 31 Agosto 1995, ultimo aggiornamento disponibile della banca dati al momento dell’analisi, tutte le partite aperte, relative ad eventuali pagamenti in sospeso, possono considerarsi chiuse. Da questa popolazione si è estratto un campione casuale semplice con passo 1 / 10. 2. 2 La variabile obiettivo La redditività del singolo socio viene misurata in base ad un conto economico che contrappone l’importo complessivo pagato ai costi determinati dall’offerta introduttiva, dai cataloghi inviati, dagli investimenti in promozioni (sconti, omaggi editoriali, offerte fedeltà) e dai volumi resi o non pagati. 3.1 Perchè le reti neuronali Oltre alla curiosità di sperimentare uno strumento relativamente nuovo e di dichiarata potenzialità nell’ambito dell’analisi di dati, i motivi che ci hanno suggerito l’utilizzo delle reti neuronali sono sostanzialmente i seguenti: 1. la necessità di risolvere un problema di previsione e di classificazione avendo a disposizione un insieme informativo consistente e complesso; 2. la disponibilità di Software in ambiente SAS. Riguardo la corretta previsione dell’appartenenza ad alcune classi di redditività, la complessità è dovuta al numero, alla natura e all’interconnessione tra le variabili esplicative, complessità tale da far ipotizzare insufficiente la capacità predittiva di un qualunque modello statistico tradizionale. Riguardo la disponibilità di Software, esiste, all’interno dell’ambiente SAS System, la possibilità di addestrare numerose architetture di reti neuronali (tra cui le MLPs, multilayer perceptrons), specificandone tutte le caratteristiche oppure lasciando che il sistema operi le scelte secondo opzioni preimpostate. 2 Con particolare riferimento alle reti MLPs, la difficoltà di utilizzo dello strumento informatico può essere ridotta al punto di specificare soltanto l’elenco e la natura delle variabili di input e della variabile obiettivo. In questo caso il sistema addestra una rete con numero di neuroni e strati nascosti pari a zero e con funzioni di attivazione, link, e danno che dipendono dalla natura delle variabili. Alternativamente è possibile dichiarare il numero di neuroni appartenenti ad uno o più strati nascosti, le funzioni di attivazione del singolo nodo, quelle di link e la funzione di danno in base alla quale avviene l’ottimizzazione dell’algoritmo iterativo. 3.2 Allenamento e test Le reti neuronali possono essere pensate come algoritmi iterativi in grado di imparare a riconoscere, sulla base di un’ampia casistica di esempi, determinate ricorrenze empiriche. In questo senso è opportuno separare l’insieme dei dati a disposizione in due sottocampioni: sul primo viene allenata la rete, mentre sul secondo viene verificata la capacità della rete stessa di generalizzare. Le unità statistiche appartenenti al campione di allenamento rappresentano gli esempi da cui apprendere. Per approssimazioni successive la rete cercherà di adattarsi ai dati, nel senso di imparare a ricostruire la variabile obiettivo a partire delle variabili esplicative. La bontà di adattamento viene misurata in base ad una funzione di danno che confronta la differenza tra i valori osservati della variabile obiettivo e i valori di uscita della rete. La validità dell’algoritmo addestrato sul dataset di allenamento va poi verificata sul dataset di test. Infatti, è di fondamentale importanza stabilire se la legge empirica appresa è sufficientemente generale. Detto in altri termini, è necessario verificare come si comporta la rete nel ricostruire la variabile obiettivo considerando nuove unità statistiche. Si è quindi suddivisio il campione omogeneo in due sottocampioni casuali, utilizzando una funzione per la generazione di numeri aleatori (la funzione RANUNI, Random Uniform, di SAS/BASE). 3.3 L’utilizzo delle RETI senza rete Una volta predisposta la banca dati, individuati il campione di allenamento e di test, la variabile obiettivo e l’insieme di tutte le possibili variabili esplicative, si è tentato un approccio semi- automatico all’applicazione delle reti neuronali. Infatti è stato più volte affermato che queste ultime sono potenti strumenti matematici, utilizzabili senza avere particolari competenze statistiche e\o approfondite conoscenze del fenomeno oggetto di studio. Abbiamo quindi addestrato alcune architetture mettendo in input tutte le variabili a disposizione e in output la variabile obiettivo continua oppure la categorica. I risultati ottenuti sono stati piuttosto deludenti, confermando le aspettative iniziali. Infatti, le variabili esplicative erano in numero sicuramente troppo elevato rispetto ai contributi informativi specifici: oltre 100 variabili delle quali una buona parte scarsamente significative al fine della previsione della redditività, altre con contributi informativi duplicati, molto correlate o, comunque, fortemente connesse. E’ apparso subito evidente come il grande numero di pesi e parametri ridondanti da stimare determinasse la mancanza di robustezza della rete. Infatti, se sul campione di allenamento i risultati potevano considerarsi soddisfacenti, la verifica sul campione di test forniva, in modo più che esaustivo, una misura dell’inadeguatezza dello strumento. La considerazione precedente è risultata tanto più vera quanto più complessa era l’architettura di rete utilizzata: aumentando il numero di neuroni e\o di strati, a parità di altre condizioni, migliorava il fit e peggiorava ulteriormente la capacità di generalizzare. 3.4 Adattamento e capacità di generalizzare La relazione esistente tra bontà di adattamento e capacità di generalizzare di una rete neuronale è riconducibile al concetto di robustezza di un tradizionale modello statistico: esiste una relazione inversa tra il numero di variabili esplicative introdotte e la stabilità del modello stesso. Nel caso delle reti neuronali la problematica, però, è duplice: non solo è importante evitare l’introduzione di variabili di input non significative ed in grado di apportare solo disturbo, è altrettanto importante tenere sotto controllo la complessità dell’algoritmo. Infatti maggiore è l’adeguamento al particolare, ottenibile aumentando il numero di neuroni e strati nascosti, minore è la capacità di generalizzare: un vestito commissionato su misura difficilmente può essere prestato ad un amico. 3 3.5 La selezione delle variabili di input Il primo passo da effettuare è quindi ridurre il numero di variabili in input. Da questo punto di vista, gli strumenti della statistica tradizionale ci vengono incontro con le varie tecniche di selezione di tipo stepwise: algoritmi per la selezione automatica delle variabili esplicative rilevanti in un modello di tipo regressivo. Si potrebbe contestare che tali tecniche sono disponibili solo nell’ambito dei modelli lineari generalizzati, mentre con le reti neuronali non esiste il limite della linearità. Vi è quindi il rischio di eliminare variabili non significative a livello lineare, che potrebbero invece esserlo considerando relazioni di altro tipo. In realtà, lavorando in ambito multivariato con un numero di variabili esplicative sufficientemente grande, questo rischio è alquanto limitato. Infatti, una variabile poco significativa in termini lineari potrebbe esserlo di più in un contesto generale, ma ciò difficilmente potrà essere vero per una variabile assolutamente non significativa. Queste considerazioni non hanno la pretesa del rigore teorico, tuttavia permettono di formulare una semplice indicazione pragmatica: le tecniche di tipo stepwise possono essere di grande aiuto; per non perdere input preziosi è preferibile applicarle in modo non troppo restrittivo. Nel nostro caso abbiamo applicato due processi di selezione paralleli: uno considerando la variabile obiettivo continua ed un algoritmo stepwise applicato ad un modello di regressione multipla, l’altro considerando le quattro categorie di redditività ed un algoritmo stepwise applicato ad un modello di regressione logistica. In entrambi i casi è stato selezionato un insieme di 15-20 variabili, validate tenendo conto anche delle preziose indicazioni fornite dal Servizio Analisi di Marketing di CDE. Un ulteriore approccio seguito è stato trasformare l’insieme di tutte le variabili esplicative con l’analisi delle componenti principali, per poi selezionare le più discriminanti rispetto alle diverse classi di redditività. 3.6 La scelta dell'architettura di rete Delimitato l’insieme delle variabili di input, rimane da affrontare l’importante aspetto dell’individuazione dell’architettura di rete. Si tratta di scegliere tra diverse strutture più o meno complesse, in base al numero di neuroni, al numero di strati, alle funzioni di attivazione e alle funzioni di link. Nell’ambiente di analisi disponibile all’interno di SAS System esiste la possibilità di utilizzare metodi di selezione automatici per il numero ottimale di neuroni. Limitatamente al caso di un solo strato nascosto, è possibile effettuare un confronto automatico tra architetture con uno, due, tre o più neuroni, indicando quella che ha fornito i migliori risultati. Abbiamo utilizzato queste opzioni automatiche sia nel caso della variabile obiettivo continua, sia con le classi di redditività. Nel primo caso il numero di neuroni selezionato è pari ad uno, mentre nel secondo, due neuroni sono la scelta ottimale. Fig. 2 ARCHITETTURA DI RETE (A) Input Observed X1 X2 Hidden layer Y .... .... Predicted Xn Successivamente si sono considerate architetture di rete a più strati. I miglioramenti ottenuti dal punto di vista del fit (bontà di adattamento) sono stati scarsi, mentre si è registrato un netto peggioramento della capacità predittiva. Anche in questo caso l’eccessiva complessità della rete determina una notevole perdita di robustezza. Per quanto riguarda le funzioni di attivazione, link e danno va detto che la scelta deve tener conto della natura delle variabili di input, della variabile obiettivo e del tipo di problema affrontato. Dunque, la costruzione di una architettura di rete dovrebbe essere guidata da considerazioni di natura applicativa da un lato e statisticomodellistiche dall’altro. Per dare senso concreto a questa affermazione, ecco come abbiamo costruito la rete che ha prodotto i migliori risultati. Innanzitutto, se la decisione è quella di lavorare direttamente con una variabile obiettivo di tipo classificatorio e le variabili di input sono di natura quantitativa, bisogna riconoscere che quello da risolvere è un problema di analisi discriminante. 4 La possibilità di introdurre uno strato di neuroni nascosti permette di superare la linearità delle relazioni, pur utilizzando i classici strumenti dei modelli lineari generali. Poichè si deve effettuare l’assegnazione a quattro classi di redditività, due neuroni paralleli, che possano funzionare da semafori, massimizzano la capacità discriminante. Di conseguenza, le funzioni di attivazione sui singoli neuroni non possono che essere logistiche, mentre quella sulla variabile categorica obiettivo è di tipo logistico multinomiale. Per la loss function sulle classi di redditività, si può dire che l’assegnazione, se corretta, generi un successo, altrimenti un insuccesso (funzione di danno mbernoulli). Fig. 3 ARCHITETTURA DI RETE (B) Input X1 Observed Hidden layer 1 X2 .... 1 .... Xn 0 1 0 0 Predicted 3.6.1 La valutazione dell’errore di previsione Dati gli obiettivi del progetto, è di primaria importanza concentrare l’attenzione sulla bontà di previsione dello strumento proposto. Applicando ciascun algoritmo di rete al campione di test, abbiamo valutato i margini di errore rispetto ad una tabella di contingenza 4x4: redditività osservata in classi incrociata con redditività prevista. Esistono diversi indici di connessione sintetici per valutare la bontà di classificazione rispetto alla tabella di contingenza data. L’errore globale di errata classificazione dipende dal numero di casi al di fuori della diagonale principale sul totale dei casi considerati: una misura di quest’errore potrebbe essere semplicemente il rapporto tra queste due frequenze. L’utilizzo dello strumento in termini operativi suggerisce un diverso criterio di valutazione. Il reparto Servizio di Analisi di Marketing considera profittevoli i soci che hanno consolidato una redditività superiore al valore mediano della distribuzione: in questi termini, la misura dell’errore può essere determinata rispetto ad una tabella di contingenza 2x2, sempre rapportando le frequenze al di fuori della diagonale principale rispetto al numero totale dei casi. Con l’obiettivo di costruire una valutazione dell’errore ancor più connessa al risultato economico dell’azienda, si potrebbe far coincidere la misura dell’errore con la risposta alla domanda: se smetto di investire sui clienti classificati come non redditizi dalla rete, qual’è il rischio di perdere soci buoni? Volendo invece avere una misura del vantaggio dell’utilizzo dello strumento, potremmo concentrarci sulla distribuzione subordinata della redditività osservata in corrispondenza di una previsione positiva: sul totale dei soci che la rete assegna alle classi redditizie, quanti vi apparterranno davvero rispetto al 50% che si verifica spontaneamente? 3.6.2 Le prove di simulazione Per ottenere una giustificazione statisticamente significativa dell’architettura di rete rispetto alle misure di errore precedentemente definite e, contemporaneamente, validare l’intero processo di costruzione, abbiamo effettuato numerose prove di simulazione in base alla logica delle tecniche di ricampionamento. In ogni prova avviene una riestrazione casuale dei campioni di allenamento e di test. Quindi si addestra e si sottopone a verifica la rete, memorizzando ad ogni passo i margini di errore ottenuti. Per ciascun tipo di rete si sono considerati i risultati sintetici di 100 prove di simulazione. 4. I risultati Prima di presentare nel dettaglio i risultati ottenuti, richiamiamo brevemente i principali obiettivi del lavoro. Innanzitutto si voleva progettare uno strumento che consentisse di prevedere la redditività dei clienti acquisiti, in modo da meglio orientare le politiche d’investimento promozionale su catalogo. In secondo luogo, riducendo l’insieme di variabili esplicative alle sole informazioni da non socio, si volevano ottenere buone indicazioni per la selezione dei migliori prospect per il Direct Mail. In conclusione, il raggiungimento dei sopra citati obiettivi garantirebbe un miglioramento della redditività complessiva. 4.1 La redditività del socio prevista in base ai primi comportamenti 5 La rete che ha fornito i migliori risultati, considerando la redditività come variabile continua, è quella costituita da un solo neurone e da un unico strato nascosto. Questa architettura, come W.S. Sarle fa notare in un suo articolo del 1994, equivale ad una regressione non lineare multipla. Analizzando la tabella in figura 4 è possibile valutare la bontà della classificazione proposta. Il valore dell’indice Phi=0.884 è indubbiamente soddisfacente, ma la constatazione più interessante è relativa al margine di errore che si commetterebbe smettendo di investire sui soci previsti poco redditizi: tale errore risulta essere inferiore all’8%. Fig. 4 REDDITIVITA' CONTINUA - RETE CON 1 NEURONE SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST Percent Row Pct Col Pct a patto di poter spiegare la maggior conservatività dello strumento. Dal punto di vista statistico la domanda che ci si pone è perchè, considerando la redditività come variabile continua, sia più probabile commettere errori in eccesso piuttosto che in difetto, ossia dire che un socio sarà profittevole erroneamente piuttosto che il contrario. La forma della distribuzione della redditività fornisce la risposta: tale distribuzione risulta, infatti, essere asimmetrica con una coda più pesante verso destra, provocando, per modelli basati sui valori medi, una distorsione di sovrastima dei valori di previsione. Fig. 6 DISTRIBUZIONE DELLA REDDITIVITA’ 1.6 1.4 1 2 3 4 1 3.82 39.39 72.69 1.06 2.61 20.23 0.21 0.83 3.9 0.17 0.68 3.18 2 4.92 50.74 12.44 27.35 67.11 69.1 5.88 23.69 14.86 1.42 5.76 3.59 3 0.73 7.47 2.3 11.81 28.98 37.45 12.91 51.97 40.92 6.1 24.67 19.33 4 Total 0.23 9.7 2.4 0.99 0.53 40.75 1.3 2.24 5.84 24.83 23.51 24.72 17.02 24.71 68.89 72.06 5.26 39.58 31.54 23.62 1.2 1 0.8 0.6 0.4 0.2 0 mediana media Total 100 Considerando la redditività come variabile categorica, i migliori risultati si sono ottenuti con una rete a due neuroni e uno strato, equivalente ad un modello di analisi discriminante non lineare. La tabella in figura 5 mostra un errore di errata classificazione complessivamente inferiore rispetto al caso precedente, quindi il Phi sale a 0.915. Il rischio di escludere soci buoni è però del 14%. Fig. 5 REDDITIVITA' CATEGORICA - RETE CON 2 NEURONI SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST Percent Row Pct Col Pct 1 2 3 4 1 4.74 47.11 71.64 1.33 3.27 20.1 0.36 1.48 5.5 0.18 0.74 2.77 2 4.8 47.64 8.82 36.07 88.74 66.37 10.38 42.31 19.1 3.1 12.52 5.7 3 0.26 2.63 1.91 2.64 6.49 19.11 7.04 28.67 50.95 3.87 15.65 28.02 4 Total 0.27 10.07 2.63 1.05 0.61 40.65 1.5 2.41 6.76 24.54 27.54 26.8 17.59 24.74 71.09 69.74 6.62 54.35 13.81 25.22 4.2 La scelta dei Prospect per il Direct Mail La progettazione di una rete neuronale per la selezione dei migliori prospect è stata decisa in risposta ad una chiara esigenza applicativa. Inoltre, in presenza di patrimoni informativi poveri, si voleva trovare conferma empirica ad una ipotizzata maggior efficacia delle reti rispetto alle tecniche statistiche tradizionali. Le variabili esplicative a disposizione sono in questo caso l’area geografica, l’appartenenza a liste di anagrafiche, gli eventuali abbonamenti a periodici del Gruppo Mondadori, mentre la variabile obiettivo ha solo due classi di redditività: al di sotto ed al di sopra della mediana. La miglior performance è stata ottenuta con una rete ad un solo neurone. Dalla tabella in figura 7 emerge che il 63% dei soci viene classificato correttamente nella categoria redditizia; questo risultato, se confrontato col 50% della distribuzione marginale, è di sicura valenza applicativa. Total 100 Considerazioni di natura applicativa indurrebbero a considerare migliori i risultati della prima rete, 6 Fig. 7 REDDITIVITA' CATEGORICA PER RECLUTAM. - RETE CON 1 NEURONI SINTESI DI 100 PROVE DI SIMULAZIONE SUL TEST Percent Row Pct Col Pct 1 2 Total 0 26.24 25.23 51.47 50.98 49.02 75.41 38.7 1 8.56 39.97 48.53 17.64 82.36 24.59 61.3 Total 34.8 65.2 100 Successivamente la problematica è stata affrontata utilizzando tecniche statistiche tradizionali dell’analisi dei dati. Sulla base di alcune prove di simulazione, possiamo affermare che effettivamente, in presenza di patrimoni informativi piuttosto poveri, le reti neuronali possono offrire qualche vantaggio. Come ulteriore indicazione sull’utilizzo delle reti progettate, possiamo notare (tabella figura 4) che la conoscenza del comportamento del socio nei primi due cataloghi aumenta l’efficacia dello strumento: sul totale dei soci previsti redditizi, oltre l’80% lo sarà veramente. 5. Conclusioni Sulla base del lavoro svolto emergono alcune considerazioni riguardo l’utilizzo delle reti neuronali in applicazioni di marketing. In primo luogo la conoscenza del fenomeno e l’organizzazione del patrimonio informativo sono di fondamentale importanza: una scelta ragionata degli input, supportata da criteri statistici, ha il vantaggio di semplificare ed irrobustire l’analisi. La definizione di un criterio di misurazione dell’errore, così come un numero significativo di prove di simulazione, sono i passi necessari per validare la bontà di adattamento e la capacità di generalizzare delle reti progettate. Date queste premesse, lo strumento è di facile e versatile impiego. L’ostacolo maggiore risiede nella difficoltà di interpretare il ruolo svolto dalle variabili esplicative nella previsione della variabile obiettivo. Questo aspetto, probabilmente dovuto a scarsa conoscenza degli algoritmi di rete, ne limita attualmente l’utilizzo nei processi decisionali1. Con specifico riferimento all’ambiente di analisi, all’interno di SAS System è possibile organizzare le proprie banche dati in una logica di Data Warehousing, nonché sviluppare modelli per le analisi di marketing e le previsioni basati sia su tecniche statistiche tradizionali che sui moderni strumenti di Data Mining. Questa potenzialità permette di eseguire confronti tra i risultati in modo semplice ed omogeneo e quindi individuare i migliori percorsi di analisi. Dal punto di vista di CDE Mondadori, il risultato ottenuto, come capacità di prevedere con notevole tempestività ed accuratezza la redditività di ogni socio, può essere vantaggiosamente letto in termini di maggiore comprensione delle esigenze di ogni Prospect/Cliente. Si aprono quindi interessanti prospettive nella definizione di offerte sempre più personalizzate, con sicuri benefici anche in termini di conto economico aziendale. Bibliografia Agresti, A. (1990). Categorical Data Analysis, John Wiley & Sons, New York Bouroche, J.M. e Saporta, G. (1980). L'analyse des données, C.L.U. Editrice, Napoli. Jobson, J.D. (1992). Applied Multivariate Data Analysis, Springer-Verlag New York. Sarle, W.S. (1994). Neural Networks and Statistial Models, SAS Institute Inc., Cary, NC, USA. Sarle, W.S. (1995). Neural Networks Implementation in SAS Software, SAS Institute Inc., Cary, NC, USA. SAS Institute Inc., SAS/STAT User's Guide, Version 6, Fourth Edition, Cary, NC: SAS Institute Inc., 1989. Wasserman, P.D. (1989), Neural Computing Theory and Practice, New York: Van Nostrand Reinhold. Wasserman, P.D. (1993), Advanced Methods in Neural Computing, New York: Van Nostrand Reinhold. 1 I più recenti contributi metodologici sono rivolti proprio all’approfondimento di questa problematica. 7