Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme”
Transcript
Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme”
Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme” Descrizione del problema Una società che distribuisce prodotti (es. capi d’abbigliamento, accessori, …) “grandi firme” (es. Armani, Louis Vuitton, Diesel, Gucci, Alviero Martini…) vuole valutare la “qualità” delle boutique alle quale vende i prodotti facendo un’analisi sul loro fatturato e sulle loro politiche di gestione. Le boutique, dislocate su tutto il territorio italiano, sono caratterizzate da un “indice di popolarità” (“basso”,”medio”,”alto”) a seconda del potenziale bacino di clienti, e da un “indice di qualità” (“basso”,”medio”,”alto”) a seconda delle grandi firme che la boutique gestisce. Ogni prodotto (es. “Pochette Louis Vuitton”, “Cintura Armani”, …) è caratterizzato dalla firma (es. Louis Vuitton, Armani, ...) e da una categoria merceologica (es. borsa, cinture, …). La società è interessata: (i) ad analizzare gli incassi ottenuti dalle boutique ed (ii) a capire come influisce l’esposizione dei prodotti all’interno delle boutique (es. prodotto esposto in vetrina, prodotto esposto in primo piano all’interno del negozio, ...) sulla vendita del prodotto stesso. Gli analisti della società sono interessati ad analizzare essenzialmente due aspetti. Da un lato si è interessati ad analizzare la quantità dei prodotti venduti e l’incasso effettuato in funzione: • della boutique, della provincia e della regione in cui si trova la boutique • dell’indice di popolarità e dell’indice di qualità della boutique • del prodotto, • della firma e della categoria merceologica del prodotto • della data, del mese e dell’anno • dell’ora del giorno • del fatto che il giorno sia festivo o no Dall’altro lato si è interessati ad analizzare l’indice di efficacia dell’esposizione, definita come il rapporto percentuale tra la quantità totale di prodotti venduti e la quantità totale di prodotti esposti. L’indice di efficacia si deve poter analizzare in funzione: • della boutique, della provincia e della regione in cui si trova la boutique • del tipo di esposizione • della categoria merceologica del prodotto • della data, del mese, del bimestre, del trimestre, del semestre e dell’anno Il data warehouse realizzato deve contenere le informazioni relative agli anni 1999-2008. I dirigenti vogliono poter disporre delle seguenti informazioni: (a) Trovare per ogni prodotto la quantità totale venduta in Piemonte nel mese di Aprile 2008. (b) Per ogni coppia (firma, categoria merceologica), trovare l’incasso medio giornaliero realizzato dalle boutique con indice di popolarità alta e indice di qualità medio. (c) Trovare per ogni coppia (boutique, firma) l’incasso effettuato dalle ore 10 alle ore 15:00 nei giorni festivi del 2008. (d) Considerando solo le boutique del Trentino Alto Adige, per ogni coppia (categoria merceologica, boutique) trovare l’indice di efficacia dell’esposizione in ogni giorno di aprile 2007. (e) Per ogni boutique trovare l’indice di efficacia dell’esposizione in ogni giorno di marzo 2007. (f) Relativamente al 2008, considerando solo le boutique con indice di popolarità “alto”, per ogni terna (firma, mese, boutique), trovare il numero di prodotti venduti e il numero cumulativo di prodotti venduti per ogni coppia (firma, boutique) dall’inizio dell’anno. (g) Considerando solo il primo bimestre del 2006, trovare l’incasso medio giornaliero e il numero medio giornaliero di prodotti venduti dalle ore 10 alle ore 16:00 nei giorni festivi. (h) Per le boutique che nel gennaio 2008 hanno avuto un indice di efficacia inferiore al 20%, trovare l’incasso effettuato in ogni giorno di gennaio 2008 per ogni boutique. Progettazione 1) Progettare 2 sorgenti dati relazionali in cui sono memorizzate le informazioni utili per alimentare il data warehouse descritto in precedenza. Per ogni sorgente è necessario • definire con un diagramma E-R lo schema concettuale della base di dati, • costruire uno schema logico relazionale normalizzato per la stessa base di dati • 2) 3) 4) 5) realizzare gli script necessari per la creazione delle tabelle della base di dati in Oracle XE o Microsoft Visual Studio 2005 • alimentare la base di dati con almeno 1000 tuple. Progettare il data warehouse necessario per soddisfare almeno le richieste descritte nelle specifiche del problema. È possibile inoltre estendere le specifiche del problema. Per il data warehouse è necessario • definire con uno o più Dimensional fact model lo schema concettuale del data warehouse • definire il modello relazionale (ROLAP) del data warehouse • decidere come gestire la dinamicità (variazione) dei dati all’interno delle dimensioni. • realizzare gli script necessari per la creazione delle tabelle del data warehouse in Microsoft Visual Studio 2005 e in Oracle XE. Definire il processo ETL necessario per effettuare il caricamento dei dati presenti nelle 2 sorgenti dati definite al punto (1) all’interno delle tabelle del data warehouse che avete creato al punto (2). Realizzare il processo di ETL con un progetto di Business Intelligence di tipo “Integration services” mediante Microsoft Visual Studio 2005. Per le interrogazioni frequenti (a)-(h) descritte nelle specifiche del problema • esprimere le interrogazioni utilizzando il linguaggio SQL esteso da eseguire in Oracle XE. • usare Microsoft Visual Studio 2005 (Analysis Services Project) per creare i cubi ritenuti utili per rispondere velocemente alle interrogazioni proposte Considerando le caratteristiche del data warehouse realizzato e la cardinalità dei dati memorizzati nel data warehouse, decidere quali viste materializzate potrebbero essere utile definire con Oracle XE al fine di ottimizzare i tempi di risposta delle interrogazioni proposte nelle specifiche del problema. Motivare le scelte fatte e definire le viste. Materiale da consegnare Consegnare una relazione finale in cui si descrive dettagliatamente il progetto svolto. Consegnare gli script per la creazione delle sorgenti dati e per popolarle. Consegnare gli script per la creazione del data warehouse. Consegnare il progetto di Business Intelligence di tipo “Integration services” sviluppato mediante Microsoft Visual Studio 2005 per il processo di ETL. 10) Consegnare il progetto di Business Intelligence di tipo “Analysis Services Project” sviluppato mediante Microsoft Visual Studio 2005 per creare i cubi. 11) Consegnare gli script per effettuare le query e creare le viste materializzate in Oracle XE 6) 7) 8) 9)