Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme”

Transcript

Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme”
Tesina di analisi di basi di dati: Società di distribuzione “Grandi firme” Descrizione del problema
Una società che distribuisce prodotti (es. capi d’abbigliamento, accessori, …) “grandi firme” (es. Armani,
Louis Vuitton, Diesel, Gucci, Alviero Martini…) vuole valutare la “qualità” delle boutique alle quale vende i
prodotti facendo un’analisi sul loro fatturato e sulle loro politiche di gestione. Le boutique, dislocate su tutto il
territorio italiano, sono caratterizzate da un “indice di popolarità” (“basso”,”medio”,”alto”) a seconda del
potenziale bacino di clienti, e da un “indice di qualità” (“basso”,”medio”,”alto”) a seconda delle grandi firme
che la boutique gestisce. Ogni prodotto (es. “Pochette Louis Vuitton”, “Cintura Armani”, …) è caratterizzato
dalla firma (es. Louis Vuitton, Armani, ...) e da una categoria merceologica (es. borsa, cinture, …). La società
è interessata: (i) ad analizzare gli incassi ottenuti dalle boutique ed (ii) a capire come influisce l’esposizione
dei prodotti all’interno delle boutique (es. prodotto esposto in vetrina, prodotto esposto in primo piano
all’interno del negozio, ...) sulla vendita del prodotto stesso.
Gli analisti della società sono interessati ad analizzare essenzialmente due aspetti.
Da un lato si è interessati ad analizzare la quantità dei prodotti venduti e l’incasso effettuato in funzione:
• della boutique, della provincia e della regione in cui si trova la boutique
• dell’indice di popolarità e dell’indice di qualità della boutique
• del prodotto,
• della firma e della categoria merceologica del prodotto
• della data, del mese e dell’anno
• dell’ora del giorno
• del fatto che il giorno sia festivo o no
Dall’altro lato si è interessati ad analizzare l’indice di efficacia dell’esposizione, definita come il rapporto
percentuale tra la quantità totale di prodotti venduti e la quantità totale di prodotti esposti. L’indice di efficacia
si deve poter analizzare in funzione:
• della boutique, della provincia e della regione in cui si trova la boutique
• del tipo di esposizione
• della categoria merceologica del prodotto
• della data, del mese, del bimestre, del trimestre, del semestre e dell’anno
Il data warehouse realizzato deve contenere le informazioni relative agli anni 1999-2008.
I dirigenti vogliono poter disporre delle seguenti informazioni:
(a) Trovare per ogni prodotto la quantità totale venduta in Piemonte nel mese di Aprile 2008.
(b) Per ogni coppia (firma, categoria merceologica), trovare l’incasso medio giornaliero realizzato dalle
boutique con indice di popolarità alta e indice di qualità medio.
(c) Trovare per ogni coppia (boutique, firma) l’incasso effettuato dalle ore 10 alle ore 15:00 nei giorni festivi
del 2008.
(d) Considerando solo le boutique del Trentino Alto Adige, per ogni coppia (categoria merceologica,
boutique) trovare l’indice di efficacia dell’esposizione in ogni giorno di aprile 2007.
(e) Per ogni boutique trovare l’indice di efficacia dell’esposizione in ogni giorno di marzo 2007.
(f) Relativamente al 2008, considerando solo le boutique con indice di popolarità “alto”, per ogni terna
(firma, mese, boutique), trovare il numero di prodotti venduti e il numero cumulativo di prodotti venduti
per ogni coppia (firma, boutique) dall’inizio dell’anno.
(g) Considerando solo il primo bimestre del 2006, trovare l’incasso medio giornaliero e il numero medio
giornaliero di prodotti venduti dalle ore 10 alle ore 16:00 nei giorni festivi.
(h) Per le boutique che nel gennaio 2008 hanno avuto un indice di efficacia inferiore al 20%, trovare
l’incasso effettuato in ogni giorno di gennaio 2008 per ogni boutique.
Progettazione
1)
Progettare 2 sorgenti dati relazionali in cui sono memorizzate le informazioni utili per alimentare il data
warehouse descritto in precedenza. Per ogni sorgente è necessario
• definire con un diagramma E-R lo schema concettuale della base di dati,
• costruire uno schema logico relazionale normalizzato per la stessa base di dati
•
2)
3)
4)
5)
realizzare gli script necessari per la creazione delle tabelle della base di dati in Oracle XE o
Microsoft Visual Studio 2005
• alimentare la base di dati con almeno 1000 tuple.
Progettare il data warehouse necessario per soddisfare almeno le richieste descritte nelle specifiche del
problema. È possibile inoltre estendere le specifiche del problema. Per il data warehouse è necessario
• definire con uno o più Dimensional fact model lo schema concettuale del data warehouse
• definire il modello relazionale (ROLAP) del data warehouse
• decidere come gestire la dinamicità (variazione) dei dati all’interno delle dimensioni.
• realizzare gli script necessari per la creazione delle tabelle del data warehouse in Microsoft Visual
Studio 2005 e in Oracle XE.
Definire il processo ETL necessario per effettuare il caricamento dei dati presenti nelle 2 sorgenti dati
definite al punto (1) all’interno delle tabelle del data warehouse che avete creato al punto (2). Realizzare
il processo di ETL con un progetto di Business Intelligence di tipo “Integration services” mediante
Microsoft Visual Studio 2005.
Per le interrogazioni frequenti (a)-(h) descritte nelle specifiche del problema
• esprimere le interrogazioni utilizzando il linguaggio SQL esteso da eseguire in Oracle XE.
• usare Microsoft Visual Studio 2005 (Analysis Services Project) per creare i cubi ritenuti utili per
rispondere velocemente alle interrogazioni proposte
Considerando le caratteristiche del data warehouse realizzato e la cardinalità dei dati memorizzati nel
data warehouse, decidere quali viste materializzate potrebbero essere utile definire con Oracle XE al
fine di ottimizzare i tempi di risposta delle interrogazioni proposte nelle specifiche del problema. Motivare
le scelte fatte e definire le viste.
Materiale da consegnare
Consegnare una relazione finale in cui si descrive dettagliatamente il progetto svolto.
Consegnare gli script per la creazione delle sorgenti dati e per popolarle.
Consegnare gli script per la creazione del data warehouse.
Consegnare il progetto di Business Intelligence di tipo “Integration services” sviluppato mediante
Microsoft Visual Studio 2005 per il processo di ETL.
10) Consegnare il progetto di Business Intelligence di tipo “Analysis Services Project” sviluppato mediante
Microsoft Visual Studio 2005 per creare i cubi.
11) Consegnare gli script per effettuare le query e creare le viste materializzate in Oracle XE
6)
7)
8)
9)