22Settembre_Tarantino

Transcript

22Settembre_Tarantino
DATABASE RELAZIONALI MODELLAZIONE E ARCHITETTURE Classificazione delle sorgenti informative I dati memorizzati in un database sono detti dati strutturati (S) poiché sono rappresentati in un formato rigoroso. I dati semi strutturati (SS) presentano caratteristiche dei dati strutturati e dei non strutturati, per esempio i file HTML/XML utilizzano i tag o altri tipi di marker per identificare le informazioni all'interno delle pagine. I dati non strutturati (NS) sono quelli memorizzati senza alcuno schema, come un testo di narrativa. All'interno dei dati strutturati è possibile distinguere l'informazione e la meta-­‐informazione. Quest'ultima aggiunge informazione al dato, è il caso di una tabella in cui compaiono gli attributi 'Nome' o 'Cognome'. La seconda dimensione riguarda i destinatari dell'informazione: nel caso globale sono tutti gli individui, in quello sociale sono un numero n mentre nel caso personale è un solo individuo. La gestione di questa dimensione richiede l'uso di diverse architetture. Tali architetture sono tecniche costruttive suddivise in livelli (tier 1, tier 2, tier 3, tier n e cloud). Gerarchia dell'informazione Con riferimento al linguaggio naturale, si può vedere come, combinando i simboli che compongono ciascun alfabeto, si accresce il numero di informazioni ma la struttura risulta progressivamente meno definita. La quantità di informazione si può misurare tramite l’alfabeto binario con cui è possibile rappresentare qualsiasi cosa, l’unità di misura utilizzata è il bit. Non è possibile avere un alfabeto con meno di due simboli poiché in tal caso verrebbe meno la convenzione di trascurare i termini non significativi. MODELLI DI DATI, SCHEMI E ISTANZE Scenario della progettazione Il committente espone il problema da risolvere, specificandone i requisiti. La soluzione viene proposta tramite modello concettuale, tale documento deve essere astratto e privo di tecnicismi, il più comprensibile possibile per il committente. Il progettista una volta accordatosi con il committente potrà sviluppare il modello logico in cui vi saranno tutte le informazioni necessarie per far generare un modello fisico, ovvero un artefatto, da parte dei tecnici (implementatori). L’astrazione è una caratteristica fondamentale dell’approccio al database. Con il termine astrazione intendiamo evidenziare le caratteristiche essenziali a discapito dei dettagli organizzativi e dell'archiviazione dei dati. Il modello o più propriamente linguaggio di modellazione, è il linguaggio usato per la rappresentazione a livello concettuale. Lo schema è la descrizione del database mediante diagrammi UML o E/R. L'istanza è una specifica realizzazione dell'artefatto prodotto. Nel caso del database è riferito ai dati memorizzati in un particolare istante di tempo e che vengono chiamati “stato del database” o “istanze del database", ad esempio la tabella studente conterrà l'insieme delle singole entità degli studenti (record) come sue istanze. Il modello relazionale rappresenta il database come un insieme di relazioni. Ogni relazione è una tabella di valori, un file piatto ("flat") di record. Piatto poiché sono presenti solo tipi di dato semplici e non ad esempio una tabella di tabelle o un vettore di vettori come nel caso di modellazione a oggetti in cui non è possibile ridurre in modo perfetto gli elementi a tabelle piatte. Chi usa le informazioni? Ogni utente ha un punto di vista differente sulle informazioni. In questo modo viene fornita una visione parziale dei dati memorizzati (user type) nel digital ecosystem o minimondo. Ad esempio un correntista visiona esclusivamente i dati relativi al proprio conto corrente mentre un addetto bancario può consultare i dati relativi ad ogni cliente della banca per effettuare operazioni di verifica o di gestione dei dati. Alcune definizioni DDL (data definition language): è un linguaggio che permette la modifica, la creazione e l’eliminazione degli oggetti di un database, è un compito esclusivo del progettista. DML (data manipulation language): è un linguaggio per inserire, aggiornare, leggere o eliminare dati da un database (operazioni CRUD). GUI (graphic user interface): interfaccia grafica di interazione dell'utente con il sistema. CHI (Computer Human Interaction): modalità di interazione dell'utente con il computer. Con il termine database si intende un insieme organizzato di dati. Il linguaggio che interroga crea e gestisce il database è SQL. I DMBS (Database Management Systems) sono una serie di sistemi software per la gestione di un database (esempi: Mysql, Access, Sqlite, PostgreSQL, Oracle).