Statistica 4038 (ver. 1.2)
Transcript
Statistica 4038 (ver. 1.2)
Statistica 4038 (ver. 1.2) Software didattico per l’insegnamento della Statistica S ERGIO VENTURINI , MAURIZIO P OLI i Il presente software è utilizzato come supporto alla didattica nel corso di Statistica (Codice 4038) tenuto presso l’Università Commerciale “L. Bocconi”. Ogni altro utilizzo non autorizzato è punibile ai sensi di legge. Istituto di Metodi Quantitativi, Università “L. Bocconi”. Milano, Settembre 2001. i “Statistica 4038” è un file in formato Microsoft Excel contenente alcune macro (scritte in Visual Basic, Application Edition) che consentono di automatizzare alcune tecniche tipiche dell’analisi statistica esplorativa dei dati. : Requisiti minimi di sistema: Non esistono particolari requisiti minimi di sistema. Il software funziona su un qua lsiasi personal computer (IBM compatibile) su cui siano installati e funzionanti Windows 95 (o versione successiva) e Microsoft Excel. “Statistica 4038” è stato testato con le versioni 97 e 2000 di Microsoft Excel. Non ne è pertanto garantito il funzionamento con versioni precedenti. : Configurazione consigliata: per un corretto funzionamento del software è consigliabile configurare la risoluzione dello schermo a 800 × 600 pixels e la dimensione dei caratteri a “Caratteri piccoli” (“Small Fonts” per la versione inglese di Windows). In caso contrario si potrebbero riscontrare differenze nella visualizzazione rispetto alle immagini contenute nel presente documento, differenze che sono dovute appunto alle diverse impostazioni grafiche adottate. STATISTICA 4038 – Software didattico per l’insegnamento della statistica 1. COME AVVIARE “STATISTICA 4038” Dopo aver scaricato il file Stat4038.xls dal sito Internet del corso di Statistica, per avviare il software è possibile agire in due modi alternativi: • aprire Esplora risorse, posizionarsi nella cartella in cui è stato copiato il file dalla rete e cliccare due volte sullo stesso; questa procedura avvierà automaticamente Microsoft Excel e, all’interno di quest’ultimo, il file Stat4038.xls contenente le macro, oppure ‚ all’interno di Microsoft Excel, scegliere dal Menu File il comando Apri, selezionare quindi il file Stat4038.xls e cliccare sul pulsante Apri. In entrambi i casi, all’apertura del file verrà chiesto se si desidera attivare le macro contenute nel file stesso (vedi Figura 1). Rispondere sempre positivamente alla precedente richiesta cliccando sul pulsante “Attiva macro” (o “Enable macros” se si sta usando una versione inglese di Microsoft Excel). In caso contrario, cioè se si cliccasse su uno degli altri pulsanti, non sarà possibile utilizzare le funzionalità del software. Figura 1 2 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Alla fine della fase di apertura del file viene visualizzata un’immagine contenente alcune informazioni riguardanti il software (vedi Figura 2). Cliccare sul pulsante “Continua” se si vuole utilizzare il software; in caso contrario cliccare sul pulsante “Chiudi”. Figura 2 Una volta conclusa la fase di caricamento, si può notare che il software ha aggiunto alla Barra dei Menu di Microsoft Excel il menu “STATISTICA 4038” (vedi Figura 3). Figura 3 3 STATISTICA 4038 – Software didattico per l’insegnamento della statistica 2. LE FUNZIONI DI “STATISTICA 4038” 2.1 CREARE UNA DISTRIBUZIONE DI FREQUENZE Il menu “Distribuzione di frequenze” consente di creare la distribuzione di frequenze di un certo insieme di osservazioni. Una volta selezionata questa voce dal menu principale appare una finestra in cui si chiede di inserire l’insie me di osservazioni per le quali si desidera creare la distribuzione di frequenze (vedi Figura 4). Figura 4 La procedura per selezionare le osservazioni presenti su un foglio di lavoro è quella standard di Microsoft Excel: q cliccare sul pulsante posto alla destra della casella di testo bianca presente nella finestra DISTRIBUZIONE DI FREQUENZE, q selezionare sul foglio di lavoro l’intervallo delle celle contenenti le osservazioni da analizzare e q cliccare di nuovo sul pulsante posto alla destra della casella in cui è apparso l’intervallo selezionato, oppure premere Invio (vedi Figura 5). ATTENZIONE: la selezione delle osservazioni (in questo come in tutti i casi successivi) può avvenire solo attraverso trascinamento della selezione sul foglio; non è possibile inserire i dati direttamente nelle caselle. 4 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Figura 5 Una volta completata l’operazione di selezione delle celle, cliccare sul pulsante “Calcola distribuzione” per visualizzare l’output (vedi Figura 6). La procedura crea un nuovo foglio di lavoro numerato progressivamente che contiene le varie modalità del carattere selezionato insieme alla sua distribuzione di frequenze ed alla funzione di ripartizione. Figura 6 5 STATISTICA 4038 – Software didattico per l’insegnamento della statistica E’ opportuno tenere presente alcune considerazioni riguardanti la selezione di un intervallo di celle su un foglio di lavoro per questo specifico tipo di analisi: q è necessario selezionare una singola colonna contenente nella prima cella l’etichetta della variabile e nelle celle successive le osservazioni da analizzare; se si seleziona una singola cella verrà visualizzato un messaggio errore; q l’intervallo di celle selezionate non deve contenere celle vuote; q la procedura per il calcolo della distribuzione di frequenze accetta al massimo 32.000 osservazioni (esclusa l’etichetta della variabile); q si consiglia di posizionarsi sul foglio di lavoro contenente le osservazioni da selezionare prima di lanciare il comando “Distribuzione di frequenze”. 2.2 CREARE UN ISTOGRAMMA DELLE FREQUENZE Il menu “Istogramma” consente di disegnare l’istogramma delle frequenze per un insieme di osservazioni. Una volta selezionata questa voce dal menu principale appare una finestra in cui si chiede di scegliere il tipo di analisi da eseguire e, in funzione della scelta effettuata, i dati a partire dai quali verrà costruito l’istogramma (vedi Figura 7). Figura 7 6 STATISTICA 4038 – Software didattico per l’insegnamento della statistica La procedura fornisce la possibilità di scegliere tra tre tipi di analisi alternative: • disegnare un istogramma con classi di uguale ampiezza; in questo caso i dati richiesti sono il numero di classi (che deve essere un numero intero positivo compreso tra 2 e 99) e l’insieme delle osservazioni (vedi Figura 8); Figura 8 ‚ disegnare un istogramma con classi di diversa ampiezza assegnando l’insieme degli estremi superiori ed inferiori delle classi e l’insieme delle osservazioni (vedi Figura 9); Figura 9 7 STATISTICA 4038 – Software didattico per l’insegnamento della statistica ƒ disegnare un istogramma con classi di diversa ampiezza assegnando l’insieme degli estremi superiori ed inferiori delle classi e le frequenze assolute associate ad ogni classe (vedi Figura 10). Figura 10 La selezione dei dati nei tre casi avviene nel modo spiegato precedenteme nte per la procedura “Distribuzione di frequenze”. Nella casella contrassegnata dalla scritta “Inserire l’etichetta della variabile” è possibile (ma non obbligatorio) inserire (attraverso la selezione su un foglio, oppure scrivendola direttamente nella casella) il nome della variabile in modo che compaia sull’asse orizzontale dell’istogramma. Se non viene indicato un nome per la variabile, il software userà l’etichetta predefinita “Variabile X”. Una volta completata l’operazione di selezione delle celle, cliccare sul pulsante “Disegna Istogramma” per visualizzare l’output (vedi Figura 11). La procedura crea due nuovi fogli di lavoro numerati progressivamente, dei quali il primo contiene la tabella con i dati necessari per la costruzione dell’istogramma (estremi inferiori e superiori, frequenze assolute, relative e densità associate ad ogni classe) ed il secondo il grafico dell’istogramma delle frequenze. E’ possibile scegliere dove posizionare il grafico: prima che il software disegni l’istogramma, infatti, viene chiesto se si desidera posizionare il grafico su un nuovo foglio o sullo stesso foglio della tabella. 8 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Figura 11 E’ opportuno tenere presente alcune considerazioni riguardanti la selezione dei dati iniziali per questo specifico tipo di analisi: q è necessario selezionare singole colonne contenenti solo i dati da utilizzare nell’analisi (cioè, a seconda dei casi, le osservazioni e/o gli estremi delle classi); q gli intervalli selezionati non devono contenere celle vuote o valori non numerici; q la procedura per il calcolo dell’istogramma delle frequenze accetta al massimo 32.000 osservazioni e 99 classi diverse; solo nel primo caso (istogramma con classi di uguale ampiezza) il limite di osservazioni analizzabili è 5.400; q si consiglia di posizionarsi sul foglio di lavoro contenente i dati da selezionare prima di lanciare il comando “Istogramma”. 2.3 CREARE UNA TABELLA A DOPPIA ENTRATA Il menu “Tabella a doppia entrata” consente di creare una serie di tabelle a partire dalle osservazioni su due caratteri. Una volta selezionata questa voce dal menu principale appare una finestra in cui si chiede di selezionare due gruppi di osservazioni e di scegliere il tipo di analisi da eseguire (vedi Figura 12). 9 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Figura 12 La selezione delle osservazioni avviene nel modo spiegato per le precedenti procedure. Una volta completata l’operazione di selezione, cliccare sul pulsante “Costruisci Tabella” per visualizzare l’output (vedi Figura 13). La procedura crea un nuo vo foglio di lavoro numerato progressivamente contenente le tabelle a doppia entrata richieste. Le analisi effettuate sono contrassegnate da una scritta blu, cliccando sulla quale viene visualizzata la tabella corrispondente (come per i collegamenti ipertestuali Internet). Le analisi che non sono state richieste o per le quali non è stato possibile effettuare i calcoli (es.: calcolo delle medie condizionate per variabili nominali) sono invece contraddistinte da una scritta nera. Cliccando su di esse verrà mostrato un messaggio che spiega il motivo della mancata elaborazione. E’ opportuno tenere presente alcune considerazioni riguardanti la selezione di un intervallo di celle su un foglio di lavoro per questo specifico tipo di analisi: q per ognuno dei due caratteri, è necessario selezionare una singola colonna contenente nella prima cella l’etichetta della variabile e nelle celle successive le osservazioni da analizzare; q l’intervallo di celle selezionate non deve contenere celle vuote; q la procedura per il calcolo delle tabelle a doppia entrata accetta al massimo 32.000 osservazioni (escluse le etichette dei caratteri); 10 STATISTICA 4038 – Software didattico per l’insegnamento della statistica q si consiglia di posizionarsi sul foglio di lavoro contenente le osservazioni da selezionare prima di lanciare il comando “Tabella a doppia entrata”. Figura 13 2.4 CREARE UN GRAFICO BOX – WHISKER Il menu “Box – Whisker Plot” consente di creare un grafico “scatola – baffi” a partire dalle osservazioni su un carattere oppure fornendo i dati relativi alle cinque statistiche di interesse (minimo, 1° quartile, mediana, 3° quartile, massimo). Una volta selezionata questa voce dal menu principale appare una finestra in cui si chiede di scegliere il tipo di analisi da eseguire e le successive informazioni (vedi Figure 14 e 15 nella pagina successiva). 11 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Figura 14 Figura 15 2.5 CREARE UNA D ISTRIBUZIONE DI PROBABILITÀ Il menu “Distribuzioni di probabilità” consente di inserire nel foglio una distribuzione Normale Standard oppure una distribuzione t di Student. Una volta selezionata una di 12 STATISTICA 4038 – Software didattico per l’insegnamento della statistica queste due voci è possibile scegliere se calcolare la probabilità dato il percentile oppure un il percentile data la probabilità (vedi Figura 16). Figura 16 2.6 CREARE UN D IAGRAMMA A BOLLE Il menu “Diagramma a bolle” consente di inserire nel foglio un diagramma a bolle partendo da una tabella a doppia preesistente oppure da un insieme di osservazioni (vedi Figura 17). Figura 17 13 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Per creare un diagramma a bolle partendo da una tabella preesistente, scegliere il menu “Diagramma a bolle” e quindi la casella “Creare il diagramma da una tabella esistente”. Selezionare sul foglio di lavoro le celle che contengono la tabella a doppia entrata, avendo cura di includere anche le intestazioni di riga e di colonna (vedi Figura 18). Figura 18 ATTENZIONE: nell’intervallo che vie ne selezionato sul foglio di lavoro non includere altre celle diverse da quelle indicate sopra. In particolare, se si parte da una tabella creata con “STATISTICA 4038”, non comprendere nella selezione le celle con intestazione “Totale Complessivo” (vedi Figura 18). In caso contrario il risultato dell’elaborazione potrebbe non fornire l’output desiderato. A questo punto cliccare sul pulsante “Disegna Diagramma a bolle” (vedi Figura 19). 14 STATISTICA 4038 – Software didattico per l’insegnamento della statistica Figura 19 Per creare invece un diagramma a bolle partendo da un ins ieme di osservazioni, scegliere la casella “Creare il diagramma dai dati grezzi”. In questo caso è necessario seguire le indicazioni fornite nel paragrafo 2.3 (CREARE UNA TABELLA A DOPPIA ENTRATA ). Cliccare sul pulsante “Disegna Diagramma a bolle”. 3. INFORMAZIONI Ulteriori informazioni sul software possono essere richieste direttamente agli autori attraverso i seguenti indirizzi di posta elettronica: q [email protected] q [email protected] Agli stessi indirizzi è possibile inviare segnalazioni di malfunzionamenti e/o suggerimenti per migliorare l’aspetto e le funzionalità del software. Si precisa che gli autori si fanno carico unicamente delle responsabilità per difetti riguardanti il presente software, esclusi quindi problemi derivanti da altre fonti (malfunzionamenti del sistema operativo, difetti hardware o software di qualsiasi genere, 15 STATISTICA 4038 – Software didattico per l’insegnamento della statistica ecc.…). Per la soluzione di tali problemi contattare il rivenditore del PC o dei software difettosi. Si precisa inoltre che la macro cui il presente manuale fa riferimento è fornita dopo aver verificato l’assenza dei virus informatici la cui esistenza era nota alla data della preparazione della macro stessa. La responsabilità per eventuali problemi dovuti alla trasmissione di tali virus è quindi da ritenersi non di competenza degli autori. 16