Statistica 4038 (ver. 1.2)

Transcript

Statistica 4038 (ver. 1.2)
Statistica 4038 (ver. 1.2)
Software didattico per l’insegnamento della Statistica
S ERGIO VENTURINI , MAURIZIO P OLI
i Il presente software è utilizzato come supporto alla didattica nel corso di Statistica
(Codice 4038) tenuto presso l’Università Commerciale “L. Bocconi”. Ogni altro utilizzo
non autorizzato è punibile ai sensi di legge.
 Istituto di Metodi Quantitativi, Università “L. Bocconi”. Milano, Settembre 2001.
i “Statistica 4038” è un file in formato Microsoft Excel contenente alcune macro (scritte
in Visual Basic, Application Edition) che consentono di automatizzare alcune tecniche
tipiche dell’analisi statistica esplorativa dei dati.
: Requisiti minimi di sistema: Non esistono particolari requisiti minimi di sistema. Il
software funziona su un qua lsiasi personal computer
(IBM compatibile) su cui siano installati e funzionanti
Windows 95 (o versione successiva) e Microsoft
Excel.
“Statistica 4038” è stato testato con le versioni 97 e
2000 di Microsoft Excel. Non ne è pertanto garantito il
funzionamento con versioni precedenti.
: Configurazione consigliata: per un corretto funzionamento del software è consigliabile
configurare la risoluzione dello schermo a 800 × 600 pixels
e la dimensione dei caratteri a “Caratteri piccoli” (“Small
Fonts” per la versione inglese di Windows). In caso
contrario
si
potrebbero
riscontrare
differenze
nella
visualizzazione rispetto alle immagini contenute nel
presente documento, differenze che sono dovute appunto
alle diverse impostazioni grafiche adottate.
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
1. COME AVVIARE “STATISTICA 4038”
Dopo aver scaricato il file Stat4038.xls dal sito Internet del corso di Statistica, per avviare
il software è possibile agire in due modi alternativi:
• aprire Esplora risorse, posizionarsi nella cartella in cui è stato copiato il file dalla rete
e cliccare due volte sullo stesso; questa procedura avvierà automaticamente Microsoft
Excel e, all’interno di quest’ultimo, il file Stat4038.xls contenente le macro, oppure
‚ all’interno di Microsoft Excel, scegliere dal Menu File il comando Apri, selezionare
quindi il file Stat4038.xls e cliccare sul pulsante Apri.
In entrambi i casi, all’apertura del file verrà chiesto se si desidera attivare le macro
contenute nel file stesso (vedi Figura 1). Rispondere sempre positivamente alla precedente
richiesta cliccando sul pulsante “Attiva macro” (o “Enable macros” se si sta usando una
versione inglese di Microsoft Excel). In caso contrario, cioè se si cliccasse su uno degli
altri pulsanti, non sarà possibile utilizzare le funzionalità del software.
Figura 1
2
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Alla fine della fase di apertura del file viene visualizzata un’immagine contenente alcune
informazioni riguardanti il software (vedi Figura 2).
Cliccare sul pulsante “Continua” se si vuole utilizzare il software; in caso contrario
cliccare sul pulsante “Chiudi”.
Figura 2
Una volta conclusa la fase di caricamento, si può notare che il software ha aggiunto alla
Barra dei Menu di Microsoft Excel il menu “STATISTICA 4038” (vedi Figura 3).
Figura 3
3
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
2. LE FUNZIONI DI “STATISTICA 4038”
2.1 CREARE UNA DISTRIBUZIONE DI FREQUENZE
Il menu “Distribuzione di frequenze” consente di creare la distribuzione di frequenze di
un certo insieme di osservazioni. Una volta selezionata questa voce dal menu principale
appare una finestra in cui si chiede di inserire l’insie me di osservazioni per le quali si
desidera creare la distribuzione di frequenze (vedi Figura 4).
Figura 4
La procedura per selezionare le osservazioni presenti su un foglio di lavoro è quella
standard di Microsoft Excel:
q
cliccare sul pulsante posto alla destra della casella di testo bianca presente nella
finestra DISTRIBUZIONE DI FREQUENZE,
q
selezionare sul foglio di lavoro l’intervallo delle celle contenenti le osservazioni da
analizzare e
q
cliccare di nuovo sul pulsante posto alla destra della casella in cui è apparso
l’intervallo selezionato, oppure premere Invio (vedi Figura 5).
ATTENZIONE: la selezione delle osservazioni (in questo come in tutti i casi successivi)
può avvenire solo attraverso trascinamento della selezione sul foglio; non è possibile
inserire i dati direttamente nelle caselle.
4
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Figura 5
Una volta completata l’operazione di selezione delle celle, cliccare sul pulsante “Calcola
distribuzione” per visualizzare l’output (vedi Figura 6). La procedura crea un nuovo
foglio di lavoro numerato progressivamente che contiene le varie modalità del carattere
selezionato insieme alla sua distribuzione di frequenze ed alla funzione di ripartizione.
Figura 6
5
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
E’ opportuno tenere presente alcune considerazioni riguardanti la selezione di un
intervallo di celle su un foglio di lavoro per questo specifico tipo di analisi:
q
è necessario selezionare una singola colonna contenente nella prima cella
l’etichetta della variabile e nelle celle successive le osservazioni da analizzare; se
si seleziona una singola cella verrà visualizzato un messaggio errore;
q
l’intervallo di celle selezionate non deve contenere celle vuote;
q
la procedura per il calcolo della distribuzione di frequenze accetta al massimo
32.000 osservazioni (esclusa l’etichetta della variabile);
q
si consiglia di posizionarsi sul foglio di lavoro contenente le osservazioni da
selezionare prima di lanciare il comando “Distribuzione di frequenze”.
2.2 CREARE UN ISTOGRAMMA DELLE FREQUENZE
Il menu “Istogramma” consente di disegnare l’istogramma delle frequenze per un insieme
di osservazioni. Una volta selezionata questa voce dal menu principale appare una finestra
in cui si chiede di scegliere il tipo di analisi da eseguire e, in funzione della scelta
effettuata, i dati a partire dai quali verrà costruito l’istogramma (vedi Figura 7).
Figura 7
6
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
La procedura fornisce la possibilità di scegliere tra tre tipi di analisi alternative:
• disegnare un istogramma con classi di uguale ampiezza; in questo caso i dati
richiesti sono il numero di classi (che deve essere un numero intero positivo
compreso tra 2 e 99) e l’insieme delle osservazioni (vedi Figura 8);
Figura 8
‚ disegnare un istogramma con classi di diversa ampiezza assegnando l’insieme
degli estremi superiori ed inferiori delle classi e l’insieme delle osservazioni (vedi
Figura 9);
Figura 9
7
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
ƒ disegnare un istogramma con classi di diversa ampiezza assegnando l’insieme
degli estremi superiori ed inferiori delle classi e le frequenze assolute associate ad
ogni classe (vedi Figura 10).
Figura 10
La selezione dei dati nei tre casi avviene nel modo spiegato precedenteme nte per la
procedura “Distribuzione di frequenze”.
Nella casella contrassegnata dalla scritta “Inserire l’etichetta della variabile” è possibile
(ma non obbligatorio) inserire (attraverso la selezione su un foglio, oppure scrivendola
direttamente nella casella) il nome della variabile in modo che compaia sull’asse
orizzontale dell’istogramma. Se non viene indicato un nome per la variabile, il software
userà l’etichetta predefinita “Variabile X”.
Una volta completata l’operazione di selezione delle celle, cliccare sul pulsante “Disegna
Istogramma” per visualizzare l’output (vedi Figura 11). La procedura crea due nuovi fogli
di lavoro numerati progressivamente, dei quali il primo contiene la tabella con i dati
necessari per la costruzione dell’istogramma (estremi inferiori e superiori, frequenze
assolute, relative e densità associate ad ogni classe) ed il secondo il grafico
dell’istogramma delle frequenze.
E’ possibile scegliere dove posizionare il grafico: prima che il software disegni
l’istogramma, infatti, viene chiesto se si desidera posizionare il grafico su un nuovo foglio
o sullo stesso foglio della tabella.
8
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Figura 11
E’ opportuno tenere presente alcune considerazioni riguardanti la selezione dei dati
iniziali per questo specifico tipo di analisi:
q
è necessario selezionare singole colonne contenenti solo i dati da utilizzare
nell’analisi (cioè, a seconda dei casi, le osservazioni e/o gli estremi delle classi);
q
gli intervalli selezionati non devono contenere celle vuote o valori non numerici;
q
la procedura per il calcolo dell’istogramma delle frequenze accetta al massimo
32.000 osservazioni e 99 classi diverse; solo nel primo caso (istogramma con
classi di uguale ampiezza) il limite di osservazioni analizzabili è 5.400;
q
si consiglia di posizionarsi sul foglio di lavoro contenente i dati da selezionare
prima di lanciare il comando “Istogramma”.
2.3 CREARE UNA TABELLA A DOPPIA ENTRATA
Il menu “Tabella a doppia entrata” consente di creare una serie di tabelle a partire dalle
osservazioni su due caratteri. Una volta selezionata questa voce dal menu principale
appare una finestra in cui si chiede di selezionare due gruppi di osservazioni e di scegliere
il tipo di analisi da eseguire (vedi Figura 12).
9
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Figura 12
La selezione delle osservazioni avviene nel modo spiegato per le precedenti procedure.
Una volta completata l’operazione di selezione, cliccare sul pulsante “Costruisci Tabella”
per visualizzare l’output (vedi Figura 13). La procedura crea un nuo vo foglio di lavoro
numerato progressivamente contenente le tabelle a doppia entrata richieste. Le analisi
effettuate sono contrassegnate da una scritta blu, cliccando sulla quale viene visualizzata
la tabella corrispondente (come per i collegamenti ipertestuali Internet). Le analisi che non
sono state richieste o per le quali non è stato possibile effettuare i calcoli (es.: calcolo delle
medie condizionate per variabili nominali) sono invece contraddistinte da una scritta nera.
Cliccando su di esse verrà mostrato un messaggio che spiega il motivo della mancata
elaborazione.
E’ opportuno tenere presente alcune considerazioni riguardanti la selezione di un
intervallo di celle su un foglio di lavoro per questo specifico tipo di analisi:
q
per ognuno dei due caratteri, è necessario selezionare una singola colonna
contenente nella prima cella l’etichetta della variabile e nelle celle successive le
osservazioni da analizzare;
q
l’intervallo di celle selezionate non deve contenere celle vuote;
q
la procedura per il calcolo delle tabelle a doppia entrata accetta al massimo 32.000
osservazioni (escluse le etichette dei caratteri);
10
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
q
si consiglia di posizionarsi sul foglio di lavoro contenente le osservazioni da
selezionare prima di lanciare il comando “Tabella a doppia entrata”.
Figura 13
2.4 CREARE UN GRAFICO BOX – WHISKER
Il menu “Box – Whisker Plot” consente di creare un grafico “scatola – baffi” a partire
dalle osservazioni su un carattere oppure fornendo i dati relativi alle cinque statistiche di
interesse (minimo, 1° quartile, mediana, 3° quartile, massimo). Una volta selezionata
questa voce dal menu principale appare una finestra in cui si chiede di scegliere il tipo di
analisi da eseguire e le successive informazioni (vedi Figure 14 e 15 nella pagina
successiva).
11
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Figura 14
Figura 15
2.5 CREARE UNA D ISTRIBUZIONE DI PROBABILITÀ
Il menu “Distribuzioni di probabilità” consente di inserire nel foglio una distribuzione
Normale Standard oppure una distribuzione t di Student. Una volta selezionata una di
12
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
queste due voci è possibile scegliere se calcolare la probabilità dato il percentile oppure un
il percentile data la probabilità (vedi Figura 16).
Figura 16
2.6 CREARE UN D IAGRAMMA A BOLLE
Il menu “Diagramma a bolle” consente di inserire nel foglio un diagramma a bolle
partendo da una tabella a doppia preesistente oppure da un insieme di osservazioni (vedi
Figura 17).
Figura 17
13
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Per creare un diagramma a bolle partendo da una tabella preesistente, scegliere il menu
“Diagramma a bolle” e quindi la casella “Creare il diagramma da una tabella esistente”.
Selezionare sul foglio di lavoro le celle che contengono la tabella a doppia entrata, avendo
cura di includere anche le intestazioni di riga e di colonna (vedi Figura 18).
Figura 18
ATTENZIONE: nell’intervallo che vie ne selezionato sul foglio di lavoro non includere
altre celle diverse da quelle indicate sopra. In particolare, se si parte da una tabella creata
con “STATISTICA 4038”, non comprendere nella selezione le celle con intestazione
“Totale Complessivo” (vedi Figura 18). In caso contrario il risultato dell’elaborazione
potrebbe non fornire l’output desiderato.
A questo punto cliccare sul pulsante “Disegna Diagramma a bolle” (vedi Figura 19).
14
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
Figura 19
Per creare invece un diagramma a bolle partendo da un ins ieme di osservazioni, scegliere
la casella “Creare il diagramma dai dati grezzi”. In questo caso è necessario seguire le
indicazioni fornite nel paragrafo 2.3 (CREARE UNA TABELLA A DOPPIA ENTRATA ). Cliccare
sul pulsante “Disegna Diagramma a bolle”.
3. INFORMAZIONI
Ulteriori informazioni sul software possono essere richieste direttamente agli autori
attraverso i seguenti indirizzi di posta elettronica:
q
[email protected]
q
[email protected]
Agli stessi indirizzi è possibile inviare segnalazioni di malfunzionamenti e/o suggerimenti
per migliorare l’aspetto e le funzionalità del software.
Si precisa che gli autori si fanno carico unicamente delle responsabilità per difetti
riguardanti il presente software, esclusi quindi problemi derivanti da altre fonti
(malfunzionamenti del sistema operativo, difetti hardware o software di qualsiasi genere,
15
STATISTICA 4038 – Software didattico per l’insegnamento della statistica
ecc.…). Per la soluzione di tali problemi contattare il rivenditore del PC o dei software
difettosi.
Si precisa inoltre che la macro cui il presente manuale fa riferimento è fornita dopo aver
verificato l’assenza dei virus informatici la cui esistenza era nota alla data della
preparazione della macro stessa. La responsabilità per eventuali problemi dovuti alla
trasmissione di tali virus è quindi da ritenersi non di competenza degli autori.
16