Rapporti Statistici

Transcript

Rapporti Statistici
Rapporti Statistici
materiale a cura di Francesca De Battisti
Rapporti Statistici
I rapporti statistici sono rapporti fra due grandezze
legate da una relazione logica, di cui almeno una di
natura statistica.
Essi vengono prevalentemente calcolati per eliminare
l’influenza di circostanze che, altrimenti, non
renderebbero confrontabili i dati.
1
Esempio
Si voglia confrontare, per un dato anno e con riferimento ad un dato Paese,
il numero di figli in due gruppi famigliari caratterizzati da diversa età media
dei genitori
Età media
genitori
26-35
46-55
Numero
famiglie
3499
4013
Numero
di figli
4102
5966
•Non è corretto confrontare il numero di figli dei due gruppi famigliari
•Si possono calcolare due rapporti dividendo il numero di figli per il numero
di famiglie.
•Si tratta di rapporti statistici perché sia il numeratore che il denominatore
sono dati statistici.
Esempio
Si otterrà quindi:
R1=4102/3499=1,172
R2=5966/4013=1,487
Quale informazione forniscono i due rapporti?
R1 indica il numero medio di figli delle famiglie con genitori “giovani”.
R2 indica il numero medio di figli delle famiglie con genitori “adulti”.
Il confronto fra i due valori R1 e R2 consente di concludere che i genitori
“adulti” hanno un maggior numero di figli dei genitori “giovani”.
2
Rapporti Statistici
Il significato del rapporto è immediato: esso indica quanta parte del
numeratore spetta idealmente ad una unità del denominatore.
I rapporti statistici più utilizzati nelle applicazioni sono:
•I rapporti indici (o numeri indici)
ƒI rapporti di composizione (o di parte al tutto)
ƒI rapporti di coesistenza
ƒI rapporti di densità
ƒI rapporti di derivazione
ƒI rapporti di durata
ƒI rapporti di ripetizione
Rapporti Indici
•
•
•
•
Sono impiegati per facilitare la comprensione delle variazioni
relative nel tempo o nello spazio di un fenomeno.
Pongono a confronto le intensità o le frequenze di uno stesso
fenomeno in tempi o luoghi diversi.
Il termine con il quale vengono messi a rapporto tutti gli altri
(denominatore della frazione) si dice base degli indici.
L’intensità del fenomeno nella situazione base è posta
abitualmente uguale a 100 o ad 1 o ad altre potenze di 10.
3
Rapporti Indici
Nel caso di una serie storica:
•se la base viene mantenuta fissa gli indici si chiamano a base fissa;
•se la base cambia di volta in volta, poiché si rapporta ciascun termine al
precedente, si hanno gli indici a base mobile (base variabile).
I numeri indici relativi ad una serie temporale sono detti numeri indici
temporali; quelli relativi ad una serie territoriale sono chiamati numeri indici
territoriali (o spaziali).
Essendo i numeri indici dei numeri puri, cioè dei numeri privi di un contenuto
concreto preciso, è spesso possibile istituire tramite essi confronti sulle
variazioni di fenomeni diversi.
Esempio
Produzione di autoveicoli in Giappone negli anni 1980-1988 (dati in migliaia).
Anno
Produzione
1980
11.042
1981
11.180
1982
10.732
1983
11.112
1984
11.465
1985
12.271
1986
12.259
1987
12.249
1988
12.699
4
Esempio
1)la serie dei numeri indici base 1980=100;
2)la serie dei numeri indici base 1985=100;
3)la serie de numeri indici a base mobile.
Anno
1
2
3
1980
100
89,98
------
1981
101,25
91,11
101,25
1982
97,19
87,46
95,99
1983
100,63
90,55
103,54
1984
103,83
93,43
103,18
1985
111,13
100
107,04
1986
111,02
99,9
99,9
1987
110,93
99,82
99,92
1988
115,01
103,48
103,67
Esempio
80I83=100,63=(11.112/11.042)*100
85I83=90,55=(11.112/12.271)*100
i83=103,54=(11.112/10.732)*100
Interpretazione dei risultati ottenuti:
•80I83=100,63 - Nel 1983 in Giappone la produzione di autoveicoli è aumentata
dello 0,63% rispetto al 1980.
•85I83=90,55 - La produzione di autoveicoli in Giappone nel 1983 è stata del 9,45%
in meno rispetto a quella del 1985.
•i83=103,54 - Nel 1983 in Giappone la produzione di autoveicoli è aumentata del
3,54% rispetto al 1982.
5
Rapporti di composizione
• Sono chiamati anche rapporti di parte al tutto. Si ottengono
rapportando una intensità (o una frequenza) parziale all’intensità (o
frequenza) totale. Il risultato in genere viene moltiplicato per 100
ottenendo i rapporti percentuali.
• In una distribuzione di frequenze consentono di confrontare
l’incidenza (il contributo) di ciascuna modalità alla numerosità totale.
Essi quindi non sono altro che le frequenze relative.
• In una distribuzione di quantità consentono di valutare il contributo
alla quantità totale di una categoria, di una classe, ecc.
Esempio
Consumi di energia elettrica per categoria di utilizzatori (milioni di kwh). Italia 1980.
Categorie di utilizzatori
Consumi (milioni kwh)
Consumi percentuali
Agricoltura
2.594
1,59
Industria
100.007
61,11
Trasporti e telecomunicazioni
5.937
3,63
Commercio, servizi e pubblica
amministrazione
14.450
8,83
Illuminazione pubblica
2.548
1,56
Usi domestici
38.109
23,28
Totale
163.645
100,00
6
I rapporti di composizione permettono, in quanto numeri puri,
di fare confronti temporali o confronti spaziali.
Corso
Roma
Trieste
S.Stat.Dem.
802
228
S.Stat.Att.
443
189
S.Stat.Econ.
1194
534
Totale iscritti alla Facoltà di Statistica a Roma = 2439
Totale iscritti alla Facoltà di Statistica a Trieste = 951
Corso
Roma
Trieste
S.Stat.Dem.
0,33 (33%)
0,24 (24%)
S.Stat.Att.
0,18 (18%)
0,20 (20%)
S.Stat.Econ.
0,49 (49%)
0,56 (56%)
Rapporti di coesistenza
• Esistono fenomeni in qualche modo “antitetici” che coesistono e
per i quali riveste una certa importanza il loro studio relativo.
• Per una distribuzione di frequenza (o di quantità) si chiama
rapporto di coesistenza ogni rapporto (eventualmente
moltiplicato per 100) tra la frequenza (o la quantità)
corrispondente ad una modalità e la frequenza (o la quantità)
corrispondente ad un’altra modalità.
7
Rapporti di coesistenza relativi ad una distribuzione di
frequenza
Distribuzione dei nati vivi in Italia nel 1981 secondo il sesso.
Sesso
N.di nati vivi
Maschi
Femmine
322.536
302.269
Totale
624.805
Oltre ai rapporti di composizione si può stabilire il rapporto tra il numero di nati vivi maschi
e il numero di nati vivi di sesso femminile:
R=322.536/302.269=1,07
Questo è un rapporto di coesistenza e prende il nome di rapporto di mascolinità alla nascita.
Esso mostra che in Italia nel 1981 sono nati 1,07 maschi per ogni femmina. Se si moltiplica il
rapporto per 100 si dirà che sono nati 107 maschi ogni 100 femmine.
Naturalmente si può calcolare anche il rapporto di femminilità alla nascita dato da :
R=302.269/322.536=0,94
Rapporti di coesistenza relativi ad una distribuzione di
frequenza
Con riferimento ad una data popolazione (italiana, regionale, provinciale, comunale) i
rapporti di coesistenza permettono, ad esempio, di misurare:
- La struttura per sesso della popolazione.
Se Pm = Numero di maschi
Pf = Numero di femmine
Pm/Pf = Rapporto di mascolinità della popolazione
Pf/Pm = Rapporto di femminilità della popolazione
- La struttura per età della popolazione
Se Ps = Popolazione senile (da 60 anni in poi)
Pg = popolazione infantile e giovanile (meno di 15 anni)
Iv = (Ps/Pg)*100 = Indice di vecchiaia
8
Rapporti di coesistenza relativi ad una distribuzione di
frequenza
In Italia, Iv = 30,1 nel 1911 e Iv = 80,4 nel 1981.
Questi valori indicano che ogni 100 giovani in Italia nel 1911 esistevano 30,1 anziani,
mentre nel 1981 si avevano 80,4 anziani ogni 100 giovani. Viene così messo in evidenza
il forte invecchiamento della popolazione italiana.
Se Ps = Popolazione in età da 65 anni in poi
Pa = Popolazione in età compresa tra 15 e 64 anni
Is = (Ps/Pa)*100 = Indice di dipendenza degli anziani
Tale indice sintetizza il carico della popolazione anziana (che quindi, data l’età, non è
autonoma) su quella che si presume la debba sostenere (popolazione presumibilmente
attiva).
Rapporti di coesistenza relativi ad una distribuzione
di quantità
Esportazioni dell’Italia nel 1981 verso gruppi di paesi europei (Fonte ISTAT)
Gruppo di paesi
Valori delle esportazioni (miliardi di lire)
Comunità europea
Europa orientale
Altri paesi europei
37.142
2.850
12.001
Totale
51.993
Con i dati della tabella si possono calcolare sei rapporti di coesistenza:
1)tra le esportazioni verso i paesi della Comunità e quelle verso l’Europa Orientale: 37.142/2.850 =
13,03
2)il suo inverso: 2.850/37.142 = 0,08
3)tra le esportazioni verso la Comunità e quelle verso gli altri paesi europei: 37.142/12.001 = 3,09
4)il suo inverso: 12.001/37.142 = 0,32
5)tra le esportazioni verso gli altri paesi europei e quelle verso l’Europa orientale: 12.001/2.850 =
4,21
6)il suo inverso: 2.850/12.001 = 0,24
9
Rapporti di coesistenza relativi ad una distribuzione
di quantità
Cosa ci indica ognuno dei sei rapporti?
Ad esempio, il primo mette in evidenza che nel 1981 le esportazioni italiane verso i paesi
della Comunità europea erano 13 volte quelle verso i paesi orientali, il terzo che
l’importanza delle esportazioni verso la Comunità è tripla di quella verso gli altri paesi
europei.
Altro diffuso rapporto di coesistenza è il cosiddetto grado di copertura (rapporto tra le
esportazioni e le importazioni di un paese in un determinato periodo, moltiplicato per
100). Tale rapporto indica il valore della merce esportata contro una importazione di
valore 100 (lire, milioni di lire, miliardi di lire).
Osservazione
A differenza dei rapporti di composizione, i rapporti di coesistenza possono assumere valori
maggiori di 1 (o di 100 se sono rapporti percentuali).
Rapporti di derivazione
• Essi sono dati dal rapporto fra l’intensità o la frequenza
di un fenomeno e l’intensità o la frequenza di un altro
fenomeno che si ritiene la causa o il presupposto del
fenomeno posto al numeratore.
• Ad esempio la popolazione può considerarsi la causa di
molti fenomeni dell’attività umana; fra questi sono
particolarmente rilevanti alcuni fenomeni demografici
quali le nascite, le morti, i matrimoni, ecc.
10
Esempio
Si supponga di voler confrontare la propensione ad avere figli della
popolazione ligure con quella della popolazione abruzzese.
A tal fine non si possono confrontare semplicemente i dati relativi al
numero di nascite nelle due regioni in un determinato periodo temporale
(ad esempio: anno 1981; 12.363 nascite in Liguria e 13.410 nascite in
Abruzzo).
Tali dati dipendono infatti oltre che dalla diversa propensione degli
abitanti delle due regioni ad avere figli (caratteristica che si vuole
confrontare), anche dal diverso ammontare della popolazione nelle due
regioni (anno 1981: popolazione presente in Liguria = 1.825.305 unità;
popolazione presente in Abruzzo = 1.201.710 unità).
Esempio
Il quoziente fra il numero delle nascite avute nel 1981 ed il numero di abitanti nello
stesso anno in una data regione dà luogo ad un rapporto di derivazione, che
moltiplicato per 1000 indica il numero di nascite attribuibili ad una popolazione di
1000 unità.
I valori ottenuti per l’esempio proposto risultano pari a 6,8 nati ogni 1000 abitanti in
Liguria e a 11,2 nati ogni 1000 abitanti in Abruzzo.
Pertanto si può affermare che, contrariamente all’indicazione fornita dalle cifre grezze, la
propensione alla procreazione degli Abruzzesi nel 1981 è stata nettamente superiore a
quella dei Liguri.
Il rapporto così costruito viene detto quoziente generico di natalità, in quanto i dati
vengono rapportati anche ad una parte di popolazione che, per ragioni d’età, non si può
considerare presupposto del fenomeno posto a numeratore.
I demografi sono soliti rapportare le nascite anche al numero di donne in età feconda (15-49 anni), ottenendo così misure
meno generiche della propensione ad avere figli.
Rapportando il numero delle morti al numero di abitanti si ottiene il quoziente di mortalità, mentre il rapporto fra numero
di matrimoni e numero di abitanti dà luogo al quoziente di nuzialità.
11
Rapporti di densità
• Con i rapporti di densità una circostanza quantitativa caratteristica di
un dato fenomeno viene rapportata ad una dimensione del campo in
cui viene osservata (spazio, tempo o altra dimensione).
• Dei rapporti di densità si fa larghissimo uso, perché servono ad
eliminare l’influenza esercitata dall’intensità del fenomeno posto al
denominatore sulla grandezza posta al numeratore, rendendo così
comparabili dati che, altrimenti, rimarrebbero eterogenei, per
l’influenza simultanea di più circostanze.
• Le frequenze specifiche sono rapporti di densità (al denominatore si
pone l’ampiezza della classe).
Esempi
1. Si consideri per un dato territorio l’insieme dei campi coltivati a frumento: sia p
la produzione di frumento (in tonnellate) e h l’estensione totale dei campi (in
ettari). Il rapporto p/h è un rapporto di densità ed indica la produzione media
(in tonnellate) per ogni ettaro coltivato (unità di superficie).
2. Se si desidera confrontare l’addensamento di popolazione in due regioni
italiane, non si possono confrontare direttamente i numeri di abitanti delle due
regioni, perché queste differiscono oltre che per la diversa natura, anche per
l’ampiezza della superficie regionale, che ha una certa influenza sull’ammontare
della popolazione. Pertanto occorre rapportare il numero di abitanti al numero di
kmq di superficie nelle due regioni, ottenendo così il numero di abitanti per
kmq. I valori ottenuti sono confrontabili fra loro.
12
Rapporti di durata
I rapporti di durata si costruiscono quando si è in presenza di un insieme
di unità che in un dato intervallo di tempo è soggetto ad un flusso di
entrata e ad un flusso di uscita.
Si pensi al numero di dipendenti di un’azienda nell’anno 1996. Tale
numero:
1. potrebbe essere rimasto invariato dall’inizio alla fine dell’anno (300
dipendenti);
2. potrebbe essere aumentato (passato da 300 all’1.1.96 a 302 dipendenti
al 31.12.96);
3. potrebbe essere diminuito (passato da 300 all’1.1.96 a 295 dipendenti al
31.12.96)
Rapporti di durata
Nel caso 1) si è in presenza di popolazione stazionaria, ma ciò non implica che non si
possano essere verificati dei cambiamenti. Infatti nel corso dell’anno alcuni dipendenti
potrebbero aver cessato il rapporto di lavoro (licenziati, pensionati) e potrebbero essere
stati assunti nuovi dipendenti in uguale numero.
Cioè se si indica con:
U = numero di usciti nell’intervallo di tempo (flusso d’uscita);
E = numero di entrati nell’intervallo di tempo (flusso d’entrata);
C = consistenza del fenomeno;
nel caso di popolazione stazionaria è E = U.
In questo caso si può calcolare il rapporto Rd = C/E ovvero Rd = C/U.
Esso indica la permanenza media (espressa in anni o frazioni di anno) di una unità
nell’insieme prima di uscire dall’insieme stesso.
Se E = U = 15 sarà Rd = 300/15 =20 anni.
Con riferimento alla situazione del 1996, un dipendente in media permane in azienda
20 anni.
13
Rapporti di durata
Nelle situazioni 2) e 3) (non stazionarietà della massa) per avere una valutazione
attendibile della “permanenza media” bisognerebbe fare rilevazioni dirette sulla
permanenza (durata) di una unità e poi ricavarne una media.
Una valutazione approssimata della durata media si ottiene rapportando la
consistenza media (semisomma delle consistenze all’inizio e alla fine del periodo
considerato) riscontrata nell’intervallo di tempo considerato alla semisomma fra le
entrate e le uscite: Rd=Cmedia/[(U+E)/2].
Caso 2)
U=13; E=15; Cmedia=(300+302)/2
Rd=301/14=21,5 anni
Caso 3)
U=15; E=10; Cmedia=(300+295)/2
Rd=297,5/12,5=23,8 anni
Rapporti di durata
In ambito aziendale i rapporti di durata vengono applicati, oltre che nella gestione del
personale, nello studio del movimento delle merci dei magazzini. Il rapporto fra il
valore (in lire) della consistenza media delle merci nel magazzino (semisomma delle
giacenze all’inizio e alla fine dell’intervallo di tempo considerato) e la semisomma tra
il valore delle merci entrate ed uscite (flusso medio) dà la permanenza media
(espressa in anni o frazioni di anno) di una lira investita nelle merci del magazzino.
In ambito sanitario, i rapporti di durata vengono impiegati, tra l’altro, per calcolare la
degenza media dei ricoverati.
Nelle statistiche del turismo, sono calcolati per determinare la permanenza media nelle
diverse strutture turistiche (alberghi, locande, campeggi, abitazioni private) dei turisti.
Si faccia attenzione che tanto più il fenomeno oggetto d’analisi si allontana dalla
condizione di stazionarietà, tanto maggiore deve essere la cautela nell’interpretare i
rapporti di durata calcolati.
14
Rapporti di ripetizione
I rapporti di ripetizione consentono di misurare quante volte un dato
fenomeno si ripete (si rinnova) nell’intervallo di tempo considerato.
I rapporti di ripetizione sono dati dal rapporto fra la semisomma del flusso
d’entrata e di quello di uscita e la consistenza media del fenomeno:
Rr = [(E+U)/2]/C
Essi sono quindi il reciproco dei rapporti di durata.
Nell’esempio precedente, caso 1), sarà:
Rr = 15/300 = 0,05 volte all’anno
In un anno mediamente un dipendente “si rinnova” (ruota) 0,05 volte
nell’azienda (ovvia conseguenza di una permanenza media di 20 anni).
Esempio
In un deposito di prodotti agricoli, alla data dell’1.1.1992, sono presenti 1500
tonnellate di grano. Nel corso dell’anno 1992 i movimenti di grano, per
bimestre, sono stati i seguenti:
BIMESTRE
I
II
III
IV
V
VI
ENTRATE (TON.)
30
80
200
1000
800
50
USCITE (TON.)
500
400
300
700
800
600
15
Esempio
Permanenza media del grano nel deposito durante il 1992
Consistenza iniziale = 1500 ton.
E = 2160 ton.
U = 3300 ton.
Consistenza finale = 1500+2160-3300=360 ton.
Rd= [(1500+360)/2]/[(2160+3300)/2]=
930/2730 = 0,341 frazione di anno = 0,341*365 = 124 giorni circa
La permanenza media di una tonnellata di grano nel magazzino nel 1992 è stata di circa
124 giorni.
Rapporto di ripetizione
b) Rr = 2730/930 = 2,935 volte nell’anno.
Una tonnellata di grano “ruota” circa 2,935 volte all’anno nel deposito.
16