Diapositiva 1 - Dipartimento di Scienze Sociali ed Economiche
Transcript
Diapositiva 1 - Dipartimento di Scienze Sociali ed Economiche
STATISTICHESE La popolazione o collettivo statistico è l’insieme di individui o oggetti che si vogliono studiare. Questi individui o oggetti vengono denominati unità statistiche. • Un campione è una parte di popolazione. • Un censimento è lo studio dell’intera popolazione. Campione Rilevazione parziale Popolazione Rilevazione totale 1 Carattere è l’aspetto che si intende studiare su un determinato collettivo statistico Modalità del carattere i diversi modi con cui il carattere si presenta nelle varie unità statistiche del collettivo. Devono essere esaustive e non sovrapposte Qualitativi I caratteri si dividono in: Quantitativi 2 Esempi di caratteri qualitativi e quantitativi Dati estratti dal questionario della terza intervista Si vogliono studiare le caratteristiche demografiche e sociali (caratteri) della popolazione del Lazio al 1° gennaio 2012 (collettivo). Un questionario potrebbe raccogliere le seguenti informazioni Codice ident. intervista 3 Sesso Qualit M Età in anni compiuti Quantit 38 Stato civile Qualit Provincia di residenza Qualit Titolo di studio Qualit Professione Qualit Coniugato LT Laurea Impiegato Numero componenti Quant della famiglia (oltre l’intervistato) 4 Reddito lordo annuo Quant (in migliaia di euro) 40 3 MUTABILI Qualitativi danno luogo a risposte non numeriche. Es: sesso,stato civile, soddisfazione rispetto a qualche cosa, livello d’istruzione VARIABILI -Quantitativi danno luogo a risposte numeriche Continui: le risposte derivano da un processo di misurazione. Es: altezza, peso, età … Discreti: le risposte derivano da un processo di conteggio. Es: n.figli in una famiglia, n. di autoveicoli, n.pezzi prodotti da una macchina … Quantitativi trasferibili (pacchetto azionario, reddito…) 4 Caratteri qualitativi Caratteri sconnessi • Dati nominali quando le diverse categorie possono essere messe in un ordine qualsiasi (es. sesso M prima di F o viceversa) come posso trattare statisticamente tali caratteri? Ad esempio associando a M il valore 0 e a F il valore 1 così potrò fare delle operazioni) Caratteri rettilinei • Dati ordinali quando le diverse categorie hanno un ordine di assegnazione che ha un significato (es.livello d’istruzione nessun titolo; licenza elem; licenza media inf; licenza media sup; laurea; anche qui potrei associare i valori da 0 a 5 oppure valori che corrispondano al numero di anni necessari per conseguire il titolo) 5 Carattere quantitativo • Continuo le modalità risultano da un confronto con un’unità di misura. Spesso le modalità proprio per la loro continuità vengono raggruppate in classi es. statura 150-160; 160-170; 170-180….e così via Ogni classe ha un estremo inferiore ed un estremo superiore Gli estremi possono essere inclusi nella classe (classe chiusa a destra e a sinistra) Può essere incluso solo l’estremo inferiore (classe chiusa a sinistra) Può essere incluso solo l’estremo superiore (classe chiusa a destra) n. di classi adeguato al problema classi disgiunte includere tutte le modalità del carattere abbiano se possibile stessa ampiezza intervalli aperti a destra o a sinistra 6 Come avviene l’acquisizione dei dati? Vedere autonomamente cap.1 par.1.5, 1.6 e 1.7 • Rilevazione sperimentale tipica delle Scienze fisiche, biologiche, chimiche etc. • Rilevazione osservazionale tipiche delle indagini statistiche, delle indagini di mercato, delle rilevazioni economiche, demografiche, sociali, etc. 7 Qual è in Italia l’Ente preposto all’acquisizione dei dati tramite indagini statistiche? ISTAT (Istituto Nazionale di Statistica) • Istat è un Ente di ricerca pubblico con ordinamento autonomo, sottoposto alla vigilanza della Presidenza del Consiglio (attuale Presidente dell’Istat è Giorgio Alleva) • Istat è al vertice del Sistema Statistico Nazionale (Sistan) che comprende oltre all’Istat, gli uffici di statistica centrali e periferici delle amministrazioni dello Stato, quelli delle Regioni, delle Province e dei Comuni, delle Unità Sanitarie Locali, delle Camere di Commercio e tutti gli uffici di statistica di enti e amministrazioni pubbliche http://www.istat.it/ http://www3.istat.it/servizi/studenti/valoredati/ 8 Fasi dell’indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione della popolazione e della lista delle unità statistiche definizione del piano di campionamento raccolta dei dati scelta della tecnica di rilevazione formulazione del questionario e pretest rilevazione sul campo registrazione dei dati registrazione su supporto magnetico controllo e correzione elaborazione e analisi dei dati 9 L’ esempio precedente Dati estratti dal questionario della terza intervista Si vogliono studiare le caratteristiche demografiche e sociali (caratteri) della popolazione del Lazio al 1° gennaio 2012 (collettivo). Un questionario potrebbe raccogliere le seguenti informazioni Codice ident. intervista 3 Sesso M Età in anni compiuti 38 Stato civile Coniugato Provincia di residenza Titolo di studio Professione LT Laurea Impiegato Numero componenti della famiglia (oltre l’intervistato) 4 Reddito lordo annuo (in migliaia di euro) 40 10 File originario dei dati Cod. Int. Sesso Età in anni compiu ti Stato civile Provincia di resid. 1 2 F F 29 40 Nubile Nubile RM FR 3 M 38 4 F 42 Coniug ato Coniug ata 5 M 48 Celibe RI 6 M 59 RM 7 M 70 Coniug ata Celibe n. comp. Fam. Reddito lordo annuo (migl. Euro) 1 3 35000 10000 LT Laurea Impiegato Diplom Disoccupato a Laurea Impiegato 4 40000 FR Laurea 3 90000 1 90000 4 15000 5 30000 8 9 F F 25 35 Nubile Coniug ata FR FR 3 3 20000 50000 10 M 46 Celibe RM 2 7000011 RM Titolo di studio Professione Libero professionis ta Laurea Libero professionis ta Diplom Casalinga a Lic. Pensionato Media Laurea Disoccupato Laurea Libero professionis ta Laurea Pensionato Qualche osservazione La stessa modalità può presentarsi ripetuta – anche molte volte – nella stessa colonna Ogni colonna corrisponde alla distribuzione unitaria di un carattere Scelto un carattere tra quelli di interesse, dalla tabella è possibile individuare subito la modalità assunta da ogni unità statistica del collettivo. (COLONNA) Viceversa, scelta un’unità, è possibile leggere le modalità che questa unità presenta in corrispondenza di ogni carattere considerato (RIGA) 12 n Sulla base del foglio dati precedente si costruisce la Stato civile Provincia Cod. di resid. Int. iu Titolo Sesso Professione Età in Stato n. Provincia Reddito Titolo di anni civile comp.di lordo resid.annuo di studio compiu Fam. (migl. Euro) studio ti Nubile Nubile RM 1 FR 2 Coniug ato Coniug ata LT 3 Laurea F Diplom F a Laurea M FR 4 Laurea F Celibe RI 5 Laurea M Coniug ata Celibe RM 6 Nubile Coniug ata FR 8 FR 9 Diplom M a Lic.M Media Laurea F Laurea F Celibe RM10 Laurea M RM 7 Impiegato 29 Nubile 1 Disoccupato 40 Nubile 3 Professione RM35000Laurea Impiegato FR10000 Diplom Disoccupato Tabella di frequenza a Impiegato 38 Coniug 4distribuzione LT 40000Laurea Impiegato secondo il ato titolo di studio Libero 42 Coniug 3 carattere FR90000Laurea Libero professionis ata professionis ta ta Libero 48 Celibe 1 90000Laurea Titolo diRIstudio niLibero professionis professionis ta ta Licenza media 1 Casalinga 59 Coniug 4 RM15000 Diplom Casalinga ata a Pensionato 70 Celibe 5 Diploma RM30000 Lic. Pensionato 2 Media Disoccupato 25 Nubile 3 FR20000Laurea Disoccupato 7Libero Libero 35 Coniug 3 Laurea FR50000Laurea professionis ata professionis ta Tot 10 ta Pensionato 46 Celibe 2 RM70000Laurea Pensionato n. comp. Fam. Reddito lordo annu (migl. Euro 1 3 35000 10000 4 40000 3 90000 1 90000 4 15000 5 30000 3 3 20000 50000 2 70000 13 Tabella statistica o tabella di frequenza Si ottiene dalla distribuzione unitaria considerando quante volte si presenta ciascuna modalità del carattere • Frequenze assolute (ni) • Frequenze relative (fi = ni / n) • Frequenze relative percentuale (pi = ni / n%) 14 Esempio Titolo di studio frequenza assoluta Lic. Media Diploma Laurea Totale 3 6 11 20 frequenza asso cumulata 3 9 20 - Titolo di studio frequenza relativa Frequenza percentuale Lic. Media Diploma Laurea Totale 0,15 0,3 0,55 1 15,0 30,0 55,0 100,0 15 Frequenza cumulata (modalità del carattere ordinate) La frequenza cumulata di una classe è data dalla somma della frequenza della classe con quella delle classi precedenti. j N j ni Frequenza assoluta cumulata: i1 j Fj fi Frequenza relativa cumulata: i1 Quante sono le persone che hanno meno di 30 anni? classi di età ni Nj fi Fj 0-5 17 17 0,17 0,17 5-15 40 57 0,40 0,57 15-30 37 94 0,37 0,94 30-35 6 100 0,06 1,00 Totale 100 1,00 16 classi di età ni 0-5 17 5-15 40 15-30 37 30-35 6 Totale 100 Il simbolo di sommatoria 3 n i i 1 Proprietà che ci potranno servire n n kx k x i i 1 X ni X1 n1 X2 n2 … … Xi ni … … Xk nk Totale n n1 n2 n3 17 40 37 94 i 1 i Tabella generica relativa alla vs X Generica ima modalità con rispettiva frequenza k n ni i 1 n k nk i 1