Procedure Open-source per l`Analisi dei Redditi

Transcript

Procedure Open-source per l`Analisi dei Redditi
Procedure Open-source
per l’Analisi dei Redditi
Massimiliano Sifone
Comune di Firenze
[email protected]
Perché Open
ƒ L’analisi dei redditi tramite SAS e SPSS è
certamente più agevole ma il costo di
questi strumenti non è sempre
sopportabile da parte di piccoli enti;
ƒ Il Software Open-source è gratuito e
disponibile a tutti. L’utilizzo richiede
tuttavia che l’utente abbia formazione sullo
strumento.
Necessità Informative
ƒ Ottenere maggiori informazioni circa la
ƒ
ƒ
ƒ
ƒ
distribuzione dei redditi personali e familiari;
Ottenere informazioni sull’utilizzo dei modelli
dichiarativi;
Ottenere informazioni sulla distribuzione delle
addizionali IRPEF;
Ottenere informazioni sulla distribuzione del
reddito all’interno di aree sub-comunali;
Avere strumenti per l’imputazione di valori
mancanti in rilevazioni campionarie.
La banca dati
ƒ Ogni Comune può ottenere, tramite
apposita domanda all’Agenzia delle
Entrate, l’accesso al sistema SIATEL;
ƒ Tramite questo, accedere alle procedure
di “Fornitura dati ai Comuni” che permette,
autenticandosi, di scaricare direttamente
tramite internet la banca dati delle
dichiarazioni dei redditi delle persone
fisiche, riferite al proprio comune.
Le forniture ai comuni
ƒ Tramite l’accesso a SIATEL è possibile
ottenere dati dei modelli dichiarativi riferiti
agli anni tra il 2001 e il 2007;
ƒ I dati riguardano mod. UNICO, 730 e 770
(CUD). Questi dati sono forniti in file
separati per modello.
ƒ Sono riferiti a tutti coloro che versano
addizionale comunale nel comune
considerato.
I tracciati record
ƒ Fanno riferimento a “dichiarazioni
sintetiche”, ovvero i dati non contengono
ogni campo presente nei modelli
dichiarativi, ma per alcuni campi, sono
state fatte aggregazioni;
ƒ Cambiano ogni anno in conseguenza delle
modificazioni ai modelli dichiarativi;
ƒ Tutti i file sono forniti in formato testo.
Le procedure realizzate
ƒ Si basano su R, che è un ambiente statistico per
la manipolazione, l’analisi e la rappresentazione
grafica dei dati. E’ gratuito e disponibile al sito
http://CRAN.R-project.org
ƒ Permettono l’importazione dei singoli file dei
modelli dichiarativi tramite una serie di istruzioni
valide per tutti i comuni;
ƒ Permettono di analizzare i dati dei dichiaranti in
base a categorie già disponibili all’interno del
file, oppure aggiungendone altre da file esterni
(Anagrafe della popolazione).
Basics
ƒ Ogni file viene importato impartendo
istruzioni nell’ambiente R;
ƒ Tutte le istruzioni possono essere
immesse in R tramite copia/incolla dal
manuale fornito;
ƒ Sono stati creati due file chiave, che per
ogni anno e per ogni modello permettono
di tenere conto dei cambiamenti annuali
nei tracciati record.
R
ƒ Tramite l’uso del comando AGGREGATE di R viene
ƒ
ƒ
ƒ
spiegato come passare dall’analisi di singoli modelli
dichiarativi ad analisi di dati di singoli contribuenti (CUD);
Tramite AGGREGATE, in seguito al merge con
l’anagrafe della popolazione, viene mostrato come
ottenere un file con i dati per famiglia.
Tramite semplici comandi BY viene mostrato come
trovare medie o totali di variabili quantitative per
categorie;
Tramite l’uso del codice fiscale viene mostrato come
aggiungere al file importato informazioni provenienti da
file esterni (per dichiaranti residenti)
Integrazione tra archivi
amministrativi
ANAGRAFE DELLA
POPOLAZIONE
BANCA DATI DEL
CATASTO
CF
CF
BANCA DATI AGENZIA
ENTRATE
R
File base
File importato
Esempio di analisi
Approfondimenti
ƒ Poiché l’analisi di reddito netto e di reddito totale
lordo possono essere di maggiore interesse, è
necessario lavorare su procedure
standardizzate di aggregazione di variabili (con
ISTAT);
ƒ Procedere alla pulitura dell’archivio e ad alcuni
controlli di coerenza dovrebbe essere sempre
preliminare all’analisi, anche se sottoposta a
procedura standardizzate da studiare.
Sviluppi futuri e conclusioni
ƒ Creazione di standard per la pulizia
dell’archivio ed eventuali imputazioni;
ƒ Creazione di standard per l’analisi di
aggregazioni di variabili;
ƒ Studio di un’interfaccia grafica più userfriendly.