Procedure Open-source per l`Analisi dei Redditi
Transcript
Procedure Open-source per l`Analisi dei Redditi
Procedure Open-source per l’Analisi dei Redditi Massimiliano Sifone Comune di Firenze [email protected] Perché Open L’analisi dei redditi tramite SAS e SPSS è certamente più agevole ma il costo di questi strumenti non è sempre sopportabile da parte di piccoli enti; Il Software Open-source è gratuito e disponibile a tutti. L’utilizzo richiede tuttavia che l’utente abbia formazione sullo strumento. Necessità Informative Ottenere maggiori informazioni circa la distribuzione dei redditi personali e familiari; Ottenere informazioni sull’utilizzo dei modelli dichiarativi; Ottenere informazioni sulla distribuzione delle addizionali IRPEF; Ottenere informazioni sulla distribuzione del reddito all’interno di aree sub-comunali; Avere strumenti per l’imputazione di valori mancanti in rilevazioni campionarie. La banca dati Ogni Comune può ottenere, tramite apposita domanda all’Agenzia delle Entrate, l’accesso al sistema SIATEL; Tramite questo, accedere alle procedure di “Fornitura dati ai Comuni” che permette, autenticandosi, di scaricare direttamente tramite internet la banca dati delle dichiarazioni dei redditi delle persone fisiche, riferite al proprio comune. Le forniture ai comuni Tramite l’accesso a SIATEL è possibile ottenere dati dei modelli dichiarativi riferiti agli anni tra il 2001 e il 2007; I dati riguardano mod. UNICO, 730 e 770 (CUD). Questi dati sono forniti in file separati per modello. Sono riferiti a tutti coloro che versano addizionale comunale nel comune considerato. I tracciati record Fanno riferimento a “dichiarazioni sintetiche”, ovvero i dati non contengono ogni campo presente nei modelli dichiarativi, ma per alcuni campi, sono state fatte aggregazioni; Cambiano ogni anno in conseguenza delle modificazioni ai modelli dichiarativi; Tutti i file sono forniti in formato testo. Le procedure realizzate Si basano su R, che è un ambiente statistico per la manipolazione, l’analisi e la rappresentazione grafica dei dati. E’ gratuito e disponibile al sito http://CRAN.R-project.org Permettono l’importazione dei singoli file dei modelli dichiarativi tramite una serie di istruzioni valide per tutti i comuni; Permettono di analizzare i dati dei dichiaranti in base a categorie già disponibili all’interno del file, oppure aggiungendone altre da file esterni (Anagrafe della popolazione). Basics Ogni file viene importato impartendo istruzioni nell’ambiente R; Tutte le istruzioni possono essere immesse in R tramite copia/incolla dal manuale fornito; Sono stati creati due file chiave, che per ogni anno e per ogni modello permettono di tenere conto dei cambiamenti annuali nei tracciati record. R Tramite l’uso del comando AGGREGATE di R viene spiegato come passare dall’analisi di singoli modelli dichiarativi ad analisi di dati di singoli contribuenti (CUD); Tramite AGGREGATE, in seguito al merge con l’anagrafe della popolazione, viene mostrato come ottenere un file con i dati per famiglia. Tramite semplici comandi BY viene mostrato come trovare medie o totali di variabili quantitative per categorie; Tramite l’uso del codice fiscale viene mostrato come aggiungere al file importato informazioni provenienti da file esterni (per dichiaranti residenti) Integrazione tra archivi amministrativi ANAGRAFE DELLA POPOLAZIONE BANCA DATI DEL CATASTO CF CF BANCA DATI AGENZIA ENTRATE R File base File importato Esempio di analisi Approfondimenti Poiché l’analisi di reddito netto e di reddito totale lordo possono essere di maggiore interesse, è necessario lavorare su procedure standardizzate di aggregazione di variabili (con ISTAT); Procedere alla pulitura dell’archivio e ad alcuni controlli di coerenza dovrebbe essere sempre preliminare all’analisi, anche se sottoposta a procedura standardizzate da studiare. Sviluppi futuri e conclusioni Creazione di standard per la pulizia dell’archivio ed eventuali imputazioni; Creazione di standard per l’analisi di aggregazioni di variabili; Studio di un’interfaccia grafica più userfriendly.