Titolo: Formula Uno 2003: le grandi polemiche
Transcript
Titolo: Formula Uno 2003: le grandi polemiche
Esempio di elaborato per l’esame di Statistica Titolo: Formula Uno 2003: le grandi polemiche Abstract (max 3000 parole) : In questo lavoro si analizzano alcune variabili legate al mondo delle corse, allo scopo di verificare se le critiche e le polemiche proliferate durante l’ultimo campionato di Formula Uno hanno effettivamente un fondamento scientifico. Innanzitutto si vuole stabilire se le nuove regole introdotte hanno portato a cambiamenti significativi nel legame fra grandezze da sempre considerate connesse tra loro: la relazione tra il conseguimento della pole position e la vittoria della gara e quella tra il numero di chilometri percorsi da un pilota e i punti da lui ottenuti. Poi si cercherà di capire se la contrapposizione tra pneumatici e i loro diversi rendimenti dipendono, come da molti supposto, da fattori esogeni, come la temperatura dell’asfalto. Si inizierà, quindi, con lo studio univariato delle variabili più interessanti, che verranno poi messe in relazione fra loro, per concludere con un’analisi inferenziale riguardante una prova di ipotesi sul legame fra km percorsi e punti ottenuti e una differenza tra medie. Introduzione (max 3000 parole): Il campionato 2003 ha segnato una vera e propria rivoluzione della F1 ed è stato caratterizzato da novità, riconferme, sorprese e due grandi polemiche. Da un lato le critiche mosse alle sostanziali modifiche introdotte al regolamento per ridare spettacolarità alle corse: qualifiche ridotte ad un solo giro lanciato, impossibilità di modificare gli assetti della macchina tra prove e gara, nuovo sistema di punteggio che premia i primi otto classificati, anziché i primi sei. Dall’altro, la partita a due tra i grandi costruttori di pneumatici, Bridgestone e Michelin, i cui rendimenti hanno fortemente influito sulle alterne sorti dei piloti. La stagione si è conclusa con molti interrogativi irrisolti, che lasciano spazio a interpretazioni e analisi di vario tipo. Fonti (max 3000 parole):: I dati sono stati reperiti sul web, da numerosi siti di Formula Uno e di quotidiani e periodici sportivi presenti sulla rete. I dati non erano tutti disponibili in formato Excel o compatibile e in alcuni casi non erano neanche raggruppati in tabelle per argomento, per cui si è reso necessario un lungo lavoro di trasferimento su foglio elettronico. Presentazione delle variabili (max 3000 parole): I dati sono stati raggruppati in due diversi datasets, uno con 24 osservazioni relative ai piloti, l’altro con 16 osservazioni corrispondenti alle gare del mondiale. Dataset “Piloti”: Punti: numero di punti ottenuti dal pilota; Km percorsi: numero di chilometri percorsi in totale dal pilota; Pneumatico: marca di pneumatico adottato dal pilota; Dataset “Gare”: Temperatura asfalto: temperatura media dell’asfalto in gradi centigradi; Punti Michelin: totale dei punti ottenuti dai piloti Michelin durante le gara; Punti Bridgestone: totale dei punti ottenuti dai piloti Bridgestone durante le gara; Pole = podio: incidenza dell’ottenimento della pole position sull’arrivo in una delle prime tre posizioni alla fine della gara; Pole = vittoria: incidenza dell’ottenimento della pole position sulla vittoria della gara. 1. Analisi statistica (max 3000 parole) 1.1 Analisi univariata 1.1 km percorsi (Dataset: “Piloti”) I 16 circuiti che compongono il campionato ricoprono 4787 km, che rappresentano la distanza che ogni pilota deve teoricamente percorrere. Naturalmente nessuno dei 24 piloti ha completato il totale dei km a causa di uscite da una o più gare, di mancate qualificazioni, di forfaits, di un numero di corse disputate inferiore a quello complessivo (è il caso di quei piloti che hanno subito incidenti nel corso della stagione e dei loro sostituti). Il carattere è stato diviso in 5 classi di ampiezza variabile, in cui la quinta, [3500,4000), rappresenta la classe modale, con la densità di frequenza più elevata. Il numero di km percorsi varia da circa 300, lunghezza di un circuito medio, a 4652, ben il 97% del totale, completati dal campione del mondo. La media dei km percorsi dal singolo pilota è di 3109.3 km, equivalente al 65% del totale. La distribuzione, tuttavia, non è simmetrica, ma obliqua a sinistra, con mediana pari a 3555.45 km. Il carattere presenta un’elevata varianza, pari a 1506403, con scarto quadratico medio di 1227.3561; la dispersione intorno alla media, tuttavia, non è particolarmente alta, con un coefficiente di variazione pari a circa il 40% (0.3947). Tabella 1: distribuzione di frequenze km Variabile X Valore Indice Minimo 306,7 1°Quartile 3030,5 Mediana 3555,45 3°Quartile 3953,45 Massimo 4652 Tabella 2: sintesi box-plot ISTOGRAMMA km 0,0007 5000 0,0006 M assimo 0,0005 4000 Densità 3°Quartile 0,0004 M ediana 3000 0,0003 1°Quartile 2000 M inimo 0,0002 1000 0,0001 0 0 400 1500 Figura 1: istogramma km 3000 3500 4000 4787 0 Variabile X Figura 2: box plot km 1.2 Punti (Dataset: “Piloti”) Il carattere punti è un quantitativo discreto che, però, è stato trattato come un continuo e quindi riclassificato a causa dell’elevato numero di modalità differenti in cui è presente. Il numero medio di punti per pilota è di 26, con un’elevata variabilità: si va da un minimo di 0 fino a 93, con mediana pari a 11: la distribuzione è quindi fortemente asimmetrica a destra. La classe modale coincide proprio con la prima classe, cioè quella che va da zero a dieci, a dimostrazione del fatto che la maggior parte dei piloti ha conseguito pochi punti (ben 11 su 24 appartengono alla prima classe). Il valore massimo è ben al di sotto del totale disponibile di 160 punti e inferiore al risultato conseguito negli anni precedenti dal vincitore, ma si nota anche una bassa incidenza di piloti con zero punti: questo è stato imputato da molti al cambiamento nel sistema di punteggio che, mandando a punti i primi otto, ha ridotto la distanza tra il vincitore e gli altri (sempre 10 punti al primo classificato, ma 8 e non 6 al secondo, 6 e non 4 al terzo, e poi 5, 4, 3, 2, 1) e ha premiato chi è riuscito ad arrivare in fondo alle gare (si pensi a circuiti, come il famosissimo Montecarlo, che vedono da sempre un numero molto esiguo di piloti che tagliano il traguardo: quest’anno solo dieci). Rispetto ai km percorsi, i punti sono decisamente più variabili: il coefficiente di variazione è pari a 1.187, cioè in media il carattere si distanzia dalla media ben il 118.7% della media stessa. ISTOGRAMMA PUNTI Densità 0,04 0,03 0,02 0,01 0 0 10 20 60 90 160 Figura 3: istogramma punti Variabile X Valore Indice Minimo 1°Quartile 0 2,5 11 52 93 Mediana 3°Quartile Massimo Estremi inferiori delle classi Estremi superiori classi Freq. Freq. Densità assolute relative 0 10 11 0,458 0,046 10 20 5 0,208 0,021 20 60 4 0,167 0,004 60 90 2 0,083 0,003 90 160 2 0,083 0,001 Tabella 3: distribuzione di freq. punti 100 M assimo 80 3°Quartile 60 M ediana 40 1°Quartile 20 M inimo 0 Tabella 4: sintesi box plot punti Figura 4: box plot punti 1.3 Pneumatici (Dataset: “Piloti”) I 24 piloti si dividono equamente nella scelta della marca di pneumatici: 12 montano gomme Bridgestone e altrettanti Michelin. Pneumatico Michelin Bridgestone Totale Freq. Ass. Freq. Relat. Funz. Ripartiz. 12 12 24 50,00% 100,00% 50,00% 50,00% 100,00% Tabella 5: distribuzione frequenze pneumatici 50% Michelin 50% Bridgestone Figura 5: diagramma a torta pneumatici Questo dato ci consente, dunque, di procedere ad analisi sia bivariate che inferenziali, senza che i risultati che si otterranno siano influenzati da un’asimmetria nel numero di piloti che adottano un tipo o l’altro di pneumatico. Tuttavia, di asimmetria si può parlare nella “qualità” delle scuderie e quindi dei piloti che utilizzano le Michelin o le Bridgestone: infatti, se si eccettua la Ferrari con Michael Schumacher e Rubens Barrichello, sono scuderie minori quelle che montano gomme Bridgestone, mentre gli pneumatici della casa Francese sono preferiti da grandi team, quali la Williams e la McLaren. 1.4 Pole=Podio e Pole=Vittoria (Dataset: “Gare”) Queste variabili rappresentano il legame che esiste fra l’ottenimento della pole position e la posizione raggiunta al termine della gara: l’evidenza empirica sembra indicare, infatti, che chi parte davanti sia più avvantaggiato rispetto agli altri e abbia, quindi, più possibilità di arrivare primo o, perlomeno, tra i primi. Per dimostrare se questa intuizione abbia un fondamento, si sono costruite due variabili associando zero o uno ad ognuna delle 16 osservazioni che rappresentano le gare del mondiale: zero è l’insuccesso, il caso in cui chi parte in pole non vince o non sale sul podio, mentre uno è il successo, cioè chi ha ottenuto la pole ha poi effettivamente vinto o è arrivato tra i primi tre. POLE=VITTORIA Freq. assolute Freq. relative Funz.Ripartizione 0 1 7 9 43,75% 56,25% 43,75% 100,00% Totale 16 100,00% Tabella 6: distribuzione di frequenze pole=vittoria POLE=PODIO 0 1 Totale Freq. assolute Freq. relative Funz.Ripartizione 4 12 16 25,00% 75,00% 100,00% 25,00% 100,00% Tabella 7: distribuzione di frequenze pole=podio Distribuzione di frequenze: Pole=Vittoria Distribuzione di frequenze: pole=podio 25% 44% 56% 0 0 1 1 75% Figura 6: diagramma a torta pole=vittoria Figura 7: diagramma a torta pole=podio In effetti, appare chiaro come la comune intuizione per cui la pole position è già una mezza vittoria sia vera. Ben nove volte su sedici il pilota che ha vinto aveva anche la pole e addirittura dodici volte chi è partito primo è salito sul podio. Si può, quindi, affermare che tale legame sia rimasto pressoché invariato nonostante le nuove regole, che hanno reso meno scontata l’assegnazione della pole position, non sempre ottenuta da chi era favorito per quel determinato circuito: con prove ridotte ad un solo giro per pilota, infatti, ogni minimo errore o il cambiamento delle stesse condizioni meteorologiche può compromettere le qualifiche anche di grandi campioni. 2. Analisi bivariata 2.1 km percorsi – punti L’introduzione delle nuove regole di punteggio di cui già discusso sopra fa ipotizzare che portando a termine un numero elevato di gare si possano guadagnare più punti. Sembra, quindi, esistere un legame di tipo lineare tra i km percorsi e i punti ottenuti da un pilota. Per vedere se questo è vero, si è proceduto a porre in relazione le due variabili, costruendo il diagramma di dispersione e la retta di regressione lineare. La variabile indipendente sono i km percorsi dai piloti, i punti quella dipendente. Sebbene il coefficiente di Km percorsi - punti ottenuti 2 determinazione R non sia prossimo a 1, valore per cui si 100 può affermare l’esistenza di un legame perfettamente lineare, 80 dal grafico emerge come le 60 variabili presentino una certa tendenza ad associarsi, 40 confermata dalla correlazione 20 di 0.565. Questo dipende dal fatto che il carattere punti è 0 molto variabile e influenzato 0 1000 2000 3000 4000 5000 da fattori differenti, primi fra -20 tutti la bravura del pilota e R2 = 0,3193 y = 0,0142x - 18,177 l’affidabilità della macchina. Se si studiasse la stessa relazione considerando piloti e Figura 8: retta di regressione km-punti macchine che si equivalgono qualitativamente, ne risulterebbe certo un legame più netto. 3. Analisi Inferenziale (max 4000 parole): 3.1 Differenza tra medie km percorsi Michelin – Bridgestone Alla luce delle differenze emerse dalle analisi precedenti si vuole verificare se la diversa prestazione dei piloti che montano l’uno o l’altro tipo di pneumatici possa dipendere dall’affidabilità di questi ultimi. Indicativo di ciò è il numero di km percorsi: si può, quindi, verificare se la media dei km percorsi dai piloti che montano gomme Michelin è uguale o no a quella dei piloti Bridgestone ad un livello di confidenza di 0.95 (a=0.05). A tale proposito si sono considerati i 12 piloti per ogni marca come un campione casuale semplice e si è calcolata la media campionaria dei km percorsi, ottenendo: media campionaria di Michelin=3367.467 e media campionaria di Bridgestone=2851.125. Si sono poi stimate le varianze delle popolazioni, ignote ma assunte uguali, con lo stimatore pooled, ottenendo 113.832 e infine la regione di rifiuto, secondo cui per rifiutare l’ipotesi nulla, cioè che le medie delle due popolazioni sono uguali, la differenza tra le medie campionarie deve essere in valore assoluto maggiore di 9.4367. La differenza tra le medie campionarie osservata è di 516.342, ben maggiore del valore richiesto dalla regione di rifiuto. Quindi si rifiuta l’ipotesi nulla e si può affermare che le medie dei km percorsi dai piloti Michelin e Bridgestone sono diverse. 3.1 Test d’ipotesi su km percorsi – punti La relazione tra i km percorsi e i punti ottenuti trovata precedentemente può essere analizzata in termini di inferenza: considerando i 24 piloti come un campione casuale semplice, ci si può chiedere se il legame fra queste due variabili può essere esteso a tutta la popolazione. Si ottiene un p-value pari a 0.004, valore sufficientemente basso per poter affermare che i punti ottenuti dipendono effettivamente dai km percorsi: la relazione non è quindi limitata al nostro campione. Conclusioni (max 3000 parole): Le analisi svolte in questo lavoro hanno risposto alle domande che ci si era posti all’inizio e hanno confermato alcune intuizioni: esiste un legame lineare tra i km percorsi e i punti ottenuti dai piloti; la relazione positiva fra l’ottenimento della pole position e la vittoria della gara o l’arrivo tra i primi tre non si è modificata con l’introduzione del nuovo sistema di qualifiche; il diverso rendimento degli pneumatici dipende da vari fattori, quali la temperatura dell’asfalto e, sebbene i Michelin siano nettamente superiori ai Bridgestone, come emerso chiaramente nel corso del mondiale, questi ultimi riescono a ridurre il gap quando la colonnina di mercurio scende. Tali affermazioni in parte confermano le grandi polemiche del campionato 2003, in parte le smentiscono, suggerendo forse che cambiamenti diversi da quelli già apportati potrebbero rendere più interessante uno sport già spettacolare per sua natura. Sitografia www.fia.com www.gazzetta.it www.formula1.com www.formula1.it www.f1box.it www.f1grandprix.it www.f1.racing-live.com www.formula1.tuttocorse.it www.formula1news.it www.formula1online.info www.gp1.it www.tuttoformula1.com