Titolo: Formula Uno 2003: le grandi polemiche

Transcript

Titolo: Formula Uno 2003: le grandi polemiche
Esempio di elaborato per l’esame di Statistica
Titolo: Formula Uno 2003: le grandi
polemiche
Abstract (max 3000 parole) : In questo lavoro si analizzano alcune variabili legate al
mondo delle corse, allo scopo di verificare se le critiche e le polemiche proliferate
durante l’ultimo campionato di Formula Uno hanno effettivamente un fondamento
scientifico. Innanzitutto si vuole stabilire se le nuove regole introdotte hanno portato a
cambiamenti significativi nel legame fra grandezze da sempre considerate connesse tra
loro: la relazione tra il conseguimento della pole position e la vittoria della gara e
quella tra il numero di chilometri percorsi da un pilota e i punti da lui ottenuti. Poi si
cercherà di capire se la contrapposizione tra pneumatici e i loro diversi rendimenti
dipendono, come da molti supposto, da fattori esogeni, come la temperatura dell’asfalto.
Si inizierà, quindi, con lo studio univariato delle variabili più interessanti, che
verranno poi messe in relazione fra loro, per concludere con un’analisi inferenziale
riguardante una prova di ipotesi sul legame fra km percorsi e punti ottenuti e una
differenza tra medie.
Introduzione (max 3000 parole): Il campionato 2003 ha segnato una vera e propria
rivoluzione della F1 ed è stato caratterizzato da novità, riconferme, sorprese e due
grandi polemiche. Da un lato le critiche mosse alle sostanziali modifiche introdotte al
regolamento per ridare spettacolarità alle corse: qualifiche ridotte ad un solo giro
lanciato, impossibilità di modificare gli assetti della macchina tra prove e gara, nuovo
sistema di punteggio che premia i primi otto classificati, anziché i primi sei. Dall’altro,
la partita a due tra i grandi costruttori di pneumatici, Bridgestone e Michelin, i cui
rendimenti hanno fortemente influito sulle alterne sorti dei piloti. La stagione si è
conclusa con molti interrogativi irrisolti, che lasciano spazio a interpretazioni e analisi
di vario tipo.
Fonti (max 3000 parole):: I dati sono stati reperiti sul web, da numerosi siti di Formula
Uno e di quotidiani e periodici sportivi presenti sulla rete. I dati non erano tutti
disponibili in formato Excel o compatibile e in alcuni casi non erano neanche
raggruppati in tabelle per argomento, per cui si è reso necessario un lungo lavoro di
trasferimento su foglio elettronico.
Presentazione delle variabili (max 3000 parole):
I dati sono stati raggruppati in due diversi datasets, uno con 24 osservazioni relative ai
piloti, l’altro con 16 osservazioni corrispondenti alle gare del mondiale.
Dataset “Piloti”:
Punti: numero di punti ottenuti dal pilota;
Km percorsi: numero di chilometri percorsi in totale dal pilota;
Pneumatico: marca di pneumatico adottato dal pilota;
Dataset “Gare”:
Temperatura asfalto: temperatura media dell’asfalto in gradi centigradi;
Punti Michelin: totale dei punti ottenuti dai piloti Michelin durante le gara;
Punti Bridgestone: totale dei punti ottenuti dai piloti Bridgestone durante le gara;
Pole = podio: incidenza dell’ottenimento della pole position sull’arrivo in una delle
prime tre posizioni alla fine della gara;
Pole = vittoria: incidenza dell’ottenimento della pole position sulla vittoria della gara.
1.
Analisi statistica (max 3000 parole)

1.1 Analisi univariata
1.1 km percorsi (Dataset: “Piloti”)
I 16 circuiti che compongono il campionato ricoprono 4787 km, che rappresentano la
distanza che ogni pilota deve teoricamente percorrere. Naturalmente nessuno dei 24
piloti ha completato il totale dei km a causa di uscite da una o più gare, di mancate
qualificazioni, di forfaits, di un numero di corse disputate inferiore a quello
complessivo (è il caso di quei piloti che hanno subito incidenti nel corso della stagione e
dei loro sostituti).
Il carattere è stato diviso in 5 classi di ampiezza variabile, in cui la quinta, [3500,4000),
rappresenta la classe modale, con la densità di frequenza più elevata. Il numero di km
percorsi varia da circa 300, lunghezza di un circuito medio, a 4652, ben il 97% del
totale, completati dal campione del mondo. La media dei km percorsi dal singolo pilota
è di 3109.3 km, equivalente al 65% del totale. La distribuzione, tuttavia, non è
simmetrica, ma obliqua a sinistra, con mediana pari a 3555.45 km. Il carattere presenta
un’elevata varianza, pari a 1506403, con scarto quadratico medio di 1227.3561; la
dispersione intorno alla media, tuttavia, non è particolarmente alta, con un coefficiente
di variazione pari a circa il 40% (0.3947).
Tabella 1: distribuzione di frequenze km
Variabile X
Valore Indice
Minimo
306,7
1°Quartile
3030,5
Mediana
3555,45
3°Quartile
3953,45
Massimo
4652
Tabella 2: sintesi box-plot
ISTOGRAMMA km
0,0007
5000
0,0006
M assimo
0,0005
4000
Densità
3°Quartile
0,0004
M ediana
3000
0,0003
1°Quartile
2000
M inimo
0,0002
1000
0,0001
0
0
400
1500
Figura 1: istogramma km
3000 3500
4000
4787
0
Variabile X
Figura 2: box plot km
1.2 Punti (Dataset: “Piloti”)
Il carattere punti è un quantitativo discreto che, però, è stato trattato come un continuo e
quindi riclassificato a causa dell’elevato numero di modalità differenti in cui è presente.
Il numero medio di punti per pilota è di 26, con un’elevata variabilità: si va da un
minimo di 0 fino a 93, con mediana pari a 11: la distribuzione è quindi fortemente
asimmetrica a destra. La classe modale coincide proprio con la prima classe, cioè quella
che va da zero a dieci, a dimostrazione del fatto che la maggior parte dei piloti ha
conseguito pochi punti (ben 11 su 24 appartengono alla prima classe). Il valore
massimo è ben al di sotto del totale disponibile di 160 punti e inferiore al risultato
conseguito negli anni precedenti dal vincitore, ma si nota anche una bassa incidenza di
piloti con zero punti: questo è stato imputato da molti al cambiamento nel sistema di
punteggio che, mandando a punti i primi otto, ha ridotto la distanza tra il vincitore e gli
altri (sempre 10 punti al primo classificato, ma 8 e non 6 al secondo, 6 e non 4 al terzo,
e poi 5, 4, 3, 2, 1) e ha premiato chi è riuscito ad arrivare in fondo alle gare (si pensi a
circuiti, come il famosissimo Montecarlo, che vedono da sempre un numero molto
esiguo di piloti che tagliano il traguardo: quest’anno solo dieci).
Rispetto ai km percorsi, i punti sono decisamente più variabili: il coefficiente di
variazione è pari a 1.187, cioè in media il carattere si distanzia dalla media ben il
118.7% della media stessa.
ISTOGRAMMA PUNTI
Densità
0,04
0,03
0,02
0,01
0
0 10 20
60
90
160
Figura 3: istogramma punti
Variabile X
Valore Indice
Minimo
1°Quartile
0
2,5
11
52
93
Mediana
3°Quartile
Massimo
Estremi
inferiori
delle
classi
Estremi
superiori
classi
Freq.
Freq.
Densità
assolute relative
0
10
11
0,458 0,046
10
20
5
0,208 0,021
20
60
4
0,167 0,004
60
90
2
0,083 0,003
90
160
2
0,083 0,001
Tabella 3: distribuzione di freq. punti
100
M assimo
80
3°Quartile
60
M ediana
40
1°Quartile
20
M inimo
0
Tabella 4: sintesi box plot punti
Figura 4: box plot punti
1.3 Pneumatici (Dataset: “Piloti”)
I 24 piloti si dividono equamente nella scelta della marca di pneumatici: 12 montano
gomme Bridgestone e altrettanti Michelin.
Pneumatico
Michelin
Bridgestone
Totale
Freq. Ass. Freq. Relat.
Funz. Ripartiz.
12
12
24
50,00%
100,00%
50,00%
50,00%
100,00%
Tabella 5: distribuzione frequenze pneumatici
50%
Michelin
50%
Bridgestone
Figura 5: diagramma a torta pneumatici
Questo dato ci consente, dunque, di procedere ad analisi sia bivariate che inferenziali,
senza che i risultati che si otterranno siano influenzati da un’asimmetria nel numero di
piloti che adottano un tipo o l’altro di pneumatico.
Tuttavia, di asimmetria si può parlare nella “qualità” delle scuderie e quindi dei piloti
che utilizzano le Michelin o le Bridgestone: infatti, se si eccettua la Ferrari con Michael
Schumacher e Rubens Barrichello, sono scuderie minori quelle che montano gomme
Bridgestone, mentre gli pneumatici della casa Francese sono preferiti da grandi team,
quali la Williams e la McLaren.
1.4 Pole=Podio e Pole=Vittoria (Dataset: “Gare”)
Queste variabili rappresentano il legame che esiste fra l’ottenimento della pole position
e la posizione raggiunta al termine della gara: l’evidenza empirica sembra indicare,
infatti, che chi parte davanti sia più avvantaggiato rispetto agli altri e abbia, quindi, più
possibilità di arrivare primo o, perlomeno, tra i primi. Per dimostrare se questa
intuizione abbia un fondamento, si sono costruite due variabili associando zero o uno ad
ognuna delle 16 osservazioni che rappresentano le gare del mondiale: zero è
l’insuccesso, il caso in cui chi parte in pole non vince o non sale sul podio, mentre uno è
il successo, cioè chi ha ottenuto la pole ha poi effettivamente vinto o è arrivato tra i
primi tre.
POLE=VITTORIA Freq. assolute
Freq. relative
Funz.Ripartizione
0
1
7
9
43,75%
56,25%
43,75%
100,00%
Totale
16
100,00%
Tabella 6: distribuzione di frequenze pole=vittoria
POLE=PODIO
0
1
Totale
Freq. assolute
Freq. relative
Funz.Ripartizione
4
12
16
25,00%
75,00%
100,00%
25,00%
100,00%
Tabella 7: distribuzione di frequenze pole=podio
Distribuzione di frequenze:
Pole=Vittoria
Distribuzione di frequenze:
pole=podio
25%
44%
56%
0
0
1
1
75%
Figura 6: diagramma a torta pole=vittoria
Figura 7: diagramma a torta pole=podio
In effetti, appare chiaro come la comune intuizione per cui la pole position è già una
mezza vittoria sia vera. Ben nove volte su sedici il pilota che ha vinto aveva anche la
pole e addirittura dodici volte chi è partito primo è salito sul podio. Si può, quindi,
affermare che tale legame sia rimasto pressoché invariato nonostante le nuove regole,
che hanno reso meno scontata l’assegnazione della pole position, non sempre ottenuta
da chi era favorito per quel determinato circuito: con prove ridotte ad un solo giro per
pilota, infatti, ogni minimo errore o il cambiamento delle stesse condizioni
meteorologiche può compromettere le qualifiche anche di grandi campioni.
2. Analisi bivariata
2.1 km percorsi – punti
L’introduzione delle nuove regole di punteggio di cui già discusso sopra fa ipotizzare
che portando a termine un numero elevato di gare si possano guadagnare più punti.
Sembra, quindi, esistere un legame di tipo lineare tra i km percorsi e i punti ottenuti da
un pilota. Per vedere se questo è vero, si è proceduto a porre in relazione le due
variabili, costruendo il diagramma di dispersione e la retta di regressione lineare. La
variabile indipendente sono i km percorsi dai piloti, i punti quella dipendente.
Sebbene il coefficiente di
Km percorsi - punti ottenuti
2
determinazione R non
sia
prossimo a 1, valore per cui si
100
può affermare l’esistenza di un
legame perfettamente lineare,
80
dal grafico emerge come le
60
variabili presentino una certa
tendenza
ad
associarsi,
40
confermata dalla correlazione
20
di 0.565. Questo dipende dal
fatto che il carattere punti è
0
molto variabile e influenzato
0
1000
2000
3000
4000
5000
da fattori differenti, primi fra
-20
tutti la bravura del pilota e
R2 = 0,3193
y = 0,0142x - 18,177
l’affidabilità della macchina.
Se si studiasse la stessa
relazione considerando piloti e
Figura 8: retta di regressione km-punti
macchine che si equivalgono
qualitativamente, ne
risulterebbe certo un legame
più netto.
3. Analisi Inferenziale (max 4000 parole):
3.1 Differenza tra medie km percorsi Michelin – Bridgestone
Alla luce delle differenze emerse dalle analisi precedenti si vuole verificare se la diversa
prestazione dei piloti che montano l’uno o l’altro tipo di pneumatici possa dipendere
dall’affidabilità di questi ultimi. Indicativo di ciò è il numero di km percorsi: si può,
quindi, verificare se la media dei km percorsi dai piloti che montano gomme Michelin è
uguale o no a quella dei piloti Bridgestone ad un livello di confidenza di 0.95 (a=0.05).
A tale proposito si sono considerati i 12 piloti per ogni marca come un campione
casuale semplice e si è calcolata la media campionaria dei km percorsi, ottenendo:
media
campionaria
di
Michelin=3367.467
e
media
campionaria
di
Bridgestone=2851.125. Si sono poi stimate le varianze delle popolazioni, ignote ma
assunte uguali, con lo stimatore pooled, ottenendo 113.832 e infine la regione di rifiuto,
secondo cui per rifiutare l’ipotesi nulla, cioè che le medie delle due popolazioni sono
uguali, la differenza tra le medie campionarie deve essere in valore assoluto maggiore di
9.4367. La differenza tra le medie campionarie osservata è di 516.342, ben maggiore del
valore richiesto dalla regione di rifiuto. Quindi si rifiuta l’ipotesi nulla e si può
affermare che le medie dei km percorsi dai piloti Michelin e Bridgestone sono diverse.
3.1 Test d’ipotesi su   km percorsi – punti
La relazione tra i km percorsi e i punti ottenuti trovata precedentemente può essere
analizzata in termini di inferenza: considerando i 24 piloti come un campione casuale
semplice, ci si può chiedere se il legame fra queste due variabili può essere esteso a tutta
la popolazione. Si ottiene un p-value pari a 0.004, valore sufficientemente basso per
poter affermare che i punti ottenuti dipendono effettivamente dai km percorsi: la
relazione non è quindi limitata al nostro campione.
Conclusioni (max 3000 parole):
Le analisi svolte in questo lavoro hanno risposto alle domande che ci si era posti
all’inizio e hanno confermato alcune intuizioni: esiste un legame lineare tra i km
percorsi e i punti ottenuti dai piloti; la relazione positiva fra l’ottenimento della pole
position e la vittoria della gara o l’arrivo tra i primi tre non si è modificata con
l’introduzione del nuovo sistema di qualifiche; il diverso rendimento degli pneumatici
dipende da vari fattori, quali la temperatura dell’asfalto e, sebbene i Michelin siano
nettamente superiori ai Bridgestone, come emerso chiaramente nel corso del mondiale,
questi ultimi riescono a ridurre il gap quando la colonnina di mercurio scende. Tali
affermazioni in parte confermano le grandi polemiche del campionato 2003, in parte le
smentiscono, suggerendo forse che cambiamenti diversi da quelli già apportati
potrebbero rendere più interessante uno sport già spettacolare per sua natura.
Sitografia
www.fia.com
www.gazzetta.it
www.formula1.com
www.formula1.it
www.f1box.it
www.f1grandprix.it
www.f1.racing-live.com
www.formula1.tuttocorse.it
www.formula1news.it
www.formula1online.info
www.gp1.it
www.tuttoformula1.com