Analisi delle Curve di offerta della Borsa del Mercato Elettrico
Transcript
Analisi delle Curve di offerta della Borsa del Mercato Elettrico
notizie dal CINECA Analisi delle Curve di offerta della Borsa del Mercato Elettrico di Lucia Passamonti*, Stefano Caruggi*, Roberta Turra, Giorgio Pedrazzi *Autorità per l’Energia Elettrica e il Gas In collaboration with the Italian Regulatory Authority for Electricity and Gas, CINECA applied Data Mining methodologies to the analysis of the bidding curves of power producers on the Italian Electricity Market. Liberalization of the electricity sector and the creation of a an electronic marketplace have triggered numerous analyses of the degree of competitiveness of the electricity market and development of tools for monitoring the market. The proposed methodologies afford accurate assessment and efficient classification of the bidding curves by using a vectorial representation of the curves, cluster analysis tools and classification models. Application of the models to different periods of time and for different aggregations allows investigation of the behaviour of Market Participants in terms of bidding strategies over time and from different points of view. L’Autorità per l’energia elettrica e il gas (AEEG), essendo investita di una specifica funzione di controllo e di promozione della concorrenza e dell’efficienza nell’offerta dei servizi di pubblica utilità nel settore dell’energia elettrica, esercita una funzione continuativa di monitoraggio del mercato elettrico all’ingrosso e del mercato per il servizio del dispacciamento, in una prospettiva finalizzata a controllare e valutare le dinamiche di formazione dei prezzi nel mercato, il grado di concorrenzialità del mercato, nonché l’efficacia delle regole di funzionamento dei mercati. Un simile controllo ha, tra l’altro, lo scopo di consentire al regolatore di accertare se l’esistenza di anomalie nei prezzi siano attribuibili a situazioni contingenti, relative a indisponibilità di elementi di rete (vale a dire scarsità di capacità di trasporto) o alla motivata indisponibilità di unità di produzione (vale a dire scarsità di offerta), oppure a condotte strategiche volutamente poste in essere dagli operatori di mercato e finalizzate a sfruttare il loro potere di mercato. Analysis of the Power Stock Market Offer Curves Data l’importanza che questa funzione va assumendo, soprattutto in un’ottica prospettica in un contesto di mercati liberalizzati, la Direzione Strategie, Studi e Documentazione dell’Autorità ha condotto uno studio per valutare le potenzialità di un approccio quantitativo di tipo statistico (la cluster analysis) per Esempio di curva d’offerta 25 notizie dal CINECA Segmentazione della curva d’offerta studiare i comportamenti di offerta degli operatori nella borsa elettrica. Lo studio è stato effettuato in collaborazione con CINECA, che ha curato in particolare gli aspetti di metodologia statistica e di data mining e di implementazione delle procedure di analisi. In particolare viene proposto l’utilizzo di un metodo per la rappresentazione vettoriale delle curve di offerta che consente la loro classificazione utilizzando tecniche di clustering. I risultati della cluster analysis sono il punto di partenza per creare modelli di classificazione delle curve di offerta basati sugli alberi decisione. La metodologia proposta è stata applicata in due analisi specifiche sui dati relativi al Mercato del Giorno Prima: la prima in cui si raggruppano le curve orarie di offerta definite a livello di operatore - date dall’aggregazione delle offerte orarie presentate per i singoli impianti - e la seconda, in cui si raggruppano le curve di offerta orarie presentate sui singoli impianti. L’applicazione della cluster analysis consente di comprendere alcuni aspetti di fondamentale importanza relativi al comportamento di offerta degli operatori che vendono l’energia e relativi alla politica di offerta dei singoli impianti di generazione. Aspetti metodologici La cluster analysis non può essere applicata direttamente alle curve di offerta: le curve sono, infatti, definite da un numero variabile di punti a seconda del numero di offerte presentate. A scopo di confronto è necessario ricondurle ad un numero omogeneo di punti 26 (dimensione del vettore di rappresentazione), questa operazione viene detta segmentazione e consiste nel dividere ciascuna curva in un numero fisso di intervalli, o segmenti, di uguale dimensione (lungo l’asse delle quantità) secondo una metodologia proposta da Hao et al. (2004) [1]. I dati elementari necessari per l’analisi vengono estratti dal database del Mercato Elettrico e contengono le informazioni relative alle offerte presentate dagli operatori, ai risultati del mercato nel periodo di riferimento ed agli impianti. Le curve di offerta sono generate calcolando le quantità cumulate per operatore (o per impianto), data ed intervallo orario sulle offerte ordinate per prezzo crescente, in modo da permettere la rappresentazione grafica tramite una funzione a gradini. Prezzi e quantità sono normalizzati: i primi considerando il valore massimo di mercato (pari a 500 /MWh) e i volumi considerando la quantità cumulata totale offerta nello stesso giorno e nella stessa ora da ciascun operatore (punto massimo della curva d’offerta).Questa normalizzazione implica che i valori delle quantità non saranno più presi in considerazione e si confronteranno i prezzi a ciascun ventesimo della quantità offerta. Il prezzo di riferimento è il prezzo medio zonale annuale. Le curve sono segmentate in 20 intervalli in quanto questo valore consente un rappresentazione efficace delle curve originali [1]. Ogni segmento rappresenta quindi un ventesimo della quantità complessivamente offerta. Come conseguenza di questa segmentazione, curve generate da una singola offerta saranno rappresentate da 20 valori, così come curve generate da centinaia di offerte. Per ogni segmento è calcolata l’area compresa tra la curva d’offerta e la retta che rappresenta il prezzo di riferimento. L’area costituisce infatti un indicatore del prezzo medio di segmento. Considerare il prezzo medio annuale come punto di riferimento per il calcolo delle aree (piuttosto che il prezzo zero) ha il vantaggio di consentire aree negative. Le aree negative indicano che la curva d’offerta in quel segmento (per quel ventesimo della quantità offerta) è sotto al prezzo medio annuale, oppure che interseca l’asse del prezzo medio notizie dal CINECA annuale ma l’area negativa è comunque più ampia di quella positiva. I valori di area così ottenuti costituiscono la rappresentazione vettoriale della curva d’offerta e definiscono uno spazio omogeneo, a 20 dimensioni, dove è possibile calcolare le distanze tra curve e quindi applicare le tecniche di clustering. I valori di area sono integrati con altre informazioni che, pur non essendo necessarie per il clustering, sono utili per l’interpretazione dei risultati (meta-informazione). Oltre alle informazioni identificative della curva (operatore, data e ora) sono calcolate come informazioni descrittive della curva: • la quantità di energia complessivamente offerta; • la percentuale di quantità accettata; • il numero di offerte presentate; • il numero di gradini (differenziazione dei prezzi); • l’area complessiva della curva. Come informazioni descrittive della sessione di mercato (indipendenti dall’operatore): • il numero di offerte inviate alla sessione; • il fabbisogno (quantità complessivamente scambiata, corrispondente alla somma delle quantità accettate nella zona considerata); • il prezzo di mercato (orario, zonale); • il giorno della settimana; • il tipo di giorno (feriale/festivo); • la fascia oraria (in 3 intervalli: F1 peak / F2 mid-level / F3 off-peak); • il mese. Per l’analisi a livello di impianto, la meta-informazione comprende anche i dati descrittivi dell’impianto (capacità massima, tipologia d’impianto, tecnologia, operatore di riferimento). Per quanto riguarda la cluster analysis in letteratura è stato proposto l’utilizzo di metodi gerarchici come, ad esempio, il metodo di Ward o il metodo Average linkage. Avendo considerato negli studi effettuati un periodo di tempo di un anno, pur limitando l’analisi alla sola Macrozona Nord, si sono generate un numero elevatissimo di curve di offerta. Questo ha reso impossibile, dal punto di vista computazionale, l’applicazione diretta dei metodi gerarchici. Si applica quindi, preliminarmente, un metodo partitivo di clustering (k-medie) generando 1000 cluster intermedi. Il cluster gerarchico viene successivamente eseguito su questi 1000 cluster. La scelta del numero ottimale di cluster finali viene effettuata osservando l’andamento, al variare del numero di cluster, degli indicatori di qualità (pseudo F e pseudo t2). I cluster ottenuti definiscono delle tipologie di comportamento, interpretabili in termini di strategie d’offerta, e costituiscono la base per procedere alla creazione di un modello di classificazione per consentire l’assegnazione di nuove curve d’offerta alle tipologie di riferimento. Curve d’offerta che sono state raggruppate nel cluster 16 (confronto tra le curve originali e la loro rappresentazione vettoriale) Un esempio: analisi per operatore Il clustering delle offerte per operatore consente di comprendere la strategia tipica di offerta dei bidders, eventualmente differenziata sulla base di alcune variabili fondamentali di mercato, in primis il livello di domanda e il periodo temporale di riferimento (ora del giorno, giorno della settimana, mese). Questa analisi permette di identificare gli operatori aventi disponibilità di un parco impianti “omogeneo” ai fini della presentazione delle offerte in borsa. Con riferimento a questo aspetto, occorre evidenziare che, in ragione della modalità di implementazione della cluster analysis che è stata scelta in questo studio, la quantità in termini assoluti offerta da parte 27 notizie dal CINECA Rappresentazione grafica dei centroidi dei clusters 28 di un operatore non è determinante nel definire i raggruppamenti. In questo modo, ai fini dei raggruppamenti dei cluster per operatore risultano cruciali l’articolazione in gradini delle curve di offerta e il livello di ciascun gradino. I dati sono stati estratti dal database del Mercato Elettrico a livello elementare: singole offerte di vendita inviate al Mercato del Giorno Prima da tutti gli operatori per le zone Nord, Turbigo e Monfalcone, da gennaio a dicembre 2006 (comprese le offerte a prezzo zero). La scelta della macrozona Nord scaturisce sia dalla sua importanza relativa in termini di quota di volumi scambiati sul totale degli scambi a livello di mercato elettrico, sia dalla volontà di verificare l’effettivo grado di concorrenzialità nell’aggregazione geografica considerata maggiormente competitiva. La scelta di un periodo temporale pari ad un anno deriva dalla necessità di avere una quantità di dati in termini di offerte di vendita abbastanza ampia per definire dei comportamenti tipici di offerta, indipendentemente da circostanze di mercato di natura contingente. I dati estratti (6 milioni di offerte) sono stati aggregati in 219.926 curve d’offerta, a livello di operatore (e 2.798.367 a livello d’impianto). Tra queste, le 199.345 curve oggetto di analisi (1.613.635 a livello d’impianto) sono state selezionate escludendo gli operatori non di mercato, escludendo, cioè, le offerte pre- sentate a prezzo “vincolato”, come le offerte degli impianti CIP6 e quelle relative a contratti bilaterali. Si veda nell’immagine della pagina precedente la rappresentazione grafica delle curve che compongono uno dei clusters ottenuti. Per una rappresentazione d’insieme possono essere utilizzati i grafici dei centroidi dei clusters (si veda l’immagine a fianco). Ogni centroide può essere interpretato come una “tipologia” di curva d’offerta, in quanto sintetizza un insieme di curve in una curva “tipica”. Dall’esame dei centroidi è quindi possibile individuare le diverse strategie messe in atto dagli operatori nel periodo e nella zona considerati. Per quanto riguarda l’analisi delle curve d’offerta a livello di operatore, la soluzione a 41 clusters ottenuta con il metodo dell’Average Linkage mette in evidenza le curve “anomale”, mentre quella più sintetica (23 clusters) ottenuta con il metodo di Ward mostra le curve “tipiche”. Questo studio ha consentito l’individuazione di alcune strategie d’offerta (retta a prezzo zero, retta inclinata, curva ad S, curva “piatta”), della loro rilevanza numerica (in termini di n. di curve) ed economica (in termini di quantità di energia presentata e accettata). Per l’interpretazione dei risultati sono state generate le tabelle di incrocio dei cluster (tipologie) con tutte le variabili della meta-informazione. Ciò consente di determinare le caratteristiche di ciascuna tipologia/strategia d’offerta individuata in termini di operatore, fascia oraria, tecnologia d’impianto, … Sono così stati individuati operatori che offrono energia a prezzo zero, lasciando che sia il mercato a determinare il prezzo di vendita, operatori che generano curve d’offerta inclinate più o meno uguali per ogni sessione / fascia oraria, operatori che offrono grandi quantità di energia ad un unico livello di prezzo (curva “piatta”) variabile da sessione a sessione (possibile indice di esercizio di potere di mercato), operatori che generano curve ad “S” con diversa distribuzione delle quantità in due macro livelli di prezzo. In quest’ultimo caso è notizie dal CINECA diversa la posizione dello scalino da sessione a sessione (fascia oraria e giorno). Questa analisi permette inoltre di individuare alcune curve anomale, che non rientrano nelle precedenti categorie, e di monitorare nel tempo i cambiamenti di strategia da parte degli operatori (attraverso la classificazione automatica delle nuove curve d’offerta e il confronto con le originali tipologie di appartenenza). Conclusioni Dalle diverse applicazioni finora effettuate si possono trarre alcune conclusioni sulla bontà della tecniche di data mining applicate alle curve di offerta degli operatori. In particolare, la metodologia: • consente di sintetizzare e di rappresentare graficamente le strategie di bidding degli operatori, anche con riferimento ad estesi periodi temporali, individuandone i profili ”tipici” di offerta rispetto ad una molteplicità di variabili (es: quantità offerta e accettata, tipo di tecnologia, presenza degli operatori, prezzo unico nazionale, caratteristiche temporali); ciò è particolarmente interessante se si considerano gli enormi volumi di dati elementari relativi alle transazioni sui mercati borsistici; • permette di identificare i raggruppamenti più strategici di offerte per impianto ai fini della fissazione del prezzo di borsa e di costruire indicatori che misurano la concentrazione delle offerte dei diversi operatori in tali raggruppamenti, fornendo informazioni aggiuntive rispetto a quelle espresse da altri indicatori; ad esempio, mentre l’Indice di Operatore Marginale pubblicato dal GME misura in un certo periodo di tempo la quota dei volumi su cui l’operatore ha fissato il prezzo, questi ulteriori indici potrebbero misurare l’intensità della condizione di marginalità (non solo l’informazione dicotomica di marginalità o non marginalità) con riferimento a qualsivoglia intervallo temporale; • fornisce informazioni utili a valutare le interazioni strategiche tra gli operatori; • consente di evidenziare i cambiamenti nelle strategie di offerta dei diversi operatori e di individuare eventuali anomalie nel comportamento degli operatori stessi rispetto ad un comportamento individuato come “tipico” o precedente; • è estremamente versatile potendo essere utilizzata sia per arricchire l’analisi di situazioni identificate come “critiche” sia per costruire procedure e indicatori che consentano di segnalare tempestivamente la “criticità” di alcune situazioni. Occorre evidenziare tuttavia che uno sviluppo in tal senso richiederebbe un ulteriore approfondimento per passare dalla fase di ricerca alla fase di messa a punto di strumenti operativi. In prospettiva sarebbe interessante provare a definire cluster differenziati in relazione a variabili che consentano di raggruppare le ore, come le fasce orarie. Infatti, sia nella formazione dei cluster per operatore sia nella formazione dei cluster per impianto, le fasce orarie si sono rivelate un’importante variabile discriminatoria. La metodologia potrebbe essere estesa all’analisi del mercato per il servizio di dispacciamento. Per ulteriori informazioni: [email protected] doi:10.1388/notizie-62-07 La metodologia permette di identificare i raggruppamenti più strategici di offerte per impianto ai fini della fissazione del prezzo di borsa e di costruire indicatori che misurano la concentrazione delle offerte dei diversi operatori in tali raggruppamenti, fornendo informazioni aggiuntive rispetto a quelle espresse da altri indicatori Bibliografia [1] Haol, Z. Jianhua, C. Zhenxiang, H Dongming, W. Weizhen, S. A Cluster Analysis of Power Producer’s Bidding Using Average Electricity Price Difference-Integration Model, EEE International Conference on Electricity Utility Deregulation, Restructuring and Power Technologies (DRPT2004), Hong Kong, April 2004. 29