Relazione sull`attivit`ae le ricerche svolte Dott

Transcript

Relazione sull`attivit`ae le ricerche svolte Dott
Dottorato di Ricerca in Informatica, II Ciclo Nuova Serie,
Università degli Studi di Salerno
Relazione
sull’attività e le ricerche svolte
Dott. Antonino Staiano
Anno 2000/2003
Corsi
Il sottoscritto ha frequentato i seguenti corsi:
• Corso : IDA Spring School 2001 (European School on Intelligent Data Analysis)
Durata : 60 ore
Periodo : 26 - 30 Marzo 2001
Luogo : Facoltà di Ingegneria, Palermo
Modalità esame : Prova orale
Superamento esame : Superato
• Corso : Teoria della Programmazione Concorrente e Distribuita
Docente : Prof. R. Gorrieri
Durata : 20 ore
Periodo : 18 - 26 Giugno 2001
Luogo : Facoltà di Scienze MM.FF.NN., Baronissi (SA)
Modalità esame : Non prevista
• Corso : 5th Course of the International School on Neural Nets “E. R. Caianiello”: From
Synapes to Rules: Discovering Symbolic Rules from Neural Processed Data
Durata : 60 ore
Periodo : 25 Febbraio - 7 Marzo 2002
Luogo : presso Ettore Majorana Foundation and Centre for Scientific Culture, Erice (TP)
Modalità esame : Prova orale
Superamento esame : Superato
• Corso : 7th Course of the International School on Neural Nets “E. R. Caianiello”: Ensemble Methods for Learning Machines
Durata : 20 ore
Periodo : 22 - 28 Settembre 2002
Luogo : I.I.A.S.S. Vietri sul Mare (Sa)
1
Modalità esame : Prova di Laboratorio
Superamento esame : Superato
• Corso : Support Vector and Kernel Machines
Docente : Prof. N. Cristianini
Durata : 20
Periodo : 23 - 27 Giugno 2003
Luogo : Università di Salerno
Modalità esame : Non previsto
Seminari
Il sottoscritto ha partecipato ai seguenti seminari:
• Neural Networks for Data Modelling
7 Febbraio 2001, Università di Napoli “Federico II”, dott. A. Eleuteri, Università di Napoli
“Federico II”
• From Quantum Structures to MV-Algebras
25 Gennaio 2001, Università degli Studi di Salerno, Prof. A. Dvurecenskij, Università di
Bratislava
• Proactive Password Checking
26 Settembre 2001, Università degli Studi di Salerno, dott. P. D’Arco, Università degli
Studi di Salerno
• Animazione di Algoritmi sulla Rete
3 Ottobre 2001, Università degli Studi di Salerno, dott. U. Ferraro Petrillo, Università
degli Studi di Salerno
• Timed Games
10 Ottobre 2001, Università degli Studi di Salerno, dott. M. Faella, Università degli Studi
di Salerno
• User Privacy Issues Regarding Certificates and the TLS Protocol
24 Ottobre 2001, Università degli Studi di Salerno, dott. I. Visconti, Università degli Studi
di Salerno
• Fractional Path Coloring in Bounded Degree Trees
31 Ottobre 2001, Università degli Studi di Salerno, dott. H. Rivano, Univerità Sophia
Antipolis (Francia)
• Secure Metering on the Web
7 Novembre 2001, Università degli Studi di Salerno, dott.ssa B. Masucci, Università degli
Studi di Salerno
2
• Smart Card
14 Novembre 2001, Università degli Studi di Salerno, dott. L. Catuogno, Università degli
Studi di Salerno
• Logica Fuzzy e Soft Computing: un percorso emblematico, 7 Novembre 2001, Università di
Salerno Prof. Antonio Di Nola, Università di Salerno
• Generation of Key Predistribution Schemes
Using Secret Sharing Schemes
28 Novembre 2001, Università degli Studi di Salerno, dott. G. Saez, Università della
Catalogna (Spagna)
• Metodi di Visualizzazione
9 Gennaio 2002, Università degli Studi di Salerno, dott. R. Marmo, Università degli Studi
di Pavia
• Computer Graphics: Parallelizzazione dell’Algoritmo di Ray Tracing
16 Gennaio 2002, Università degli Studi di Salerno, dott. U. Erra, Università degli Studi
di Salerno
• Alcune riflessioni sul controllo fuzzy
16 Gennaio 2002, Università di Salerno, Prof. Vittorio Cafagna, Università di Salerno
• Evolvable Hardware and Soft Computing
4 Giugno, 2002, Università degli Studi di Salerno, Dr. Adrian Stoica, Jet Propulsion
Laboratory, California Institute of Technology, USA.
• Fuzzy Neural Networks and Data Mining
12 Luglio 2002, Università degli Studi di Salerno, Prof. W. Pedrycz, Università dell’Alberta
(CA)
• An Enhancement of Mamdani-Assilian Controller
17 Settembre, 2002, Università di Salerno, Prof. M. Navara, Czech Technical University.
• Un invito alla probabilità MV- Algebrica
21 Gennaio 2003, Università degli Studi di Salerno, Prof. D. Mundici, Università degli
Studi di Firenze
• Verso una personalizzazione dei modelli utente per un commercio elettronico mirato
28 Gennaio 2003, Università degli Studi di Salerno, Dr. Chiara Morici, Università di
Perugia
• Soft Computing Methodologies for Data Analysis
6 Febbraio 2003, Università degli Studi di Salerno, Dott. A. Ciaramella, Università degli
Studi di Salerno
• Non Commutative Algebras of Logic
27 Maggio 2003, Università degli Studi di Salerno, Prof. P. Flondor, University of Bucarest
3
• Soft Computing as a synergy of continuous and discrete mathematics:ideas and prospectives
17 Giugno 2003, Università degli Studi di Salerno, Prof. Prof. Vladik Krenovich, University of Texas
• Triangular Norms as Fuzzy Conjunctions: which are better?
8 Ottobre 2003, Università degli Studi di Salerno, Prof. M. Navara, Czech Technical
University.
Seminari presentati
• A Brief Survey on Clustering with Objective Function Models for Pattern Recognition
21 Maggio, 2001, Università degli Studi di Salerno
• Neural Networks and Fuzzy Logic in Astronomical Data Mining
5 Dicembre 2001, Università degli Studi di Salerno
• Neural Networks Data Mining Tools for Astronomical Data
15 Gennaio 2002, Università degli Studi di Salerno, corso di “Reti Neurali”, Prof. Roberto
Tagliaferri
• Data Mining and Neural Networks
29 Maggio 2003, Università degli Studi di Salerno,
Convegni
Il sottoscritto ha partecipato ai seguenti convegni:
• VST Day
Osservatorio Astronomico di Capodimonte, 30 - 31 Gennaio, 2001
• Conference on the Role of Natural Languages
in Information Processing and Power System Control
Università degli Studi di Salerno, 3 Aprile, 2001
• WIRN Vietri‘01 XI Italian Workshop on Neural Nets
IIASS “Eduardo R. Caianiello, Vietri sul Mare (SA), 17 - 19 Maggio, 2001
• International Conference IFSA / NAFIPS 2001
Vancouver, Canada 25 - 28 Luglio, 2001
• European Meeting on Independent Component Analysis
IIASS “Eduardo R. Caianiello, Vietri sul Mare (SA), 21 - 23 Febbraio, 2002
• Toward an International Virtual Observatory
ESO/ESA/NASA/NSF Astronomy Conference, Garching, Germania, Giugno 10 - 14,2002
4
• WIRN Vietri ‘02 XII Italian Workshop on Neural Nets
IIASS “Eduardo R. Caianiello, Vietri sul Mare (SA), 30 Maggio - 1 Giugno 2002
• WIRN Vietri ‘03 XII Italian Workshop on Neural Nets
IIASS “Eduardo R. Caianiello, Vietri sul Mare (SA), 5-7 Giugno 2003
• WILF 2003 International Workshop on Fuzzy Logic
Palazzo Serra di Cassano, Napoli , 9-11 Ottobre 2003
Attività di referee
Il sottoscritto ha fatto da referee per diversi articoli presentati ai convegni IJCNN 2000, IJCNN
2002, WIRN‘01, WIRN‘02 e WIRN‘03, SEKE‘03, per la riviste Neural Networks, IEEE Transaction on System, Man and Cybernetics. Part B: Cybernetics, International Journal of Soft
Computing.
Attività di supporto didattico
Antonino Staiano ha avuto attività di collaborazione didattica con i Proff. R. Tagliaferri,
M.I. Sessa e R. Cerulli dell’Università degli Studi di Salerno, per i corsi di Architettura degli
Elaboratori, Programmazione I, Reti Neurali e Ricerca Operativa.
Collaborazioni Scientifiche
Antonino Staiano ha avuto le seguenti collaborazioni scientifiche:
• Prof. Roberto Tagliaferri, Dipartimento di Matematica ed Informatica, Università di
Salerno
• Prof. Giancarlo Raiconi, Dipartimento di Matematica ed Informatica, Università di Salerno
• Prof. Vincenzo Loia, Dipartimento di Matematica ed Informatica, Università di Salerno
• Prof. Bruno D’Argenio, Istituto Geomare Sud, CNR, Napoli
• Prof. Giuseppe Longo, Dipartimento di Scienze Fisiche, Università di Napoli “Federico II
• Prof. A. Di Nola, Dipartimento di Matematica ed Informatica, Università di Salerno
• Prof. S. Sessa, Dipartimento di Costruzioni e Metodi Matematici in Architettura, Università di Napoli
• Prof. W. Pedrycz, Dept. of Electrical and Computer Engineering, University of Edmonton,
Canada
• Prof. Piero Benvenuti, Istituto Nazionale di Astrofisica e Agenzia Spaziale Europea
• Dr. Alberto Micol, European Southern Observatory
5
Collaborazioni scientifiche presso enti-università estere
Il dott. A. Staiano è stato ospite presso i seguenti enti:
• Department of Electrical and Computer Engineering, University of Edmonton, Canada,
dal 10 Luglio al 10 Settembre 2001, per svolgere una collaborazione scientifica con il Prof.
W. Pedrycz.
• Space Telescope European Coordinating Facility, European Southern Observatory, Garching, Germania, dal 6 Ottobre al 20 Dicembre 2002, pre svolgere una collaborazione scientifica con il Prof. Piero Benvenuti.
Attività di ricerca
Gli argomenti approfonditi nell’attività di ricerca dal sottoscritto sono:
• Applicazione di Reti Neurali Non Supervisionate per Data Mining Astronomico
Negli ultimi anni c’è stato un crescente interesse nei confronti delle applicazioni astronomiche delle reti neurali anche se, nonostante la grande varietà di problemi affrontati,
molti applicazioni fanno ancora uso di un ristretto insieme di modelli neurali. Tale situazione è avviata a modificarsi data l’impressionante crescita sia della qualità che della
quantità di dati che sta diventando disponibile alla comunità astronomica. Si prevede
che in meno di cinque anni, molto più di 10TB di dati saranno acquisiti nel mondo ogni
notte e, molti di questi dati saranno disponibili agli astronomi via rete. Questi enormi ed
eterogenei data set apriranno possibilità fino ad oggi impensabili, sebbene sia chiaro che il
loro sfruttamento scientifico richiederà l’implementazione di strumenti automatici capaci
di effettuare una larga parte dei lavori di routine di data reduction, data mining a data
analysis [11]. In questo affascinante contesto la ricerca è stata focalizzata per lo studio di
due differenti tipologie di problemi: (1) studio e visualizzazione di cataloghi astronomici
multiparametrici contenenti informazioni fotometriche e morfologiche di un elevato numero
(tra i 20000 e i 70000) di oggetti astronomici (stelle e galassie); (2) studio e visualizzazione
di dati di telemetria dei telescopi, mirati alla classificazione delle immagini acquisite sulla
base della qualità .
– (1) Cataloghi GOODS. Il Great Observatories Origins Deep Survey (GOODS) è una
survey pubblica, multi lunghezza d’onda che coprirà due campi di 150 arcmin2 . Il
gruppo di ricerca GOODS ha sede presso lo European Southern Observatory, Garching (Germania), il quale ha fornito due cataloghi preliminari. Il primo catalogo contiene oggetti rilevati nelle bande di colore U, B, V, R, I, mentre il secondo è relativo
alle bande di colore U, B, V, R, I, J e K. Qui lo scopo della ricerca è di utilizzare
metodologie basate su reti neurali non supervisionate per lo studio delle relazioni tra
oggetti situati in locazione astronomiche differenti e per l’identificazione di eventuali
oggetti rari o outliers [26],[24],[25].
6
– (2) Telemetria Telescopio Nazionale Galileo (TNG) L’obiettivo dello studio dei dati di
telemetria è di costruire un sistema automatico non supervisionato basato su modelli
neurali che consenta di analizzare i dati dei sensori del telescopio per identificare le
sessioni osservative che portano all’acquisizione di immagini di cattiva qualità, allo
scopo di interrompere il tracking di un oggetto.
Tra le metodologie non supervisionate adottate, possiamo citare:
le Self Organizing Map [6], le quali costituiscono un’architettura di rete neurale per l’apprendimento non supervisionato. I neuroni che formano una rete SOM sono disposti su
di una griglia bi-dimensionale ed ognuno di essi ha un peso associato della dimensione dei
dati di input e denominato reference vector. I neuroni competono tra loro: quando un
dato di input x è presentato alla rete, il neurone ad esso più vicino (in senso topologico)
è attivato secondo un’opportuna metrica (generalmente euclidea). In questo modo il peso
associato al neurone vincitore (denominato anche Best Matching Unit) viene aggiornato in
modo da essere più simile al vettore di input per il quale ha vinto la competizione. Inoltre,
anche i pesi dei neuroni vicini (in senso topologico) al neurone vincitore sono aggiornati.
In questo modo, alla fine della fase di apprendimento la griglia di neuroni si auto-organizza
in aree, ognuna delle quali corrisponde a gruppi di dati di input simili. Questa caratteristica viene sfruttata sia per scopi di clustering che per data visualization [12]. Da quando
sono state proposte [7], esse hanno avuto un considerevole successo in un’ampia gamma di
applicazioni e sono state oggetto di numerosi lavori di ricerca. Tuttavia, esse mancano di
basi teoriche ben fondate e sono generalmente motivate da argomenti euristici. Le SOM
consentono solo un’approssimazione della funzione densità di probabilità dei dati di input.
Inoltre le proprietà di convergenza non sono state provate. Queste sono le motivazioni
alla base dello sviluppo dello Generative Topographic Mapping [5], un modello generativo
(ovvero che costruisce a funzione densità di probabilità nello spazio dei dati) a variabili
latenti (tale modello di densità di probabilità è espresso in termini di un insieme di variabili di dimensione inferiore rispetto alla dimensione originale dello spazio dei dati). La
corrispondenza tra lo spazio latente e lo spazio dei dati è realizzato mediante la costruzione
di un opportuno mapping non lineare (generalmente mediante una rete neurale con funzioni radiali di base). Poichè lo spazio latente ha dimensione 2 o 3 è possibile visualizzare
la distribuzione dei dati di input in termini della distribuzione di probabilità nello spazio
latente.
Il GTM offre diversi vantaggi rispetto alle SOM: 1) modello parametrico superiore 2) numero minore di parametri da impostare 3) la convergenza è garantita. Le PPS [10] sono
una generalizzazione del GTM e rappresentano uno strumento che fornisce prestazioni efficienti anche quando la dimensione dello spazio dei dati è molto grande. Le PPS sferiche
in particolare, sono in grado di modellare i dati di input di dimensione molto elevata, in
quanto catturano il comportamento dei dati che si localizzano nelle aree di confine dello
spazio multi-dimensionale, una situazione questa conseguenza della curse of dimensionality(maledizione delle alte dimensioni) che si manifesta in spazi di dimensione elevata. La
ricerca è stata incentrata nello studio delle prestazioni dei modelli fin ora descritti con dati
complessi come quelli di natura astronomica, precedentemente menzionati. Un ulteriore
studio riguarda l’utilizzo di Gerarchie di GTM [13], ovvero un’architettura ad albero in
7
cui ogni nodo consiste di un singolo modello GTM. La motivazione alla base di queste
strutture è che la visualizzazione dei dati a due dimensioni può non essere adeguata a
comprendere aspetti interessanti di dati scientifici complessi. Una gerarchia di GTM invece consente di focalizzarsi in zone dello spazio di input particolarmente complesse (zone
con molto overlap) visualizzate nei livelli più alti della struttura ad albero, scomponendole
in varie sotto zone (il che corrisponde a scendere nei livelli dell’albero). Attualmente si
sta valutando la possibilità di generalizzare queste strutture costruendo delle gerarchie di
PPS, studio, quest’ultimo non ancora intrapreso in letteratura.
• Ensemble of Learning Machines
L’utilità dei metodi descritti per la tipologia dei problemi e dei dati in esame, ha suggerito
la possibilità di progettare un modello neurale, costituito dalla combinazione di più modelli
neurali diversi, allo scopo di migliorarne la capacità di generalizzazione.
L’idea nasce da una settore di ricerca che si è andato affermando nel corso degli anni novanta, ovvero, gli ensemble of learning machines.
E’ pratica comune, nelle applicazioni delle reti neurali, effettuare il training di diverse reti
neurali candidate per poi selezionare la migliore, sulla base delle prestazioni su un insieme
indipendente di dati di validazione, ed eliminarne le rimanenti.
Un tale approccio soffre di due svantaggi. Primo, tutto lo sforzo comportato nel training
delle rimanenti reti è sprecato. Secondo, le prestazioni di generalizzazione sull’insieme di
validazione ha una componente casuale dovuta al rumore presente nei dati, per cui la rete
che ha avuto le migliori prestazioni sull’insieme di validazione potrebbe non essere quella
dalle migliori prestazioni su un nuovo insieme di test [4].
Questi svantaggi possono essere superati combinando insieme tali reti per costituire un
ensemble [9],[8]. L’importanza di un tale approccio risiede nel fatto che esso può portare
a notevoli miglioramenti nella predizione di nuovi dati, comportando un piccolo sforzo
computazionale aggiuntivo. Infatti le prestazioni di un ensemble può essere migliore delle
prestazioni del miglior modello impiegato singolarmente.
Questo comportamento è giustificato mediante l’analisi teorica della decomposizione dell’errore di generalizzazione, nota come decomposizione bias-variance [4]. Questi studi sono
stati oggetto di ricerca in numerosi lavori, dove i risultati ottenuti sono ormai consolidati,
tuttavia tali analisi sono per lo più relative a metodi di apprendimento supervisionato.
Le stesse analisi nel campo non supervisionato sono limitate e solo negli ultimi anni hanno
visto la luce lavori in tale ambito. Lo studio è stato pertanto incentrato nello sviluppo di
ensemble di metodi non supervisionati, in particolare ensemble di modelli generativi non
supervisionati per la determinazione della funzione densità di probabilità dei dati di input.
Le tecniche adottate ed adattate per gli scopi specifici sono la stacked density estimation
[20],[21], il bagging [3] e la combinazione dei due, mediante le quali si combinano le funzioni
densità di probabilità che si ottengono con il GTM e le PPS.
I nuovi modelli ottenuti sono stati applicati, per scopi di classificazione, ai dati astronomici descritti nella sezione precedente. In particolare, si calcolano le funzioni di densità di
probabilità per ogni classe, dopodichè , sfruttando il teorema di Bayes, si ottengono le
8
probabilità condizionate a posteriori per ciascuna classe. In questo modo si assegna un
oggetto alla classe che ha probabilità a posteriori maggiore.
• Algoritmi di Clustering
Nell’ambito del Pattern Recognition, gli algoritmi di clustering costituiscono un settore
studiato da decenni. Essi trovano applicazione in svariati campi, come Data Mining, Image Processing, Information Retrieval [23]. Un algoritmo di clustering si pone l’obiettivo
di determinare dei sottogruppi (cluster) in una distribuzione di dati (pattern) di input.
L’insieme di cluster determinato, deve essere tale che dati appartenenti ad uno stesso cluster siano quanto più simili possibile e dati appartenenti a cluster differenti siano quanto
più dissimili. La misura di similarità è fornita generalmente dalla metrica euclidea, anche
se è possibile adottare metriche differenti. A seconda se i cluster possono condividere o
meno uno o più pattern si parla, rispettivamente, di fuzzy clustering e hard clustering.
Gli algoritmi di clustering sono utilizzati inoltre per il training delle reti neurali con funzioni
radiali di base (RBFNN) [4]. Queste reti rappresentano un’alternativa alle più comunemente usate reti neurali Multilayer Perceptron (MLP) basate su algoritmo di apprendimento backpropagation. Una RBFNN è una rete neurale a due livelli: un livello hidden,
costituito da un numero fissato di funzioni radiali di base, e da un livello output connesso
allo strato hidden da una matrice di pesi. La caratteristica fondamentale delle RBFNN
è l’algoritmo di apprendimento, il quale costituito da due fasi: in una prima fase, si calcolano i centri delle funzioni radiali di base; nella seconda si ottimizzano i pesi hidden to
output mediante la risoluzione di sistemi di equazioni lineari.
Gli algoritmi di clustering sono inerentemente non supervisionati, in tale contesto, tuttavia, è auspicabile utilizzare anche le informazioni relative allo spazio di output durante il
processo di clustering, per meglio guidare la computazione dei centri delle funzioni radiali
di base. Numerosi lavori sono stati pubblicati in questo ambito [17], [16], [15], ed i relativi
algoritmi di clustering descritti sono denominati input-output clustering.
In questo contesto la ricerca è stata indirizzata nello studio e nello sviluppo di due algoritmi di clustering di tipo input-output e denominati supervisionati. Un primo [26], estende
il funzionale del classico algoritmo fuzzy c-means [22] aggiungendo la variabile di output associata ad ogni pattern di input ed introducendo un meccanismo di ottimizzazione
della funzione obiettivo basato su algoritmi genetici [14]. Il secondo algoritmo[1], [2], si
basa anch’esso sul fuzzy c-means tuttavia, qui l’idea è leggermente differente: si costruisce
sullo spazio di output un modello di regressione lineare [19]. Tale modello è costruito
mediante la combinazione lineare di un numero fissato di modelli di regressione lineare
locali. La funzione obiettivo dell’algoritmo di clustering proposto contiene, pertanto, un
termine aggiuntivo che rappresenta la differenza tra la variabile di output e la variabile
di output predetta dal modello di regressione lineare. In questo modo la determinazione
dei cluster avviene sulla base sia dei dati nello spazio di input che dei dati nello spazio
di output. I risultati ottenuti, utilizzando l’algoritmo descritto, congiuntamente ad una
RBFNN, mostrano l’efficacia del modello proposto, e si dimostrano superiori rispetto ad
altri algoritmi di clustering di tipo input-output.
9
Bibliografia
Di seguito sono elencati alcuni dei lavori più significativi pubblicati o sottomessi:
• Advanced Data Mining Tools for Exploring Large Astronomical Data Bases
G. Longo, R. Tagliaferri, S. Sessa, P. Ortiz, M. Capaccioli, A. Ciaramella, C. Donalek, G.
Raiconi, A. Staiano, A. Volpicelli
Proceedings of SPIE’s 46th Annual Meeting International Symposium on Optical Science
and Technology, 2001, San Diego, CA, USA, vol. 4477, pp. 107-113
In questo articolo sono presentati alcuni metodi di Soft Computing per la classificazione e
la visualizzazione delle caratteristiche di grandi data set.
I metodi usati per l’analisi sono basati sulle Self Organizing Maps (SOM), Generative Topographic Mapping (GTM) e Fuzzy Similarities (FS).
Il metodo SOM viene utilizzato per la clusterizzazione in spazi multi-parametrici, il metodo
GTM per il data mining e la visualizzazione, e il metodo basato sulle FS per Star/Galaxies
classification.
Questa analisi preliminare deriva dalla necessità di elaborare grandi quantità di dati
derivanti dal “VLT Survey Telescope” o VST. Il VST è un telescopio di 2.6m costruito dall’Osservatorio Astronomico di Capodimonte di Napoli in collaborazione con l’ESO
(European Southern Observatory), che sarà installato a metà del 2004 al Cerro Paranal in
Cile.
• Fuzzy Similarities in Stars/Galaxies Classification
S. Sessa , R. Tagliaferri, G. Longo, A. Ciaramella, A. Staiano
Proceedings of the IEEE-SMC02 Conference, 2002, Hammamet, Tunisia.
In questo articolo viene proposta una tecnica basata sulle “Fuzzy Similarity” e sulle “ordinal sums” per la classificazione di Stelle e Galassie (S/G) nell’ambito del data mining
astronomico. Per il calcolo dei prototipi S/G necessari per la classificazione viene usato il
metodo del fuzzy c-Means. Come evidenziato dai risultati sperimentali di classificazione
ottenuti, il modello presenta buone performance di classificazione.
• Supervised Fuzzy Clustering Algorithm for Training Radial Basis Function
Neural Networks for Regression Problems
A. Staiano, R. Tagliaferri e W. Pedrycz
sottomesso a IEEE Transaction on Neural Networks.
In quest articolo introduciamo una nuova tecnica di clustering nell’ambito dell’apprendimento di reti neurali con funzioni radiali di base.
Gli algoritmi di clustering sono spesso usati per determinare i centri delle funzioni di base
delle RBFNN. L’algoritmo proposto opera il processo di clustering sulla base dei dati distribuiti nello spazio di input e sfruttando anche le informazioni associate allo spazio di
output, ivi costruendo un modello di regressione lineare.
Le prestazioni delle RBFNN addestrate con il nostro algoritmo mostrano risultati superiori
rispetto ale stesse reti addestrate con altri algoritmi di clustering input-output proposti in
letteratura.
10
• Neural Networks in Astronomy
R. Tagliaferri R., G. Longo, A. Staiano A. et al.
Neural Networks Special Issue on Neural Network Analysis of Complex Scientific Data:
Astronomy and Geosciences, Vol. 16, N. 3-4, Aprile-Maggio 2003
In questa review rivisitiamo, con una panoramica completa, le applicazioni di reti neurali,
e più in generale di tecniche di soft computing, a problemi astronomici. Dopo una rivisitazione del background metodologico, ci si focalizza su alcuni dei campi di applicazione più
interessanti: estrazione e classificazione di oggetti, analisi di serie temporali, identificazione
del rumore e data mining.
• A Supervised Fuzzy Clustering for Radial Basis Function Neural Networks
Training
A. Staiano, R. Tagliaferri, D. Scala
Proceedings Ifsa-Nafips World Conference, Vancouver, July 2001.
In questo articolo si propone una prima versione di un algoritmo di clustering input-output
basato su algoritmi genetici per la fase di apprendimento delle reti neurali con funzioni
radiali di base, successivamente rivista e modificata in [1].
L’idea consiste nell’estendere il funzionale dell’algoritmo di fuzzy clustering c-means aggiungendo la variabile di output. La componente genetica è stata introdotta per alleviare
sia la tendenza del fuzzy c-means a cadere nei minimi locali nella fase di ottimizzazione
del suo funzionale e sia la dipendenza dall’inizializzazione dei parametri.
• Applications of Neural Networks in Astronomy and Astro- particle Physics
R. Tagliaferri, G. Longo, A. Staiano et al.
invited review su Recent Research Developments in Astronomy and Astrophysics by Research Signpost, sottomesso.
Questa review estende la review precedente presentata su Neural Networks, presentando
gli ultimi risultati ottenuti sia in astronomia con particolare riferimento agli esperimenti
effettuati sui cataloghi GOODS con le Self Organizing Maps, che nella fisica delle astro
particelle.
• An Evolutionary Approach to Spatial Fuzzy Clustering
A. Di Nola, V. Loia, A. Staiano
Fuzzy Optimization and Decision Making Vol. 1, 195-219, 2002
In questo articolo è proposta una metodologia di clustering fuzzy di tipo genetico.
L’algoritmo è di tipo non supervisionato ed basato sul classico fuzzy c-means opportunamente modificato allo scopo di cercate la migliore partizione fuzzy dello spazio dei dati
assumendo che la valutazione di ogni oggetto rispetto ad alcune features sia sconosciuta,
ma sapendo piuttosto, che l’oggetto stesso appartiene ad una regione circolare dello spazio
di input.
Viene, inoltre, presentata un’implementazione Java dell’algoritmo, che fornisce un ambiente grafico completo ed efficiente per l’impostazione dei parametri dell’algoritmo e per
studiarne le sue prestazioni.
11
• Self Organizing Maps for Astronomical Data Mining
A. Staiano
Technical Report European Southern Observatory, Space Telescope European Coordinating Facility, Garching Bei Muenchen, Germania, Dicembre 2002.
In questo technical report, presentato allo European Southern Observatory (Garching,
Germania), sono state studiate le potenzialità delle Self Organizing Maps (SOM) quando applicate a dati reali molto complessi, quali quelli astronomici. Le SOM sono state
applicate a due differenti cataloghi GOODS, rispettivamente nelle bande di colore U, B,
V, R, I ed U, B, V, R, I, J, K. I risultati mostrano l’utilità delle SOM come strumento
di visualizzazione di dati multidimensionali che deve essere integrato in un tool per Data
Mining a più ampio respiro.
Baronissi, 31 Ottobre 2003
Antonino Staiano
12
Riferimenti bibliografici
[1] A. Staiano, R. Tagliaferri, W. Pedrycz, Supervised Fuzzy Clustering for Training RBF
Neural Networks for Regression Problems, sottomesso a IEEE on Neural Networks
[2] A. Staiano, R. Tagliaferri, W. Pedrycz, Linear Regression Model-Guided Clustering for
Training RBF Networks for Regression Problems, Proceeding WILF 2003, October 2003
[3] L. Breiman, Bagging Predictors, University of California, Dept. of Statistics, TR 421, 1994.
[4] C. M. Bishop, Neural Networks for Pattern Recognition, Oxford University Press, 1995.
[5] C. M. Bishop, M. Svensen, C.K.I. Williams, GTM: The Generative Topographic Mapping,
Neural Computation, 10(1), 1998.
[6] T. Kohonen, Self-Organizing Maps, Springer-Verlag, Berlin, 1995.
[7] T. Kohonen, Self-Organized Formation of Topologically Correct feature Maps, Biological
Cybernetics, 1982.
[8] M.P. Perrone, General averaging results for convex optimization, Proceedings 1993
Connectionist Models Summer School, 1994.
[9] M.P. Perrone, L.N. Cooper, When networks disagree: ensemble methods for hybrid neural
networks, Artificial Neural networks for Speech and Vision, London: Chapman and Hall,
1993
[10] K. Chang, J. Ghosh, A unified Model for Probabilistic Principal Surfaces, IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 23, NO. 1, 2001
[11] R. Tagliaferri, G. Longo, A. Staiano et al., Neural Networks in Astronomy, Neural Networks,
Special Issue on Applications of Neural Networks to Astrophysics and Geosciences, R.
Tagliaferri, G. Longo, D’Argenio B. eds., 2003
[12] Vesanto J., 1997, Ph.D. Thesis, Helsinky University of Technology
[13] P. Tino, I. Nabney, Constructing localized non-linear projection manifolds i a principled
way: hierarchical GTM. Technical Report, 2000.
[14] D.E, Goldberg, Genetic Algorithms in Search, Optimization and Machine Learning,
Addison-Wesley, Reading, MA, 1989.
[15] Gonzales, J., Rojas, I., Pomares, H., Ortega,J., Prieto, A., A New Clustering Technique for
Function Approximation, IEEE Transaction On Neural Networks, 13, NO. 1, 2002.
[16] W. Pedrycz, Conditional Fuzzy Clustering in the Design of Radial Basis Function Neural
Networks, IEEE Transaction on Neural Networks, vol. 9, NO. 4, pp. 601-612, 1998.
[17] W. Pedrycz, Conditional Fuzzy C-Means, Pattern Recognition Letters, vol. 17, pp. 625-632,
1996.
13
[18] R. Tagliaferri, A. Staiano, D. Scala, A Supervised Fuzzy Clustering for Radial Basis
Function Neural Networks Training, Joint 9th IFSA World Conference and 20th Nafips
International Conference Vanco8uver (Canada), vol. 3, pp. 1804-1809, 2001.
[19] T. Hastie, R. Tibshirami, J. Friedman, The Elements of Statistical Learning: Data Mining,
Inference and Prediction, Springer-Verlag, 2001.
[20] D.H. Wolpert, Stacked Generalization, Neural Networks, 5, 1992.
[21] D.H. Wolpert, P. Smyth, Stacked Density Estimation, Advances in Neural Processing
Systems, 1997.
[22] J.C. Bezdek, Pattern Recognition with Fuzzy Objective Function Algorithms, Plenum Press
New York, U.S.A., 1981.
[23] J.C. Bezdek, J. Keller, R. Krisnapuram, N.R. Pal, Fuzzy Models and Algorithms for Pattern
Recognition and Image Processing, Kluwer Academic Publisher, 1999.
[24] G. Longo, R. Tagliaferri, A. Staiano et al., Data Mining of large astronomical databases
with neural tools, Proc. SPIE 2002 Waikoloa Hawai, vol. 4847-49, pp. 265-276, 2002
[25] G. Longo, R. Tagliaferri, A. Staiano et al., Artificial Intelligence tools for data mining in large astronomical databases, ESO/ESA/NASA Conference, Steps Towards an
International Virtual Observatory, Garching, June 2002
[26] G. Longo, R. Tagliaferri, A. Staiano et al., Advanced data mining tools for exploring large
astronomical databases, Proc. SPIE 2001 San Diego USA, vol. 4477, pp. 61-75, 2001
14